log_prob intesa per la distribuzione normale in pytorch

voti
1

Attualmente sto cercando di risolvere Pendolo-V0 dall'ambiente palestra openAi, che ha uno spazio azione continua. Di conseguenza, ho bisogno di usare una distribuzione normale per assaggiare le mie azioni. Quello che non capisco è la dimensione del log_prob quando lo si utilizza:

entrare

Mi aspettavo un tensore di dimensione 2 (uno per ogni log_prob azioni), ma è uscita un tensore di dimensioni (2,2).

Tuttavia, quando si utilizza una distribuzione categoriale per ambiente discreto il log_prob ha la dimensione prevista. Perché il log_prob per la distribuzione normale di formato diverso?

È pubblicato 19/03/2020 alle 21:23
fonte dall'utente
In altre lingue...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more