RL Семинар 7 (20.11.2016)

Дата

20.11.2016

Тема

Policy Gradient Methods

Видео лекции

https://www.youtube.com/watch?v=KHZVXao4qXs

Слайды

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching_files/pg.pdf

Quiz

https://goo.gl/kdvNCD

Вопросы к обсуждению

https://goo.gl/m9Fhwx  (за каждый вопрос начисляется один балл)

Задание

Имплементировать Actor-Critic алгоритм для задачи Mountain Car https://gym.openai.com/envs/MountainCar-v0 .

Дополнительная информация

Сергей Овчаренко сделает презентацию о своих решениях для домашних заданий.