RL Семинар 6 (13.11.2016)

Дата

13.11.2016

Тема

Value Function Approximation

Видео лекции

https://www.youtube.com/watch?v=UoPei5o4fps

Слайды

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching_files/FA.pdf

Quiz

https://goo.gl/QmjNzf

Вопросы к обсуждению

https://goo.gl/xm6qdZ  (за каждый вопрос начисляется один балл)

Задание

Имплементировать алгоритм нейросетевого обучения с подкреплением для задачи Mountain Car https://gym.openai.com/envs/MountainCar-v0 .

Дополнительная информация

Сергей Овчаренко сделает презентацию о своих решениях для домашних заданий.