Вопросы и ответы

Как установить код Google DeepMind?

Исходники Google DeepMind, описание установки и пример запуска лежат здесь

https://github.com/soumith/deepmind-atari

Кроме того, на Amazon есть AMI (ami-b36981d8) со всем необходимым установленным ПО, который можно запустить на инстансах g2.

 

Где брать образы игр (ROM-файлы)?

Образы игр можно брать с сайта AtariAge. Названия игр должны соответствовать списку (если название файла не совпадает, то его надо переименовать). Образ игры Breakout на github.

 

Есть официальная ссылка на код. Почему нельзя ставить оттуда?

Можно. Но при запуске расчетов на GPU необходимо модифицировать код в convnet.lua, поскольку он устарел. А именно заменить

net:add(nn.Transpose({1,2},{2,3},{3,4}))
 convLayer = nn.SpatialConvolutionCUDA

на

convLayer = nn.SpatialConvolution

 

Где можно найти туториал по алгоритму, который использовали Google DeepMind?

Туториал находится здесь.

 

Где можно почитать про фреймфорк по глубокому обучению Torch, используемый DeepMind?

Официальный сайт фреймфорка Torch. Вот один из нескольких хороших туториалов к нему.

А еще на Хабре есть статья с разбором примера распознования цифр из MNIST на базе всех известных фреймворков.

 

Что такое Arcade Learning Environment (ALE)?

Цитата: “Игровая среда обучения (ALE) является простым объектно-ориентированным фреймворком, позволяющим не только ученым, но всем интересующимся разрабытывать собственных ИИ агентов для игр Atari 2600.

 

Как установить ALE?

Скачать последнюю версию отсюда и выполнить следующие команды

> sudo apt-get install cmake

> sudo apt-get install libsdl1.2-dev

> cd ale_0_5

ale_0_5> cmake -DUSE_SDL=ON -DUSE_RLGLUE=OFF -DBUILD_EXAMPLES=ON . ale_0_5> make -j 4

Подробней см. мануал.

 

Какова эффективность специализированных агентов в играх Atari?

Про некоторые специфические алгоритмы и их результаты можно почитать, например, в этой статье.

 

Где еще можно посмотреть игры для Atari 2600?

Есть кроссплатформенный эмулятор Stella.

В некоторые игры Atari можно поиграть через браузер: https://archive.org/details/atari_2600_library

 

Какие еще бывают фреймворки для глубинного обучения?

Например, Caffe и Theano. Более подробный список и сравнение производительности есть в уже упомянутой статье.

 

Дадут ли для обучения машины с GPU?

Дадут. Но лучше и на свой ноутбук (участник привозит с собой) тоже установить Deep Q-Network.

 

В каком формате можно будет с ними работать?

Машины будут удаленными, как с ними работать остается на усмотрение участников. Код DeepMind работает на GPU “из коробки”. По умолчанию будем запускать расчеты на GPU. С точки зрения фреймворков программирование матричных вычислений для GPU и CPU отличаются не намного (см. туториал https://github.com/…/Deep%20Learning%20with%20Torch.ipynb).

 

Сколько может быть человек в команде?

Ожидаемый размер команды 3-5 человек. Всего планируется 15 команд, как конкретно будет происходить распределение решают сами участники.

 

 В чем отличия слушателей от основных участников?

Участники могут входить в команды, которым предоставляются GPU ресурсы для расчетов. Команды соревнуются между собой с целью получить лучшие результаты. Победившие команды получают призы.

 

Ожидается что участники сами реализуют подобие алгоритма google (на языке программирования по своему выбору и на фреймворке по своему выбору) или ожидается только подгонка параметров сети / обучения в уже готовом алгоритме?

Подходит любой вариант. Можно модифицировать алгоритм от Deep Mind, можно предложить полностью свое решение. Важно, что для оценки алгоритма будут использованы результаты его запусков на играх в среде ALE.

 

Какова примерно длительность “рабочего” дня хакатона?

Длительность “рабочего” дня не будет ограничена. Помещение в котором будет проходить хакатон доступно 24 часа в сутки.

 

Как отбирались участники хакатона?

Каждая из заявок оценивалась 6-тью экспертами с научной степенью не ниже кандидата наук. Затем исходя из средней оценки заявки предлагалось учавствовать в основном составе (50 человек) или слушателем (70 человек).

 

Пожалуйста, присылайте свои вопросы или замечания к составленному списку на адрес info@deephack.me

Posted in