А между тем reinforsment learning достиг новых высот. Уже в Doom рубает (в Altari он начал играть всего пол года назад). Пошёл читать как они это делают. Пока что два главных вопроса:
- Это Realtime?!
- Как они это обучают и чем?! Какова функция пользы??