Pull to refresh
7
0
Виталий Курин @Vitalykurin

User

Send message
Это сделать реально, но нужно будет весь проект делать с самого начала. Да и игры там сложнее, поэтому будет сложнее экспериментировать.
Я привёл IRL для примера того, что RL не всегда предпологает только использование данных среды. В данном случае reward function восстанавливать нам не нужно, да.

Что касается ускорения обучения, то я очень сомневаюсь, что в данном случае исследование поведения людей вам что-то даст.


Ну вот и посмотрим =) С первым и вторым, четвёртым пунктами согласен. Не понял, при чём тут третий.

Да, интерфейс тоже не идеален =)
Reinforcement learning разный бывает. Есть даже Inverse Reinforcement Learning, где имея данные о том, как вёл себя человек, мы должны восстановить reward function.

Что касается нашего случая, то мы собираемся проверить, насколько использование данных о поведении людей в exploration фазе, позволит ускорить обучение.
Да, это особенности самих игр.
А F12/Start Game нажимали? В Space Invaders, например, для начала игры нужно нажать.
Добавить больше игр не проблема, только тогда данных по каждой игре будет меньше, и это плохо скажется на обучении. Если наберём много данных, то добавить еще игру дополнительно — дело одного часа.
А еще, чтобы попасть пальцем в значок «настройки» на экране быстрых уведомлений нужно иметь палец младенца. Да, и лишний свайп тоже напрягает.
Ужасно стало то, что на экране блокировки теперь нет значков уведомлений. То есть, если я включаю телефон, появляется экран блокировки, на нём не видно, прислали мне письмо или нет. А вот после разблокировки значки уведомлений сверху появляются. (xperia z3 compact)

Это баг или так и задумано?
Не подумал об этом! Спасибо за идею.
Только чувак на картинке совсем не лайкает.
Сейчас пишу диплом, целью которого является разделение большого выравнивания на небольшие кластеры, которые более пригодны для анализа, чем полное выравнивание. Выложу код в открытый доступ после защиты. Если интересно, можем поговорить на эту тему.
Ура! Сегодня тоже заметил это, но не успел написать коммент. Стало как прежде)
Всё, понял проблему. Да, это неудобно. Он их не группирует, либо я не нашёл галочки, которая позволяет это делать.
А функционал не ломается. Выглядит это вот как тут. Просто смотрится ужасно, да и неудобно. Или вы это и имели в виду?
Случилось то, чего я боялся. Раньше, в меню быстрого доступа подержав палец на иконке «wifi» можно было открыть список доступных сетей. Теперь же нужно открыть настройки, потом wifi, а потом выбрать доступную сеть. Неудобно.

Меню всех вкладок хрома с наезжающей на всё кнопкой «закрыть всё» — это вообще какой-то вырвиглаз из 90-х.

Кнопка набора номера, отображающаяся поверх списка номеров — вообще издевательство. Если промахиваешься по ней, то начинаешь звонить другому человеку. Раньше, когда она была на нижней панели, промах открывал лишь другую вкладку меню, теперь телефон ведет себя неадекватно.
К сожалению (даже к счастью), не пользуюсь ОС Windows уже 8 или 9 лет.
Курячий крут, прошёл его курс в этом семестре. Единственное, что не понравилось. Когда edjudge говорит, что мой код не проходит по времени выполнения, то непонятно к чему стремиться. Он не проходит в несколько раз, или просто не хватает пары миллисекунд. Отсюда больше попыток и общий результат хуже. Было бы здорово показывать за сколько выполняется каждый тест на эталонной программе и за сколько выполняется твой код.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity