С каких это пор сумма арифметической прогрессии (задача 23) равна (n + 1) / (n / 2)?
Ну и как тут уже заметили, большинство примеров кода очень "не очень".
Вот этот момент я немного не понял, вроде как мы тоже падаем (или нет?) в БЧД, только медленнее тех, кто ближе. Так что сфера может и уменьшаться. Но основная мысль в том что мы должны наблюдать неравномерность красного смещения в зависимости от направления в котором мы смотрим.
Насколько я понял, удаляться будут объекты, которые находятся ближе и дальше от БЧД, то есть, грубо говоря, сзади и спереди (если мы смотрим в направлении БЧД). Те что справа и слева удаляться не должны.
Я правильно понимаю, что из-за отсутствия MCTS в процессе игры, Zero в одной и той же позиции всегда будет выбирать один и тот же ход? А в версии master MCTS вносит некоторую случайность в игру?
И еще вопрос, время на обдумывание хода играет какую-то роль в версии Zero?
Спасибо, я гляну ролик. Мне с высоты моего (тоже не сказать что высокого) 2 дана показалось, что я вижу параллели между игрой сильнейших про и zero. Конечно вполне возможно что мне просто показалось :)
Что касается формы, я не берусь определять что такое хорошая, а что такое плохая форма. Моя мысль в том, что у людей такое понятие существует, а вот у AlphaGo — вряд ли. Но при этом, создается ощущение, что AlphaGo соглашается с нашим интуитивным пониманием того, что такое хорошая форма.
Я совсем не специалист в ML, но мне кажется что принципы похожи, только если издалека смотреть. Человека (кроме умения перебором просчитывать позиции) учат каким-то принципам, которые просто сформулированы словами, например говорят, что в начале партии нужно занимать углы, что от стенки нужно прыгать на N+1 камень и тд. Учат какой-то своеобразной эстетике, говорят что кейма — хорошая форма, а пустой треугольник — плохая. То есть знания передаются в достаточно общем виде, и нет отбора более эффективного игрока. Я, если честно, ожидал, что манера игры Zero будет сильнее отличаться от человеческой.
Я посмотрел несколько партий сыгранных AlphaGo Zero и больше всего меня впечатляет тот факт, что во многих позициях он играет варианты понятные человеку чисто интуитивно. Когда я смотрел игры master — это можно было объяснить тем что master и предыдущие версии учились на играх людей. Но то что ИИ сам, без участия человека пришел к "пониманию" игры, которое похоже на человеческое, на мой взгляд, говорит о том, что мы люди — не такие уж и тупые :)
На мой взгляд, тимлид — это не самый крутой программист, а тот кто готов взять на себя ответственность за работу команды. Вполне могу представить, что человек с таким бэкграундом как у автора, может быть классным тимлидом.
Мне вот интересно, любители добавлять таймстампы в урлы считают, что разработчики браузеров придумали кеширование чисто из вредности?
Для справки, в девтулзах в хроме есть галочка "disable cache".
С каких это пор сумма арифметической прогрессии (задача 23) равна (n + 1) / (n / 2)?
Ну и как тут уже заметили, большинство примеров кода очень "не очень".
Неоднократно сталкивался с ситуацией, когда характер изменений таков, что катить назад вариантов нет, только патчить на живую и молиться.
Красный и синий треугольники не подобны, а следовательно гипотенуза большого треугольника на самом деле не гипотенуза, и вообще не прямая.
Посмотрел сейчас внимательнее партии где zero играл белыми, master чаще делает новые ходы:
http://www.alphago-games.com/view/eventname/agzero_vs_agmaster/game/0/move/17
http://www.alphago-games.com/view/eventname/agzero_vs_agmaster/game/4/move/23
http://www.alphago-games.com/view/eventname/agzero_vs_agmaster/game/8/move/21
А вот тут zero разные ходы сыграл:
http://www.alphago-games.com/view/eventname/agzero_vs_agmaster/game/10/move/24
http://www.alphago-games.com/view/eventname/agzero_vs_agmaster/game/2/move/24
Получается во всех версиях есть какой-то случайный фактор при выборе хода.
Я правильно понимаю, что из-за отсутствия MCTS в процессе игры, Zero в одной и той же позиции всегда будет выбирать один и тот же ход? А в версии master MCTS вносит некоторую случайность в игру?
И еще вопрос, время на обдумывание хода играет какую-то роль в версии Zero?
Спасибо, я гляну ролик. Мне с высоты моего (тоже не сказать что высокого) 2 дана показалось, что я вижу параллели между игрой сильнейших про и zero. Конечно вполне возможно что мне просто показалось :)
Что касается формы, я не берусь определять что такое хорошая, а что такое плохая форма. Моя мысль в том, что у людей такое понятие существует, а вот у AlphaGo — вряд ли. Но при этом, создается ощущение, что AlphaGo соглашается с нашим интуитивным пониманием того, что такое хорошая форма.
Я совсем не специалист в ML, но мне кажется что принципы похожи, только если издалека смотреть. Человека (кроме умения перебором просчитывать позиции) учат каким-то принципам, которые просто сформулированы словами, например говорят, что в начале партии нужно занимать углы, что от стенки нужно прыгать на N+1 камень и тд. Учат какой-то своеобразной эстетике, говорят что кейма — хорошая форма, а пустой треугольник — плохая. То есть знания передаются в достаточно общем виде, и нет отбора более эффективного игрока. Я, если честно, ожидал, что манера игры Zero будет сильнее отличаться от человеческой.
del
Я посмотрел несколько партий сыгранных AlphaGo Zero и больше всего меня впечатляет тот факт, что во многих позициях он играет варианты понятные человеку чисто интуитивно. Когда я смотрел игры master — это можно было объяснить тем что master и предыдущие версии учились на играх людей. Но то что ИИ сам, без участия человека пришел к "пониманию" игры, которое похоже на человеческое, на мой взгляд, говорит о том, что мы люди — не такие уж и тупые :)
Неудачная попытка.
error != nil
вымораживает писать, а if… вместоreturn error != nil
нет. Странно..На мой взгляд, тимлид — это не самый крутой программист, а тот кто готов взять на себя ответственность за работу команды. Вполне могу представить, что человек с таким бэкграундом как у автора, может быть классным тимлидом.
Это еще одна статья про xored?
Как-то так:
хм… а мне вот кажется, что нет.
Когда-то давно писал middleware для express примерно с таким api:
Решает проблему копипасты?