Как стать автором
Обновить
32
0

Пользователь

Отправить сообщение

А что? Не все так радужно? Звучит все действительно так, будто в заводском IT есть и большие ресурсы для развития проектов и мотивация бизнеса постоянно расти, развиваться и большой выбор чем конкретно заниматься (много разных параллельных проектов), свобода действий и так далее, далее

Очень увлекательная статья, спасибо что написали ее. Буду надеяться, что вторая часть непременно будет))

Спасибо и вам, без таких любопытных читателях как вы, выпуск подобных статей был бы в итоге невозможен) Поэтому я искренне рада, что вам понравилось ее читать)
Это действительно хорошее наблюдение

Да, 3 раза вот так повторять позицию - это ничья по правилам, но я и ждал чего-нибудь от неё. Наверное как раз такая необычность и неправильность, и привела её к дальнейшим ошибкам, и что важно - к грубым ошибкам, ведь в базе данных нет скорее всего подобных розыгрышей.

Кажется, что модель должна повторять ходы, но на самом деле это не всегда так. К примеру, обычные шахматисты часто делают повторения не из-за того, что хотят ничью, а набирая время несколькими быстрыми ходами. А перед ходом который должен фиксировать ничью делают отклонение (или же после троекратного повторения, просто не фиксируют ничью а продолжают играть). Поэтому в выборке модели вполне может встречаться повторение, которое в итоге не заканчивается ничьей. Еще могу предположить, что из-за того, что модель играет с контекстом в котором стоит результат 0-1 в пользу модели, то, в некоторых позициях это может стимулировать ее делать не лучший ход (по ее мнению), который в нашем случае приводит к ничье по правилам, а тот который позволит выиграть. Но так как она не знает как победить, то просто "сыпется" .

Как решать проблему неготовности модели к нестандартным ходам - на данный момент идей не имею

Возможно это решится, простым увеличением выборки обучения за счет чего увеличится ее способности к обобщению, как к примеру произошло, когда проверялось, что будут делать черные на 1. e4 e5 2. d4 exd4 3. Qxd4 Nc6 4. Qxg7, что ооооочень нестандартно. Первые модели "игнорировали" ферзя на g7, а те, что учились на более крупных данных спокойно его ели (хотя ход от этого не стал менее редким и абсурдным в такой партии).

Или думаю это возможно за счет партий stockfish, так как движок лишен присущего человеку "чувства прекрасного" и в этом плане всегда старается сделать лучший ход в конкретной позиции, а не играть по знакомым схемам и расстановкам

Как говорится: "Не бывает глупых вопросов. Глуп тот вопрос, который не был задан."

Спасибо за ваш вопрос)))

Думаю вы на самом деле правы и результаты будут похожи, только с той разницей, что обучаться она будет существенно дольше и потребуется больше данных. Так как предобученые модели уже обучались шахматным партиям (вместе со всем остальным), за счет чего и имеют элементарное представление о них. В не обученной же модели, нам придется восполнять это все с нуля

Благодарю)) очень приятно видеть такие комментарии)

Вы действительно заметили интересную деталь

Современные программы играют как монстры, эта -- как человек, этим и ценна

Причем я думаю, что вы очень верно подметили ценность таких моделей. Их создание может приносить пользу на тренировках шахматистов, где можно будет настроить модель на определенный уровень игры и стиль, подобрать дебютный репертуар. Человек так может работать над слабыми и усиливать свои сильные стороны. При подготовке к сопернику, можно подгрузить партии интересующего игрока, после чего модель станет "им"(например, так можно сыграть с гениальным, но умершим шахматистом) и игрок сможет увидеть, каких сюрпризов можно ожидать от соперника.

Мне кажется такая возможность может поднять общий уровень игры людей, так что такая разработка не бессмысленна и имеет пользу для обучения.


Думаю нас еще ждет множество открытий в шахматах и в развитии ИИ))

Эффективней оттеснять королем короля, а не ферзем

Почему вы так думаете?

Оттеснять королем короля у вас не получится, так как соперник будет вставать в оппозицию вашему королю(вставать напротив вашего короля) и не позволит себя оттеснить.

Если речь идет об оттеснении с помощью короля и ферзя, то с точки зрения количества ходов при правильном оттеснении это действительно не менее эффективный метод, правда с одним "но". Данным способом ставить мат на "автомате" сложнее, так как нужно думать с какой точке лучше дать шах королю и нужно ли его делать

К примеру, здесь человек может думать о том, пора ли давать шах и если да, то куда или может, нужно продолжать ходить королем.

Конечно для сильного игрока это не проблема, но у слабого шахматиста может возникнуть дилемма и он (допустим) проиграет по времени.

С этой стороны, метод в котором человек отрезает короля своим ферзем буквой Г более надежный, так как более автоматический и позволяет любому шахматисту поставить мат на задумываясь. Поэтому ему и учат обычно детей и новичков.

Думаю, ваше предположение хорошее и в практическом плане) Основная беда
там заключается во времени, которое требуется для того, чтобы получить
датасет, а именно: 15 дней беспрерывной игры движка. Более подробный
разбор этого вопроса, есть ниже в комментариях)

Для человека, не сильно разбирающимся в вопросе вы сделали очень хорошее предположение. Я уже выше отвечала частично на ваш вопрос, но дополнительно отмечу, что ваше утверждение о

Я исхожу из предположения, что игра, которая закончилась сдачей должна иметь какой-то явный конец

в целом справедливо, если человек с хорошем рейтингом ( а это +1700 где-то и это важный момент, так как более слабые шахматисты не всегда могут правильно оценить позицию и могут сдаться там, где еще не все потеряно) сдал партию добровольно(!), а не из-за потери флага, где вся игра еще может быть впереди. Так же, в выборке присутствуют не только "живые" партии, но и сыгранные онлайн и для них ситуация еще сложнее. К примеру, кто-то во время партии мог решить, что ему пора идти есть мороженое и бросить партию просто так или же иметь проблему с интернетом из-за чего возникнет техническое поражение спустя несколько минут.

Да, я думаю сама по себе это хорошая идея. Из недостатков здесь лишь
проблема времени существует. Чтобы сделать приличный датасет, нужно
будет собрать около 2 000 000 партий, а значит движку нужно будет
сделать 8 000 000 - 15 000 000 миллионов ходов, что бы их закончить.
Потому что партии могут быть не только брошены перед самим матом, но
из-за того, что у одно из соперников упал флаг (и доигрывать нужно 20
ходов) или же у соперника решающее преимущество как король + ферзь
против короля, но доигрывать до мата еще ходов 7. Даже если дать движку
0.1 времени на ход нужно будет около 15 дней ожидания. Конечно это
возможно, но на момент когда обнаружилась данная проблема, уже не
хватало времени. В будущем, я обязательно учту эту возможность.

Спасибо, что сообщили. Мне не удалось повторить эту ошибку, поэтому посмотреть что случилось нельзя. Чтобы этого избежать, было поставлено логирование, поэтому если такая ситуация повториться, можете смело писать и я поправлю ошибку

Может показаться, что Personality Insights это исключительно вредный и общественно опасный продукт для вторжения в личную жизнь

не совсем поняла, как возникла такая точка зрения? В том плане, что люди сейчас постоянно подвергаются подобным анализа, просто более точечным: подрор музыки, видео, фильмов, статей исходя из истории просмотров или запросов поисковика. Таких течений очень много и нельзя сказать, что люди воспринимают это как посягательство на личное или же вред. Так как многие рады тому, что им могут помочь рекомендации. И не нужно час искать инфу под свой вкус, так как лента подскажет (тут конечно рождается спор о создании информационных пузырей, но это уже другой аспект вопроса)

В итоге, исследователи приходят к интересному выводу о том, что в процессе чтения текста и мозг и языковые модели похожим образом выполняют следующие действия [12]: 1. оба занимаются непрерывным предсказанием следующего слова до начала слова в тексте

Кстати, то что модель языковая формирует ответ не словосочетаниями и мыслями, а по отдельным словам, не является ли принципиальной разницей в нашем мышлении?

Ведь как я понимаю, утверждение про мозг о постоянном предсказании следующего слова, распространяется лишь на чтение текстов, а не весь процесс обмена информации

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность