Как стать автором
Обновить

Комментарии 40

Спасибо за отличную статью!

Интересная игра, тренирующая ассоциативное мышление и умение строить связи.

Сперва мы учим машину долго и нудно выстраивать ассоциации, приближенные к человеческим, а потом учимся у той же машины ассоциативному мышлению, выглядит как преподаватель сперва учит студента, а потом просит объяснить предмет ему :)
Скорее это дрессировка на особенности нейросети, философский вопрос полезно ли это.
Так или иначе word2vec это скорее про контекст слов, то есть ближе к синонимам (точнее к словам, которые можно использовать в одном контексте), чем к ассоциациям. Например, ассоциацию тумбочка - тум-тум - африка люди смогут проследить, а эбмеддинги не очень.

Для улучшения могу порекомендовать взять эмбеддинги получше, так как нет привязки "посчитать на лету", можно скачать условные топ 10000 или предпосчитать, word2vec по меркам текущего развития позапрошлый век. Например, та же YaLM 100B яндекса уже с русским из коробки

Вместо Word2Vec можно использовать GloVe, который заточен под контексное отображение. По ощущениям он справляется лучше Word2Vec, да и голого Bert-а. А вот среднее расстояние между Bert и GloVe дает получше результаты.

Думаю скоро выпустим статью про эти задумки

Я хотел использовать GloVe, но word2vec подкупил своими тегами...

У нас очень много жалоб на прилагательные были, как будто бы их стоит вообще убрать)
Сейчас думаем как бы лучше поступить

Веселая шизофрения... Без подсказок не решить за вменяемое время.

Однозначно... Только настоящий шизофреник может угадать вот так:

Моя попытка поиграть

ахаха спсб за ответ. я дошел до слова "раз" и застрял
при этом английскую контексту щелкаю достаточно легко и без подсказок

Неплохо. Как перезапустить игру, не удаляя Cookies?

Hidden text

Насколько я понял - загадывается одно слово в день для всех. По ссылке "Игры" можно выбрать другой день и разгадывать слово, загаданное в тот день.

Всё так. Вкладка игры и другой день.

Каждый день одно слово.

Да даже с подсказками типа "правеж", "недолга" пришлось гуглить что они означают.

Гардероб

Просто ради интереса... Сколько слов в словаре?

Наверное в системе есть носки, носок в единственном числе применяется реже

Увы, поттериану в систему не загрузили.

Сделайте, пожалуйста, кнопку "Сдаться" или "Показать ответ". Я понятия не имею, что тут загадано

немного странно, что ваш ИИ оценивает слова "раз" и "один" настолько по разному

но вообще набор слов вызывает вопросы
кто нибудь в курсе что такое гарнец?

Отдельной забавы стоит загадать слово, словоформы которого имеют другое значение.

Коллега загадала слово «базили́к» (трава-приправа такая). И по мнению word2vec это слово максимально близко к слову «бази́лика» (эт такой царский дом), что логично, родительный падеж для первого слова пишется так же.

Таким образом в топ-500 слов можно встретить как перечисление приправ, так и перечисление строений. Не повезло тем, кто выбрался в «зеленую» зону на строениях!

Гарнец - это четверть ведра. Вполне на месте смотрится в одном ряду с другими числительными и мерами.

Возможно потому, что раз может применятьсян не только как число, напимер "в самый раз"?

Планируете использовать собранный датасет предположений игроков для дальнейшего обучения? статью напишете?

О таком я не думал. Х)

Хотя идея-то хорошая...

Вот была идея скорректировать вектора ассоциаций по последним 10 попыток людей. У нас где-то 5 миллионов попыток пользователей набралось. Попробуем что-нибудь сами порисовать, потом выложим унифицированные данные в открытый источник:)

Тема интересная. А как улучшать словарь - добавлять новые слова и удалять ненужные? Как новым словам будет назначаться вектор?

Ребят, это хардкор - 100 подсказок, 150 попыток. Это просто перебор, вам надо фильтровать редкие слова, глаголы, неправильные формы, иначе это просто упоротая игра

А итоговое слово Течение - и какое же слово к нему ближе? Какой к черту месяц и течение, какое они вообще имеют друг другу отношение. Боже как у меня горит, столько времени убить на угадывание.
Поменяйте свою сетку на openAI, или это игра в рулетку а не угадывание.

Алгоритм посмотрел, сколько раз упоминается словосочетание "в течение месяца" и разбил предлог "в течение" на составляющие, привязав "течение" к "месяц". А про морские течения пишут куда реже, увы...

('королева_ADV', 0.6368524432182312),

Теперь мне не дает покоя наречие «королева», пытаюсь придумать, что оно могло бы означать и с какими глаголами употребляться.

Теперь напишите "разгадывателя" и пусть бьются друг с другом.

Просил ChatGPT загадать что угодно и отвечать да/нет на вопросы вроде "это живое?". И наоборот, когда отгадывал он. Понимание позволяет играть как с человеком. Хотя ваша игра сложнее и мозг прогревает лучше.

Подскажите слово от 13-12-2022. Уже всю голову сломал, все слова открыл с 1 по 20. Ответ так и не понимаю

Шел - животное - вещество - воздух - мяч - и далее как на скрине...

Открыл честно

Багрепорт: если слово отсутствует в словаре, попытка всё равно засчитывается (а в англоязычной версии нет).

Спасибо за статью!
Если интересно, могу предоставить эмбединги с sociation.org (не сочиите за рекламу, проект некоммерческий). Они получены не на корпусе текстов, а, наоборот, из ассоциаций пользователей. Слов меньше, только отмодерированные существительные и устойчивые словосочетания, но они намного качественнее. Я сравнивал с RuVectors тестами и эмпирически.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий