Как стать автором
Обновить

Комментарии 37

А зачем норку превращать в пенис? В пенисе нет "о".

Фраза звучит конечно так себе )

Хех, прекрасный комментарий)

Собственно, дело в том, что у алгоритма нет цели сразу пытаться найти правильное место для буквы в ответе; цель просто подобрать такое слово, после ввода которого в итоге отфильтруется как можно больше возможных ответов. Ну и так получилось, что пенис был лучшим словом. А то что в пенисе есть буква "н" - это просто совпадение

На самом деле в статье описан алгоритм, который всегда подстраивается под маску ответа. Я этот алгоритм назвал "человеческим, ну и работает он хуже, чем оптимальный

Всегда использовал в качестве стартового ‘лента’ По частотности тоже неплохо.

Проверил это слово на словарях из статьи. Получилось вот что:

  • Место: 181 из 4109

  • Среднее кол-во оставшихся ответов: 95.7113

  • Максимальное кол-во оставшихся ответов: 242

В целом кажется и правда вполне неплохое слово для старта

А для слова "пилот" какая статистика?

Как был рад месяц назад, Когда с первого слова угадал, как будто лотерею выиграл

Добавил в репозиторий статистику для всех стартовых слов: https://github.com/kadukm/five-letters/blob/master/research_results/beginnings/2066_4109.md

Конкретно для слова пилот получилась вот такая статистика:

  • Место: 842 из 4109

  • Среднее кол-во оставшихся ответов: 134.9448

  • Максимальное кол-во оставшихся ответов: 396

Может быть, результаты хуже, потому что в нем нет буквы "а"

Вообще, это всё очень сильно зависит от используемых словарей, и прям конкретные числа смотреть смысла не очень много. Но если какие-то значения для слов отличаются на порядок, то да, тогда можно примерно оценить, какое слово лучше или хуже)

Ну вот, теперь выигрыш будет ещё меньше, чем 17 рублей...

Мне кажется многие из "выигравших" вбивали с сайта с отгаданными словами, если не отгадать было. И как от этого защититься если у всех одно и то же слово - не понятно. Вообще годная игра, до сих пор стоит напоминание и отгадываю раз в день, другие Т игры не зашли.

Сам так делаю - обычно пуляю сразу 3 своих стандартных слова с 15 буквами разными относительно распространенным (если совсем сильных совпадений нет на первом и втором) А дальше уже с умом.

Пользуюсь формой подбора на сайте vfrsute.ru/сканворд/слово-из-5-букв/
Там около 11к слов из 5 букв, но есть перекос в устаревшие.
Например там не было как-то загаданного Тинькофф-банком "смузи"

А мне прикольно самому отгадывать... скрипеть мозгами, радоваться, что угадал (редко).

Тоже понравилась игрушка. Написал форк на javascript.

Исходники: https://github.com/ALapinskas/guessword - js, webgl, html, можно поставить на страничку.
Игра: https://reslc.ru/node/125 - разная сложность, 3, 4, 5, 6 букв в слове, подцеплен API яндекс-словаря для вывода значения слова.

Не сильно знаком с "Быками и коровами", но видимо да, что-то похожее есть

Разница в том, что в "Быках и коровах" игра ведется с цифрами, а не с буквами, плюс игра не предоставляет информацию по каждой введенной цифре отдельно, а возвращает агрегированную информацию, сколько в целом цифр угадано

Во всяком случае, судя по той инфе, что я нагуглил об этой игре)

Да, только в "Быках и коровах" возможны любые сочетания цифр, а тут только из определённого набора слов. У меня в детстве вот такая игра была с тем же смыслом.

Воспоминание разблокировано

Опираясь на частотность (правда, всех слов, а не только лишь пятибуквенных), всегда использовал слова "серна" и "отлив" для старта, и, судя по статье, был недалёк от оптимума.

Всегда использую разные слова. Главное же не победа, а процесс.

еще ни разу загаданные слова не повторялись

Это неправда

Ага, буквально вчера был повтор (ТОВАР)

Действительно, спасибо за замечание

Поправил статью и добавил уточнение об этом факте

метод, сплин, курва
В среднем остается 1.53 ответа
В данном случае остался 1 ответ
струя

вообще-то тут еще подходят сбруя и струг.

Я писал похожую программу для поиска решений на питоне (на основе частотности букв), использовал там словарь hunspell

Тут просто всё дело в используемых словарях. Для имитации словарей Т-Банка у меня получился такой словарь с ответами, что слова струг в нем нет. Но это лишь имитация и мое предположение, и почти наверняка этот словарь не полностью совпадает с реальным словарем ответов Т-Банка

Если рассматривать словари вообще всех слов, что я нашел, то да, там есть и сбруя, и струг

P.S. сбруя в этом кейсе не подходит в качестве ответа, потому что в ней нет буквы "т"

Проведя аналогичное исследование без ограничения на словарь частых слов пришёл к аналогичным стартовым словам: крона (привет норке), билет и связь.

Все посчитал просто на SQL, импортнув словарь из всех слов в БД.

Алгоритм, который выбирает для старта n слов с неповторяющимися буквами, а затем продолжает работу как оптимальный

Буквы могут повторяться. Сама видела, как было загадано "слово".

Ну да, слова с повторяющимися буквами точно могут быть загаданы. Не удивлюсь, если когда-нибудь будет загадано что-то вроде атака или олово

Просто если проверять разные буквы, то это дает больше информации. Поэтому в старте из n слов проверяются уникальные буквы

Писал статью про работу с этой игрой. Жаль, что Хабр не опубликовал.

Таких слов 5 штук - деткасеткаметкаветкатетка

На этом этапе мы вынуждены просто перебирать возможные ответы. Но при этом у нас осталось только 2 хода, из-за чего в итоге для трех из пяти возможных ответов мы точно будем получать поражение

В таких случаях надо думать на шаг вперёд: не пишем "щетка", а сразу прикидываем, что таких слов, отличающихся первой буквой, целых 6, а шагов осталось всего 3, поэтому за два шага надо проверить все возможные первые буквы, а на последнем шаге использовать ту, которая окажется правильной.

Например, на четвёртом шаге пишем "тодес", проверяя тем самым сразу три варианта первых букв (и заодно убеждаясь, что "е" тоже есть), причём "т" в этом проверочном слове обязательно должна стоять первой ("стадо", к примеру, не подойдёт), иначе мы не сможем понять, используется ли она в загаданном слове один раз — на третьей позиции — или два. На пятом шаге пишем, например, "время", проверяя "в" и "м".

Ну, и дальше ставим на первое место либо ту согласную, которая не была серой на 4-м или 5-м шаге, либо единственную оставшуюся непроверенной букву "щ". Готово :)

Вы абсолютно правы!

Можно было бы докрутить этот алгоритм и в итоге сделать что-то среднее между оптимальным и "человеческим" алгоритмами, но у меня цели такой не было. Плюс, как мне кажется, такой алгоритм все равно работал бы не лучше оптимального

В целом мне просто хотелось посмотреть, насколько хуже оптимального алгоритма будет работать такой прямолинейный алгоритм, который всегда пытается подстраиваться под маску ответа)

Как человек, играющий в это с самого начала, сначала без стартовых слов, потом с ними.... вроде iq не космический, но проиграл раз 5 за 500 слов (играю честно и с удовольствием).

Хочу сказать - словарь у банка кривой:

  1. Есть такое слово, как 'бьюик', которое никак быть не должно, есть еще, но забыл.

  2. Есть слова, которые существуют, но в словаре нет (не записывал, пруф не смогу)

  3. Уже неоднократно сталкивался с малоиспользуемыми словами, даже хуже.

  4. Думал, что загадывается одинаковое слово для всех - но запустив 5букв в приложении товарища (первый раз), получили совсем другое слово.

Слова загадываются одинаковые для всех, иначе не было бы сайтов вроде этого

Ну первый раз для обучения всегда загадано "слово", а потом одинаковые для всех

Ах вот в чем дело, спасибо.

Сегодня я как обычно взял рандомное слово и очень удачно угадал!

Так игра остаётся игрой. Уважаю тех, кто может провести лингвистический анализ, описанный в статье. И всё же хочу сохранить ощущение, что я играю.

Ой, ну зачем же вы сегодняшнее слово без спойлера засветили.. Может уберете под кат и предупреждение? Хотя, наверное поздно уже..

Норка работает не хуже :)

До этого мне всегда казалось, что океан - чуть ли не лучшее слово для старта, ведь там и 3 гласные, и все буквы достаточно часто употребляемые. Однако, на практике это слово занимает лишь 132-ое место.

Из тех же соображений использую опеку, чуть выше вашего океана за "ка" в конце. Теперь вот не знаю, играть как раньше или использовать двойной-тройной стартер.

Привет, отличная статья. Спасибо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации