В 2016 году Уилл Найт, исследователь искусственного интеллекта из Массачусетского технологического института, писал, что «Машины, которые понимают естественные языки, были бы крайне полезны. Но мы не знаем, как их создать».
С тех пор многое изменилось. Искусственный интеллект играючи побеждает гроссмейстеров го, сёги и шахмат, Google Translate успешно развивается, используя самообучающуюся нейронную сеть, а голосовой помощник Алиса от «Яндекса» хорошо распознает человеческий язык и вполне естественно имитирует живую речь.
Но может ли машина действительно понимать естественные языки? В компании Google уверены, что может. В декабре 2019 на базе нейросетей они создали небольшую игру в слова, в которой ИИ оперирует не просто смыслами отдельных слов, а целыми цепочками ассоциаций.
Встречайте, Semantris. Сегодня поговорим о ней и подумаем, знает ли ИИ английский язык настолько, чтобы помочь в его изучении людям.
Semantris — игра против ИИ
Лучше один раз попробовать, чем десять раз прочитать описание. Чтобы понимать, о чем мы говорим, советуем сразу оценить игру самостоятельно.
Поиграть в Semantris
В нее можно играть двумя способами: как аркаду и как своеобразные кирпичики.
Аркада
Перед вами колонка слов на английском, одно подсвечено. Ваша задача — придумать к нему такую ассоциацию, которая в рейтинге ассоциаций самой системы будет выше, чем для всех остальных слов в колонке.
Звучит сложно, поэтому лучше сразу на наглядном примере.
Ключевое слово сейчас — «Newspaper».
Вам нужно придумать такую ассоциацию, которая подходит именно этому слову, но не другим в колонке. Будьте осторожны, там также есть слова «pen», «school» и «table», которые находятся со словом «newspaper» в одном смысловом поле.
Допустим, вы придумали ассоциацию «Title».
И она оказалась лучшей, поэтому вы получаете максимум очков.
Если вдруг какое-то другое слово из колонки будет ближе к ассоциации, которую мы придумали, игрок получит меньше очков. А если ассоциация и вовсе будет неудачной, то штраф.
Для стимуляции скорости соображения игрока сверху постоянно падают новые слова. Если думать слишком много, то словесная башня достигнет верха экрана и будет «Game over».
Кирпичики
Здесь тоже нужно придумывать ассоциации, но порядок игры немного меняется. Вы пишете слово, а игра сама соображает, какая ассоциация на игровом поле к нему ближе.
Когда ассоциация выбрана, то игра убирает блок с этим словом и все блоки того же цвета, которые находятся рядом с ним.
Допустим, пишете слово Ship.
На игровом поле есть два слова, которые близки к нему по ассоциации: Ocean и Pirate. Какое выберет система?
Это «Океан». «Корабль» по мнению ИИ ближе именно к нему, а не к «Пирату».
Тут нужно включать стратегическое мышление и контролировать всю ситуацию на поле — как в шахматах. Ведь если ошибиться, система уберет не тот блок, который вам нужен. Это усложнит ситуацию на поле, ведь дополнительные блоки падают сверху каждый ход.
Как только пирамида достигнет верха, вы проиграли.
Игры очень простые, но затягивают. Даже забываешь, что играешь с искусственным интеллектом, который обрабатывает запросы в реальном времени. Можно использовать даже те слова и фразы, которых нет в словарях.
К примеру, если в ассоциации к слову «Game» написать «RPG», то система обозначит это как идеальное соответствие. Ведь это действительно так. RPG — это один из жанров компьютерных игр, который расшифровывается как «Role-playing game». В полностью заскриптованной игре подобной ассоциации не было бы — аббревиатуру RPG она бы приняла как ошибочное написание и просто не засчитала бы очко.
Как работает Semantris: взгляд внутрь
Semantris использует полностью обучаемый end-to-end алгоритм, который используется для работы с различными естественными языками. Это значит, что нейросеть самостоятельно строит модели работы с лексемами.
Специалисты предоставляют открытый доступ к алгоритмам системы. Любой желающий может скачать их и покопаться во внутренностях.
Изначально нейросеть обучалась на примерах из естественных языков, где для каждого предложения, фразы или слова был заранее дан перевод, значение или другая семантическая связь, к примеру, импликация или пара вопрос-ответ.
К примеру, в исходных данных есть вопрос «Почему ты не пришла на ужин?», который соединен с ответом «Прости, у меня не получилось». Он отмечен как позитивный — то есть, имеющий смысл. Случайно сгенерированные пары вопрос-ответ будут негативными. К примеру «Почему ты не пришла на ужин? — «Месси забил гол на 90 минуте игры».
Таким образом, система получает примеры не только для истинных пар вопросов-ответов, но и для ложных. Это помогает ей учиться быстрее.
В ходе обучения используются полуконтролируемые источники данных — так называемое трансдуктивное обучение.
Используя большое количество источников (статьи из СМИ, треды на форумах, базы вопросов-ответов), нейросеть учится оперировать фразами и предложениями в разных измерениях: смысловая непротиворечивость, семантическое сходство, общий смысл и даже смысловые закономерности.
Нейросеть обучалась на английском, но методологию можно использовать для любого естественного языка.
Система обучается на комплексных примерах, поэтому одновременно изучает синтаксис, семантику и значения слов. Работа с ассоциациями — только одна из многих возможностей нейросети.
Игра с ИИ помогает изучать английский язык
Теперь посмотрим с точки зрения изучения английского языка. Semantris — настоящая находка. Эти две мини-игры помогают решать реальные задачи обучения.
Чтобы играть в Semantris, нужен уровень английского не ниже Intermediate со словарным запасом от 2000 слов. Ведь игра не помогает изучать новые слова — она помогает использовать уже известные.
Если словарного запаса не хватает, рекомендуем скачать приложение ED Words и изучать до 10 новых английских слов каждый день.
Кроме того, важно знать правильное написание слов – система не распознает слова, написанные с ошибками. Т9 здесь нет, поэтому даже если ассоциация будет идеально подходить, из-за ошибки вы все равно получите штраф.
Интересно, что эти мини-игры решают совершенно разные задачи и при этом обе чертовски полезны для разнообразия учебного опыта. Разберем по отдельности.
***
Главная ценность аркады — скорость. Сверху постоянно падают новые слова, поэтому ассоциации нужно придумывать быстро, в пределах нескольких секунд.
Интересно то, что в игре учитывается уровень сложности. Поначалу попадаются простые слова, которые изучают уже на уровне elementary. К примеру, «kitten», «pond», «garden», «rain». Но чем дальше, тем сложнее. Через минуту-полторы семантическое поле увеличивается, а фразы усложняются. За секунду подобрать ассоциацию к «nuclear power» или к «Stonehenge» довольно сложно — проверено на себе.
Добавляет сложности то, что нельзя использовать однокоренные слова. То есть, если на экране у вас есть «Stonehenge», то слово «stone» игра не примет.
С точки зрения обучения это отличный пример активации пассивного словарного запаса. В моменты игровой сосредоточенности мозг выкапывает такие ассоциации, до которых в «нормальном режиме» вы бы просто не додумались. Причем игра будет полезна для любого уровня знаний, вплоть до уровня носителя языка.
***
В игре кирпичики куда более важно продумывать ассоциации. Ведь вы пишете слово в строке ввода, а система самостоятельно выбирает наиболее близкую с ним на игровом поле.
То есть, вы заранее не знаете, какое именно слово выберет ИИ. А когда башня из блоков приближается к верхней границе, очень важно «выбивать» правильные кирпичи.
Поэтому приходится учитывать сразу все слова, которые есть на поле.
К примеру, на поле есть слова «water» и «fish». Если написать «pond», то вы не сможете спрогнозировать, какое именно слово выберет система. Потому что «пруд» одинаково хорошо ассоциируется и с «водой», и с «рыбой». Поэтому стоит попробовать другую ассоциацию. А если написать «salmon», то практически со 100% вероятностью ИИ выберет на поле слово «fish».
Получается, что игроку нужно понимать смыслы всех слов на поле и стараться придумать ассоциацию, которая будет близко к одному слову, но при этом далеко от других.
Игрок должен мыслить стратегически, потому что важно не просто убирать блоки, но и оценивать, как именно они упадут на следующем ходу.
А с повышением сложности спрогнозировать ассоциации становится крайне сложно. Как, к примеру, придумать точную ассоциацию к фильму «Stairway to Heaven» или к группе «Pink Floyd»? Ведь ассоциативный ряд целого полнометражного фильма и творчества музыкальной группы на порядок сложнее, чем семантика отдельного слова.
***
Semantris — это отличная возможность разнообразить изучение английского языка. Обе игры интересные, в них можно легко залипнуть на полчаса-час. При этом они крайне простые, правила поймет даже ребенок, но полезны для изучения языка.
Как дополнительный инструмент для занятий — шикарно. Но не стоит забывать, что именно дополнительный.
Использование Semantris не отменяет необходимости занятий с преподавателем, грамматических тренировок и изучения новых слов. Но для разнообразия это именно то, что нужно. И весело, и полезно. Учите английский с удовольствием!
Онлайн-школа EnglishDom.com — вдохновляем выучить английский через технологии и человеческую заботу
Только для читателей Хабра первый урок с преподавателем по Skype бесплатно! А при покупке занятий получите до 3 уроков в подарок!
Получи целый месяц премиум-подписки на приложение ED Words в подарок.
Введи промокод semantris на этой странице или прямо в приложении ED Words. Промокод действителен до 25.09.2021.
Наши продукты:
- Учи английские слова в мобильном приложении ED Words
- Учи английский от А до Z в мобильном приложении ED Courses
- Установи расширение для Google Chrome, переводи английские слова в интернете и добавляй их на изучение в приложении Ed Words
- Учи английский в игровой форме в онлайн тренажере
- Закрепляй разговорные навыки и находи друзей в разговорных клубах
- Смотри видео лайфхаки про английский на YouTube-канале EnglishDom