Comments 9
Вы сами до этого дошли или использовали какие-то наработки? Мы со словоформами работаем с самого начала и разрабатываем не ЛЛМ
Слово - это общее понятие, а словоформа - это конкретное его проявление в речи, с учетом грамматических характеристик, таких как падеж, число, время и т.д
Дошел сам, идея постепенно эволюционировала в то, что есть. Я эту тему прорабатываю уже больше 5 лет с переменным успехом. Около двух лет назад начал разработку движка (по выходным), сейчас оно функционирует на реальных пользователях.
Главная единица в моей базе - Смысл, какой-то предмет/свойство/действие/итд, к нему уже цепляются слова на разных языках, а к ним формы/примеры/переводы.
Слова в этой цепочке - абстрактная вещь, просто промежуточная сущность в базе данных, чтобы объединить словоформы.
Мы использовали наработки из 80ых и для английского языка (оригинальная разработка была представлена англичанином), но быстро адаптировали под немецкий и португальский языки. Изменения в формулах заняло меньше недели. С русским стало тяжелей. Трудней всего нам было с японским. Почти год заняло усложнение формул для работы со словоформами для русского. Почему эти языки? Так как у нас команда "разношерстная" американцы, немец, австриеец, бразильцы, русские и один японец. Но у нас нет баз для переводов и примеров, они не нужны и мало того, они мешают (это мнение только нашей команды, не истина в первой инстанции)
P.S.: Мы пошли по пути наименьшего сопротивления. Зачем придумывать свой велосипед, когда люди уже думали над аналогичными задачами. Их надо просто взять и актуализировать с учетом современных знаний и технологий
Примеры и переводы - это уже специфика моего приложения, в первую очередь это инструмент для пополнения словарного запаса.
А что именно вы создаете, можно где-то почитать?
О самом подходе, а именно Real AI, в разные годы, было опубликовано много информации. О нашей разработке, пока нет официальной информации. Если все будет хорошо, как запланировала команда, то через несколько месяцев мы начнем делать первые официальные заявления. Итогом всех заявлений будет полное, официальное, согласно всем стандартам, прохождение не одного, а нескольких тестов Тьюринга
Не удалось найти описания среди кучи рекламы (очень много компаний которые "реально AI"). Не поделитесь ссылкой на какую-нибудь публикацию?
Мало того, что много рекламы, так и направление, Real AI начали смешивать с LLM, т.е. упоминать в рамках концепции LLM, хотя еще в начале 2010 это было два разных направления, со своими течениями, последователями. Хотя, на некоторых китайских сайтах учебных учреждений, есть описание того, как они понимают концепцию Real AI, но без LLM. В этой книге, есть часть того, какова была история становления ИИ, течения ИИ и этическая сторона ИИ в разные годы: https://link.springer.com/article/10.1007/s43681-023-00258-9
Мы опубликуем все материалы, которые у нас есть, чтобы перестали смешивать два подхода LLM и Real AI, а также предтечи Real AI - проект "Niagara", но только перед тестами. Слишком много времени мы потратили на то, чтобы их собрать. Я бывало смотрю на Ютубе видео и натыкаюсь на то, что вся история ИИ - это только история нейронных сетей и как будто больше ничего и не было. Для нас важно, чтобы люди знали полную историю ИИ.
у вас на сайте есть пример с "Она приглашает..." и правильный вариант указан как "asks"
А вы в проге объясняете "почему в данном случае именно такой вариант правильный"?
Ведь именно этот аспект важен - почему именно конкретный ответ считается верный
В указанном примере именно invite самый правильный вариант. Можно использовать ask но тогда из контекста должно быть понятно, что она обращается неформально к собеседнику
Курс все еще не идеален. Когда поьзователей станет больше, и в целом на платформе появятся англоязычные нэйтивы, тогда я добавлю задания "прокомментируй, почему здесь именно так". Первые комментарии/обсуждения я уже собираю с пользователей, и их можно просмотреть в некоторых случаях.
Нам нужно больше крауда для качественного сорсинга, именно поэтому эта статья на хабре.
Ты учишь AI, AI учит тебя