Comments 4
Речевой акт изначально - это акт суггестии, акт влияния на ментальную модель воспринимающего агента (и, как следствие, на его поведение). Соответственно, и внутренний диалог - такой же эпифеномен действия (формирования потенциала действия). Кажется, эта концепция настолько бородатая (и эволюционные лингвисты на неё опираются, и отцы кибернетики её имели ввиду в своих формализациях), что даже немного обескураживает «новизна» подобных новостей - чем вы всё это время занимались, школу прогуливали? Гугол, ишь, техногигант, играются там со своими видеокартами вместо дел, человечество так и помрёт скоро, не дождавшись сильного ИИ :).
Логично задать вопрос: как можно ожидать, что LLM будут понимать незнакомый им формальный язык (например, API колонок)?Мысль в правильном направлении. Если говорить о числовом познании, то у человека есть эволюционно сложившиеся специализированные структуры в мозге отвечающие за нативную работу с числовой информацией. Абстрактные (символические) числовые концепции в языке базируются на этом нативном уровне, и условно можно говорить о существовании такого API к этому уровню. Можно ли создать подобные структуры во вне языковой модели, или найти уже готовые, это вопрос реализации. Пример такой возможной реализации, с пояснениями и ссылками, приведен в похожей теме в этом коменте.
похожая разработка
en.wikipedia.org/wiki/Gato_(DeepMind)
А вот и кратенький обзор с демонстрацией возможностей. https://www.youtube.com/watch?v=ICQIx_C8mHo Впечатляет, что она даже геометрические задачи с рисунками решает.
По ту сторону генерации текста: языковые модели, которые действуют, а не просто говорят