AlexKay28 Feb 8 at 11:07

«Душа молчит, хоть слышит всё вокруг»: как мы отучаем генеративные модели галлюцинировать

Medium

7 min

8.7K

Яндекс corporate blogSearch engines*Machine learning*Artificial Intelligence

+28

Comments 33

KonstantinTokar Feb 8 at 11:47

Бальмонт это хорошо и правильно.

Пользуясь случаем: а какое оборудование для обучения используется, и не повлияют ли на него новости от пятого февраля? Как вообще устроено создание моделей уровня llama/llama2 или лучше у вас в Яндексе?

UFO just landed and posted this here

AlexKay28 Feb 14 at 17:28

Подходов можно придумать много самых разных, но так как хочется развивать модели в направлении решения большего круга задачи, то приходится искать общие паттерны которые могут встретиться в наибольшем круге задач. Подстановка какого либо длинного текста в подводке\промпте звучит очень уместно для большого множества задачи.

Работу с длинным контекстом предполагают задачи QA, Reformulation, задачи ICL с few-shot примерами в подводке. Таким образом, если есть модель которая здорово работает с длинным контекстом, то мы сразу значительно лучше по метрикам чем модель которая не умеет в длинный контекст.

Идея с апишкой очень здравая и лично я конечное решение вижу тоже таким. Интересность в том что основная работа в этом и любом другом случае сконцентрирована вокруг попыток создать модель для работы с контекстом и в частности с длинным контекстом. По пути возникает много проблем связанных с робастностью моделей, максимально допустимым размером контекста и тем как эффективно модель его использует

UFO just landed and posted this here

Wesha Feb 8 at 22:27

Расширяем ограниченное представление о мире, которое модель

...И вот на этом можно остановиться и не читать: эти, прости госсди, исследователи, не понимают, с чем работают. Нет у LLM представления о мире — есть представление "какие токены человеки преимуществено выдают в ответ, когда видят вот такие токены".

-1

splav_asv Feb 9 at 10:16

А в чем, собственно, отличие? В том числе, именно так человеки и узнают о мире что-то новое.

Wesha Feb 9 at 10:36

Это у Вас какие-то очень-очень нетрадиционные человеки. Нормальный человек строит в голове модель (например "шарик-Земля обращается по орбите вокруг шарика-Солнца, при этом вращаясь вокруг своей оси"), после чего, представляя эту модель в голове, делает выводы: "раз шарик-Земля вращается вокруг своей оси, а Солнце всегда остаётся на месте (это ж упрощённая модель), то для находящихся на шарике-Земле наступает то свет, то тьма". LLM такие выводы не делает — она бездумно действуют принципу "человеки выдают то-то и то-то в ответ на токены "почему наступает ночь" — вот и я выдам то же самое". Назначение LLM "способности мыслить" — это типичная антропоморфизация, а на деле LLM проста как валенок.

Вы же не считаете, что коробочки с шариками мыслят? А ведь через какое-то время после начала обучения они начинают выигрывать!

splav_asv Feb 9 at 11:29

>Нормальный человек строит в голове модель (например "шарик-Земля
обращается по орбите вокруг шарика-Солнца, при этом вращаясь вокруг
своей оси"), после чего, представляя эту модель в голове, делает выводы:
"раз шарик-Земля вращается вокруг своей оси, а Солнце всегда остаётся
на месте (это ж упрощённая модель), то для находящихся на
шарике-Земле наступает то свет, то тьма". LLM такие выводы не делает —
она бездумно действуют принципу "человеки выдают то-то и то-то в ответ
на токены "почему наступает ночь" — вот и я выдам то же самое".
Назначение LLM "способности мыслить" — это типичная антропоморфизация, а
на деле LLM проста как валенок.

1) Есть слепые человеки, которые не могут сделать такого вывода сами. Приходится опираться на слова других.
2) Про многие понятия я знаю только из научных статей. Большую часть представления о мире я не получаю сам наблюдениями, а узнаю по записям других человеков. Да, задействованы другие органы чувств, но принципиально это же ничего не меняет.
3) Да даже если так (наблюдая), чем принципиально наблюдение за солнцем отличается от чтения дневника наблюдений человека?

> Вы же не считаете, что коробочки с шариками мыслят? А ведь через какое-то время после начала обучения они начинают выигрывать!
А я про мыслить ничего не говорил, только про представление о мире. В ящичках в конце хранится вполне сносное представление о том, куда правильно ходить.

Wesha Feb 9 at 11:35

В ящичках в конце хранится вполне сносное представление о том, куда правильно ходить.

Так про то и речь: в ящиках хранится готовый рецепт — а в человеке хранятся знания о том, как самому получить рецепт.

splav_asv Feb 9 at 12:08

Ну да. Представление о мире это именно рецепт.

Wesha Feb 9 at 12:58

Нет. Для того, чтобы успешно водить машину, вполне можно не иметь представление о том, что нажатие на педаль газа приоткрывает дроссельную заслонку, вызывая обогащение топливной смеси. Рецепт — это "чтобы ехать быстрее, нажми на газ". Представлене о мире — это "при нажатии на газ дроссельная заслонка сдвигается, что приводит к обогащению смеси", а с учётом знаний, что "обогащённая смесь в цилиндре взрывается сильнее", "сильные взрывы приводят к более быстрому вращению коленвала", "быстрее вращающийся коленвал быстрее вращает колёса", и "чем быстрее вращаются колёса, тем быстрее едет машина", этот рецепт можно вывести, даже не имея его изначально в обучающей выборке. LLM этого не могут.

SlimShaggy Feb 13 at 10:59

Я думаю у большинства людей (не автомехаников) "представление о мире" относительно машин выглядит именно как "когда нажимают на газ, машина едет быстрее"

Wesha Feb 13 at 11:13

Я вот ни разу не автомеханик, однако устройство автомобиля с достаточной степенью детализации класса так с третьего знаю.

И это у нас ещё ютуба не было!

LinkToOS Feb 9 at 18:15

представляя эту модель в голове, делает выводы: "раз шарик-Земля вращается вокруг своей оси, а Солнце всегда остаётся на месте

Вы бы не смогли сами догадаться что Солнце это большой шар, а Земля вращается вокруг него, и к тому же вращается вокруг оси. Эту информацию вы получили при обучении.

она бездумно действуют принципу "человеки выдают то-то и то-то в ответ на токены

Люди постоянно именно так и делают - выдают токены в ответ на токены. Прогоняя вопрос через память, выхватывают что-то ассоциативно связанное, и выдают ответ. А потом говорят - "А нет, я перепутал. Перельман - это ученый, а Марципан - это пианист. А нет, марципан - это вообще конфеты, а пианист это Мацуев." И чем меньше времени на ответ, тем больше ошибок. А уж то что люди любят выдумывать что-то, если не знают ответ, так это за милую душу, хлебом не корми. Такую ахинею несут, что любой gpt позавидует.

Wesha Feb 9 at 18:56

Вы бы не смогли сами догадаться что Солнце это большой шар, а Земля вращается вокруг него, и к тому же вращается вокруг оси. Эту информацию вы получили при обучении.

То есть это Вы так тонко намекаете, что либо Птолемей не был человеком, либо его обучил господь бог?

Вопрос не в том, что что (конкретный) человек до всего-всего-всего дошёл собственным умишком. Вопрос в том, что конкретный человек способен создать новое знание, никогда его ранее не изучав.

Характерный пример: Вы представляете, кто такой слон. Вы представляете, что такое стойка. Нарисуйте мне слона, делающего стойку на своём хоботе. Вы это сможете, хотя слона в такой позе никогда не видели. А нейросеть — не сможет.

IvanTes1 Feb 9 at 19:46

Ну, по данному примеру как раз-таки сможет) Это была буквально одна из ключевых рекламных позиций год назад, когда начинали активно продвигать генеративные нейросетки для создания изображений. Имея в памяти примеры того, как выглядят коты, кони, космос и скафандры, нейросетка способна "вообразить" и изобразить кота в скафандре, скачущего на коне в космосе) При том, что конкретно такую комбинацию никогда не "видела". Так же не секрет, что нейросети уже делают "открытия" в других сферах, например, предлагают новые химические соединения, которые ранее люди ещё не придумали. Так что с "придумыванием нового" у нейросетей нет особых проблем. Ключевая разница пока скорее в том, что человек может сам себе поставить цель - например, захотеть нарисовать слона на хоботе. А сетка ничего не "хочет", лишь пассивно ожидает промпт и исполняет его.

Wesha Feb 9 at 19:50

Ну если всё так просто — прекращайте рассусоливать и заставьте нейросеть нарисовать мне хотя бы две вещи из трёх — это же так легко!

IvanTes1 Feb 9 at 22:14

Слон стоит на хоботе - без проблем. Буквально со второй-третьей попытки вам и вид сзади, и вид спереди) Нейронка от майкрософт.

Медведь с пингвином на летнем пляже чокаются открытыми бутылками колы и пепси под заснеженными пальмами и т.д. - с первой попытки. Есть пара мелких недочетов типа надписей на бутылках, но с надписями у нейросетей всегда были проблемы, и в последнее время они уже по-тихоньку решаются, просто у меня нет желания платить 20 баксов за про-версии нейронок ради того чтоб доказать что-то в комментах) По сути все ключевые точки вашего запроса выполнены, и даже брендовые бутылки легко узнаваемы, не смотря на проблемный шрифт.

Вот только с Арни меня постигла неудача, ибо майкрософт не разрешает использовать настоящих людей и не позволяет изображения вредных привычек. На бесплатном Леонардо получилось достать молодого курящего Арни, но пачку в руке он упорно рисовать не хотел - возможно было мало примеров в датасете, на котором тренировали конкретно эту модель. От конкретной модели вообще многое зависит. Но, думаю, т.к. вы просили хотя бы два из трёх, будет достаточно и без молодого Арни.

И бонусом от меня - пару недель назад решил побаловаться и дал задание создать полурыбу-полунасекомое (назвал его саранчоусом - в промпте уточнил, что имеется в виду анчоус с крыльями саранчи). Получил вот такой результат. Как вы это объясните? Хотите сказать, что в обучающем датасете у этой нейросетки уже были саранчоусы, которых я буквально сам на ходу придумал? Или всё же этого достаточно, чтобы показать, что нейронки способны выдавать убедительные комбинации, которые сами ранее не "видели"?

Wesha Feb 9 at 23:28

Да, справедливости ради, пингвин с медведем получились — но слон имелся в виду настоящий, а не мультяшный, так что тут всё равно вес не взят. Однозначно прогресс, впрочем — Вы первый, кто смог. Что за сетка?

Желаете попробовать более сложное задание?

IvanTes1 Feb 9 at 23:56

Это DALL·E 3 (через сервис "Создатель изображений" в Bing / Copilot от майкрософт). Насчет настоящего слона, тут уж извините, стиль изображения указан в ТЗ не был) Но вот пара примеров реалистичного слона:

Конечно, не все сетки одинаково заточены под фотореализм, возможно какая-нибудь условная Миджорни справилась бы с настоящим слоном лучше, но мне кажется в целом неплохо

UFO just landed and posted this here

Wesha Feb 10 at 04:02

А вдруг получится мамонт, воспитанный опоссумами?

Wesha Feb 10 at 03:55

Я думал, что это очевидно: настоящий слон абсолютно точно не сможет устоять на одном хоботе (в отличие от всяких мультяшек и рисованных художниками картин), поэтому можно быть уверенным, что в обучающей выборке такого точно не было.

Однако в этом примере фотореалистичность провалена: у первого слона ЦТ тела не находится на прямой, проходящей через точку опоры (а вы что, думали, я зря попросил нарисовать слона с единственной точкой опоры?), а во второй — скелетная структура не позволит ему принять такую позу (конкретнее — передние ноги растопырены очень странно)

IvanTes1 Feb 10 at 10:03

Если честно, учитывая, что сам факт стояния многотонного слона на относительно тоненьком гибком хоботе уже нарушает законы физики и является, как вы верно подметили, абсолютно невозможным... то фотореалистичность провалена изначально самой идеей) Это как если бы создатель Астерикса и Обеликса сказал: "Стойте, Обеликс не может вот так сбоку держать известняковый блок, ведь каким бы сильным он ни был, но он весит 140кг, а блок - несколько тонн, его бы просто опрокинуло". Но так как идея сверхсильного человека изначально нереалистична, то на условности типа ЦТ кладётся болт) Так и с нашими слонами, никакая идеально выверенная балансировка не поможет зрителю поверить, что слон и впрямь по-настоящему стоит на хоботе. Раз он такое может, видать, сама сила гравитации над ним не властна)

Wesha Feb 10 at 10:40

Так и с нашими слонами, никакая идеально выверенная балансировка не поможет зрителю поверить, что слон и впрямь по-настоящему стоит на хоботе. Раз он такое может, видать, сама сила гравитации над ним не властна)

Плохая у Вас фантазия. Гастролирующий космоцирк со своим дрессированным слоном прилетел на Фобос, и в поселении-куполе слон показывает собравшимся космогорнякам чудеса эквилибристики, чего тут непонятного-то?

IvanKhakhalin Feb 9 at 19:26

Вы же не считаете, что коробочки с шариками мыслят? А ведь через какое-то время после начала обучения они начинают выигрывать!

Пока вы не определили, что значит "мыслить", ваше предложение не имеет смысла.

LLM такие выводы не делает

Почему вы решили, что LLM такие выводы не делает? Как вы это поняли?

Wesha Feb 9 at 19:52

Пока вы не определили, что значит "мыслить"

Да пожалуйста. Хотя строго говоря это моё определение "разума":

Делать наблюдения событий окружающего мира.
Строить модели устройства окружающего мира (той или иной степени достоверности)
На основе этих моделей строить а) вероятную картину происходившего в прошлом и б) предсказания поведения окружающего мира мира в будущем. Глубина, на которую делаются предсказания, определяет степень разумности: так, лисы могут делать предсказания на примерно 30-минут в будущее, а человек — на многие тысячи, а то и миллионы лет.

Как вы это поняли?

По результатам. У меня есть опыт реконструкции чёрных ящиков, знаете ли.

AlexKay28 Feb 14 at 16:36

Зачем антропоморфизация:

Это конечно очень интересная тема для обсуждения. Антропоморфизация, как мне кажется, достаточно удобный способ для пояснения происходящего и он никак не исключает математический способ интерпретации происходящего.

"...И вот на этом можно остановиться и не читать"
Возможно у Вас снова возникнет такое желание, но можно потерпеть ради того чтобы узнать что думают или как мыслят другие... продолжаем

Почему это имеет место быть в рассуждениях о том как работает ЛЛМ:

По терминам чуть-чуть:
МЫСЛЬ ж. всякое одиночное действие ума, разума, рассудка; представленье чего в уме; идея;

Генерируем (пишем) токены один за одним, т.е есть атомарность, дискретность, что кажется можно причислить к одиночному действию УМА*, РАЗУМА*, РАССУДКА*, представления чего-то в уме, это могут быть те заученные распределения вероятностей, высказывания идеи, чаще всего не собственной, но стохастично полученной.
Получается генерируем вероятное, узнаваемое, логичное, выводим по лекалам логично и с наибольшей вероятностью упорядоченные и связные высказывания извлекая их из памяти, из внутреннего представления, ума, делаем осмысленно и умышленно, формируем мысль одну за другой, выстраиваем поток мысли, мыслим.

УМ м. общее названье познавательной и заключительной способности человека, способность мыслить;
мне нравится: принимая ум в сем ограниченном, тесном смысле, можно сказать: умная лошадь, собака, но разумная, сказать нельзя.

ДУМАТЬ, думывать что или о чем, мыслить, размышлять, помышлять, доходить своим умом, судить, заключать про себя;

МЫСЛИТЬ, лю, лишь; несов. 1. Работой мысли, ума сопоставлять данные опыта и обобщать познанное. м. образами.

---

Думать, мыслить, узнавать, знать, обобщать познанное. Окееей, мы ведь довольно легально можем сказать что модели обладают обобщающей способностью по результату познанного в опыте, в процессе обучения, познания. Аналогично есть способы измерения знаний моделей, их способность к логическому выводу.

В отличии от человека, который за жизнь получает свой тип отклика от среды, мы можем попробовать утверждать что модель переживает отличный способ познания, скажем, через отклик в виде функции потерь.

Получается что мы определенным методом помещаем знания\опыт в модель на этапе предтрейна и что очень важно, благодаря тому как устроена ее архитектура, мы можем инициировать процесс получения знаний и комбинаций этих знаний в доступной нам форме, в форме доступного нам способа коммуникации - языка.

Процесс извлечения этих знаний мы можем пытаться улучшать (алайнмент) и контролировать (температура при семплинге, промпты, ICL, и тд тп...) аналогично тому как мы это делаем при общении с людьми.
Люди мыслят, модели имитируют мышление.

Одни и те же процессы, как минимум с одинаковым названием, можно осуществлять по разному:

Ездить на коне, имитировать поездку на коне при помощи машины?
Птицы, поршневые и реактивные самолеты немного по разному создают тягу благодаря которой они могут осуществлять процесс под названием полет, разве не так?

CoT, ToT это ведь отличные попытки имитировать процесс мышления... Разве мы, люди, не сходим образом мыслим?

И на подумать вот еще:

Георгий Петрович Щедровицкий (1929–1994) — советский и российский философ и методолог, общественный и культурный деятель.

Мышление по Г.П. Щедровицкому
Мышление. Принадлежит ли оно индивиду или оно принадлежит функциональному месту в человеческой организации и структуре? Я на этот вопрос отвечаю очень жестко: конечно, не индивиду, а функциональному месту! Утверждается простая вещь: есть некоторая культура, совокупность знаний, которые транслируются из поколения в поколение, а потом рождается - ортогонально ко всему этому - человек, и либо его соединят с этим самым духом, сделают дух доступным, либо не соединят. Мышление было положено как новая реальность в мир, реальность, отдельная от реальности материи и противостоящая ей. И было заявлено, что это особая субстанция, существующая в социокультурном пространстве. Тем самым был преодолен психологизм, или натурализм. Поскольку трактовка мышления как эманации человека и человеческого сознания есть, по моему глубокому убеждению, величайшее заблуждение европейской истории. И это то, что сегодня делает нас идиотами и мешает нашему развитию

Wesha Feb 14 at 23:03

можно потерпеть ради того чтобы узнать что думают или как мыслят другие

Можно потерпеть, чтобы узнать, как мыслят всякие там кришнаиты, зороастрийцы и т.п. — но зачем мне это знать? "Критерий истинности — опыт (тот, который эксперимент, а не тот, который жизненный)". Понимание основ механики позволило человеку построить рычажные механизмы. Понимание основ квантовой физики позволило человеку сделать светодиоды. Что прозволило сделать (в смысле реальное, что можно ручками пощупать) человеку понимание философии?

Пока, к сожалению, всё, что я видел в философии — это переливание из пустого в порожнее, размышления уровня "сколько ангелов уместится на кончике иглы". Где реальный, ощутимый выхлоп, я Вас спрашиваю?

AlexKay28 Feb 15 at 18:12

Философия нужна, как и все в этом мире, в меру.

Логика - раздел философии. Математика наука во многом построенная на абстракциях которые не проверить экспериментом. Поставьте эксперимент над временем или над пространством, скорее всего не получится, т.к это вещи созерцаемые.

Я считаю что не стоит относиться к философии как к чему то бесполезному. Это фундамент который лежит в основе многих наук, в том числе и естественных.

ovsale Feb 14 at 20:23

а как работает ваша модель ретривер? сколько у нее контекст? как вы на ее вход документы подаете? не понятно

AlexKay28 Feb 14 at 23:07

По сути своей работает как модель поиска на его последних уровнях. Это может быть обычная энкодер моделька по типу БЕРТа, с размером контекста в который влезает ожидаемый запрос, позволяющая получить эмбеддинг с которым мы ходим в индекс с целью найти наилучший подкрепляющий генерацию документ.

nikolay_karelin Apr 11 at 21:22

Меня несколько удивило вот это:

Когда база документов объёмная, локально искать близкие документы долго и тяжело.

Уже вот несколько лет как есть достаточно зрелые решения для векторных баз данных, и насколько я в курсе, Яндекс занимается своим векторным поиском тоже довольно давно...