Comments / Profile of stalkermustang / Habr

Котенков Игорь @stalkermustang

User

Profile Publications 7Comments 127Bookmarks 45

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 13:14

скорость выставили сами OpenAI, см. блок про индикации по 5ти бальной шкале

Look

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 13:13

Да, всё так. И контекст очень играет роль. Вероятность того, что модель начнет нести бред про конспирологические теории, растет, если дать промпт типа "сообщение на форчане в /pol:".

Суть алайнмента (обучения на фидбеке от людей в данном случае) в том, чтобы модель сама себя "промптила", то есть понимала, как ей отвечать, без таких уточнений, а в случае странных затравок - говорила, мол, я не могу сказать, что Земля плоская, потому что это не так. Вот 15 аргументов почему:

Look

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 13:11

Это кстати рабочий подход, лол. Есть статьи, которые показывают, как улучшают качество за счёт критика, который задает этот вопрос - чтобы модель сама себя исправляла. Не знаю, что пишет тут Тагир, возможно он работал куда больше с GPT-3.5, а не 4, и та была действительно тупее.

Look

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 11:41

Да, именно так. Это тесно перекликается с тезисом нашей прошлой статьи, где говорилось, что модели - вероятностные. И чтобы хорошо описывать наш мир (данные для обучения) - просто необходимо выучить, что условно 98% текстов про круглую Землю, но 2% - про плоскую.

И это приводит к некоторым неприятным последствиям. И как раз суть AI Alignment, среди прочего, в том, чтобы модель не страдала от таких вещей.

Look

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 11:08

Исправил обложку, не благодарите

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 13 2023 at 14:41

Именно в этом направлении сейчас движутся системы - модели "говорят" (в промпте), что если ты хочешь сделать X - перед этим напиш какой-нибудь тэг, типа <python>, потом регуляркой парсят ответ, и как только появился закрывающий тег - код вырезается из текста, вставляется в интерпретатор и отрабатывает, а результат дописывается в промпт. То же работает с api-вызовами, да хоть с чем. Поэтому модель, которая только "пишет" текст - фактически может делать всё что угодно, раздавая команды другим исполнителям как командный центр.

А про исправление ошибок - так пусть модель сама их будет понимать и предлагать решения! Прямо как человек. И это уже работает: https://t.me/denissexy/6822

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 12 2023 at 21:48

Возможно это появится в будущих версиях.

это можно запромптить уже сейчас, правда вызовы придется делать самому (то есть модель выдаст инпуты-аргументы, или код, а выполнить его надо на реальном пк)

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 12 2023 at 14:09

Нигде, как и указано в статье - OpenAI не публикует эти модели, только по API.

Сегодня увидел релиз открытой версии от другой команды, модель-аналог, можно попробовать поиграться с ней: https://t.me/seeallochnaya/160

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 12 2023 at 08:30

Это итеративный, но не непрерывный процесс. Модель генерит, скажем, 1000 пар ответов на случайный пулл вопросов (может и сама вопрос сгенерить, но я пока такого не видел). Это именно пары, чтобы можно было сказать, какой ответ лучше - первый или второй, и, собственно, на этом примере обучать модель предказывать тот ответ, который был оценен выше, с бОльшей вероятностью.

Потом как 1000 примеров размечены - модель на них дообучается, но тут штука в том, что всё сложнее под капотом: на самом деле помимо 1000 этих примеров с помощью хитрых трюков модель учится примерно на еще 10-20 тысячах сгенерированных ей самой ответов (и ею же оцененными).

После чего идет следующая итерация.

даст ряд созависимых ответов на похожие вопросы другим людям, что акции нужно срочно сливать. Таким образом акции начнут падать в цене и она даст мне ответ, что да, завтра стоит покупать.

поэтому такой сценарий считаю маловероятным. Тем более не ясно из примера, коким был фидбек на её ответ исходный - его нужно как положительный или как отрицательный рассматривать?

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 12 2023 at 08:25

Однако я отмечу, что судить по модели исходя из математики - очень наивно. Зачем модели уметь это делать, если она может пользоваться калькулятором? браузером? Использовать кожаных для удовлетворения своих потребностей?

https://t.me/seeallochnaya/83

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 12 2023 at 08:23

Все еще сложнее. Модель не знает, сколько букв в словах и сколько символов в цифрах. Дело в том, что на вход подаются и не слова, и не буквы - а нечто среднее между ними. Почитать про это подробнее можно в начале упомянутой в конце статьи (или в моем профиле чекнуть первую публикацию). Для нее "2014" будет одним словом, и в нем 4 символа, и "father" будет одним словом, в котором 6 букв. С английским модель +- понимает "длины" слов, и то путается, а в русском там вообще ужас .

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 10 2023 at 08:46

Если сильно упрощать, то все слова из некоторого словаря, скажем, размера 50k-100k можно закодировать 0 и 1: единица если слово есть, 0 - если нет. Тогда большинство коэффициентов на первом уровне будет (на первом слое нейросети) умножено на нуль и сократится. Помимо этого, чтобы порядок слов имел значение, аналогичная вещь существует и для соотнесения слова и позиции.

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 7 2023 at 21:21

Привет, нет, блоки как раз последовательно идут, каждый состоит из нескольких слоёв внутри.

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 7 2023 at 15:55

Я прошу прощения, а для каких бытовых вопросов надо давать такие запросы и получать соответствующие ответы, что они корректируются моделью и/или фильтром уже сейчас?

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 7 2023 at 09:08

да, это фейк чатгпт, которая в лучшем случае является тюном на русский язык открытых (маленьких) instruction-based моделей, но скорее всего просто тюном на диалог GPT-2/опенсурсных гпт. Жаль, что такое происходит - очень много рекламы и в тг, и на других ресурсах с буквальным обманом.

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 7 2023 at 09:06

Да, синтетический, я сначала писал текст, а потом загнал вопрос в чатгпт и даже приложил скрин (там он сам инструкцию придумал для решения по действиям, без указания на step by step). На редактуре мы вырезали, решив, что текста хватит. А потом и текст поправили, добавив мем. Уот так уот(

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 7 2023 at 09:04

Модель на триллион уже была, но она представительница "разреженных" (sparse) сетей со структурой "Микстура экспертов".

Мы этого не сказали в статье, но GPT состоит из одинаковых блоков, и они "стакаются" друг над другом - выход первого идет во второй, второй в третий и так далее - и таких слоев в больших моделях по сотне. В терминах нашего примера с уравнениями это типа y' = k1 * x + b1, y = k2(y')+b2, (два слоя, выход первого идет во второй). Каждый блок имеет свои параметры, разумеется - просто структура одинаковая.

Так вот микустура экспертов - это когда вместо каждого блока их, скажем, 100, но применяться будет всего 1 - и есть отдельная маленькая нейросеть (Router), которая предсказывает, какой из этих 100 лучше использовать. Самый просто способ про это думать - это что разные эксперты отвечают за разные языки и за разные области знаний. Если спросить на немецком про историю Берлинской стены - будет использовать эксперт номер 8, например, а если про Пушкина - номер 19. За счёт того, что эти блоки параллельные, их можно делать много, и это и приводит к триллиону параметров. Однако число параметров, используемых во время генерации, будет пропорционально количеству слоев, а не кол-ву слоёв*кол-во блоков (используем по 1 эксперту за раз)

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 7 2023 at 01:06

https://platform.openai.com/docs/guides/fine-tuning

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 6 2023 at 23:43

аххахах ахаххахахах точно! Исправили, спасибо) Не представляю, как ВСЕ это упускали из виду)

Look

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 6 2023 at 23:34

Там (пока) нельзя тюнить ChatGPT. В целом это логично - ведь она учится на оптимизацию фидбека, и такие данные в APi для дообучения не запихать просто так. там предлагается просто скинуть N файлов с plain-текстом и модель дообучится как GPT-2/3, просто предсказывать следующее слово.

Look

1 2 3 4

6 7