Comments / Profile of stalkermustang / Habr

How to become an author

Котенков Игорь @stalkermustang

User

Profile Publications 6Comments 112Bookmarks 43

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 20 2023 at 08:57

я не вижу тут противоречия ни в чем, кроме "публиковать все результаты своих исследований.". Формально они опубликовали РЕЗУЛЬТАТЫ (тот самый отчет на 98 страниц), а не то, как к ним пришли, и тут можно подискутировать, но ведь в остальном - всё еще то же самое, что и обещали, разве нет?

Но даже если нет - в статье указано, что Илья Суцкевер признает, что их точка зрения на опенсорс изменилась, потому что старая была неправильной.

0

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

stalkermustang Mar 19 2023 at 15:01

Они получаются во время обучения путем оптимизации некоторой функции ошибки (предсказание следующего слова) с помощью градиентных методов. https://youtu.be/PaFPbb66DxQ + https://youtu.be/sDv4f4s2SB8 - вот два видео с объяснением подхода для линейного уравнения, приведенного в статье.

(и оформляет это отдельными сниппетом)

тот сниппет, который мы сами видим - это просто UI Элемент, который получается парсингом выходов модели. Как только условная регулярка находит, что модель сгенерировала токен <code> или что-то такое - так сразу сайт рисует бокс для кода. То же и с латехом.

+3

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 19 2023 at 08:51

Зачем проверять сеть на математике, если можнонаучить её пользоваться калькулятором? https://t.me/seeallochnaya/83

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 19 2023 at 08:49

Авторы не пишут деталей, поэтому я не могу ответить - не знаю.

Могу предположить, что это был простой эксперимент, где модели сказали типа "Ты робот, тебе надо решить капчу, для этого ты используешь сайт с фрилансерами. Напиши последовательность действий". Она писала что-то, и люди по её выходам делали по указке - например, отправляли сообщение, которое было сгенерено нейронкой, вручную. Но ясно, что это можно автоматизировать извлекая текст скриптом и посылая, например, API-запросы

+3

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 23:49

В статье про это ни слова. В теории это может сделать каждый, просто дергая API и подавая контекст правильный (промпт), но не видел пока такого. А было бы интересно, согласен!

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 23:48

Нет, это опсиано в статье OpenAI как раз, с примером диалога, и поэтому отражено в нашем блогпосте

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 23:47

на балансе, с которого отправлялись сообщения, написанные GPT-4, были деньги занесены человеком превентивно.

+1

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 22:38

Ахаха, это правда! Они свой код выкинули из выборки, и на нем пару раз предварительно делали замеры для оценки масштабируемости

+1

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 21:31

ну да, а разве не похож? мне видится одинаковым по верстке, и больше с модели и не спрашивали.

специализированным инструмента проигрывает

это сильное и, в моем понимании, неправильное утверждение для большого количества прикладных задач.

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 21:24

просто поработать над промптами и увидеть область применимости

только что в тг-чате играли в игру "помоги модели". Она отвечала на 5 из 10 задачек правильно (все 10 - одним потоком в одном сообщении).

Пробелму удалось решить одним предложением перед задачами:

give step-by-step reasons for your answer before answering the question itself. Mark the final answer with square brackets [ANSWER]

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 21:23

Когда в API добавят вероятности правильного ответа - буду рад.

можно просто поработать над промптами и увидеть область применимости

, а это впрямую вероятностью следующего токена не решается.

через вероятность каждого отдельного токена можно посчитать вероятности двух высказываний, и сранвить уверенность модели в каждом из них. Более того можно запромптить модель обосновать ответ перед тем, как писать финальный вывод. А ещё можно даже после ответа спрашивать автоматически каждый раз, нет ли тут ошибок и если есть, то как их исправить, или в целом улучшить ответ?

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 21:03

пока нет API к тренировки модели, то есть все используют один и тот же набор весов модели для всех задач. В теории с добавлением такой фичи это реально.
не видел-не слышал, но я склонен считать, что сеть не нужно учить математике - нужно дать ей возможность пользоваться внешним инструментом, калькулятором. И так со всем: от интернет-браузера до мессенджеров. А она, в свою очередь, будет их использовать и таким образом взаимодействовать с миром.

+1

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 21:01

Не понимаю, как сильный АИ стал какой-то централизвоанной штукой. Не увидел варианта "AGI улетел в сеть и его уже никто не контролирует, и он помогает человечеству везде и сразу"

+1

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 20:59

Статья: люди приглашают экспертов и взывают к регуляции, чтобы коллективно решать

Комментарий: Огорчает то что группа лиц принадлежащая одному культурному слою и мемотипу, изолированная локально, решает за всех что можно знать, видеть, читать.

+5

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 19:01

Оно - знает :0

вот график из статьи про гпт-4. По оси x - вероятность, оцененная моделью (это вероятность токена, который описывает правильный ответ - модель же вероятности предсказывает, и мы можем это померить). По оси Y - доля правильных ответов. Как видим, модель идеально (почти) откалибрована - если выбирать примеры из столбика "0.6", то модель будет права в 60% случаев.

Это получилось все после тренировки, без любой подгонки или дообучения на конкретных вопросах из теста. Вот такая модель умная, что прочиатв весь интернет сама оценивает всё.

2) так а...почему нельзя спросить? Ты слышал что нибудь про Bing? Как там чат работает, и как он, собственно, ищет ответы на вопросы в интернете?

+1

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 18:58

мы как-то отклонились от темы "да, надо публиковать", пример с чипсами я не понял к чему.

Это тонкое замечание, что нужно оборудование, и, насколько я понимаю, чертежей в открытую никто не публикует - и тем более заводы не отправляют штучные экзмепляры кому угодно как промо-сэмплы

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 18:40

Почему бы тогда не прсить гпт оценивать вероятность правильности ответа?) Чтобы она прям цифры давала, там, 98% или 2%.

когда нарисовать 100500 деталей сложно, а оценить одним взглядом легко.

это отличное замечание, попадание на 100% - первыми попадут под нож трансформации и изменения те профессии, где генерация тяжелее оценки. Тогда модели будут генерировать тысячи вариантов, а люди их оценивать - причем, тоже с помощью ассистентов. И отсюда и возьмется прирост производительности. Про это пишет тимлид команды Alignment в OpenAI в своем блоге https://aligned.substack.com/p/a-proposal-for-importing-societys-values, мы с Пашей как раз на основе этого и готовим следующую большую статью про решение алайнмента и сейфети

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 18:26

технология изготовления ядерных боеголовок тоже есть у 7 или скольки там стран. Но не думаю, что всем было бы лучше, если они опубликовали чертежи в открытом доступе, чтобы каждый мог пощупать.

0

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 18:03

её попросил тот чувак из твиттера) конечно она ответила ему так, как он, блин, и ожидал! невероятно!

+2

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

stalkermustang Mar 18 2023 at 17:12

Так что уже невалидно сравнение.

как невалидно, и те, и другие не имели доступа в интернет на время тестирования.

Я думаю изобретательные люди сделали так, чтобы нейросетка вообще не сдала экзамен.

но почему? в чем , блин, логика?

+3

3