Комментарии / Профиль stalkermustang / Хабр

он не обучается между запросами, просто работа алгоритма не зафиксирована предварительно. Даже для одного и того же запроса модель может сгенерить сотню разных (с точки зрения формулировки и цепочки рассуждений, но не обязательно финальных результатов) ответов.

вопрос в том, как часто в этих разных генерациях получаются правильные ответы. Одно дело 999/1000, другое — 3 из 5 (то есть 40% ошибок).

Посмотреть

ЧГК-GPT, или насколько хорош новый ChatGPT o1-preview в спортивном «Что? Где? Когда?»

stalkermustang 18 сен в 12:39

Поддержу этот коммент с ИИ-стороны. Мне кажется превосходство o1 как раз берётся за счёт того, что она не просто из головы факты достаёт (размер знаний у неё скорее всего такой же, как у gpt4o), а умеет их совмещать, и если картинка не складывается, то искать ещё и ещё варианты (зацепки). И потом приходит к озарению, что вот, этот вариант под всё подходит, значит, ответ готов.

Посмотреть

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

stalkermustang 18 сен в 11:43

Модель ведь не обучали с нуля только на цепочках рассуждений. Сначала, как и раньше, ей нужно было передать знания и заставить запомнить статистические зависимости между токенами, обучив на текстах интернета. Оттуда и остались эти "хммм". Лишняя трата ресурсов, от которой модель не смогла избавиться. Есть подозрение, что это вообще не новая модель, а только файн-тюнинг старой.

да, с этим я согласен, то есть она язык-то выучила по книгам и интернету. Я говорю, что если бы её тюнили только на написанных специально нанятыми экспертами цепочками рассуждений, то такие артефакты бы ушли почти наверняка.

Интересно, а почему нельзя добиться того же за один проход подстройкой параметров генерации вроде температуры или топ-к?

думаю причина — в дереве генераций токенов. Вариантов написать предложение из 10-20 токенов ОЧЕНЬ много, и мы стараемся делать более-менее качественную генерацию через семплинг токенов на каждом шагу, считая, что поулчается неплохо. Но если мы переберем больше комбинаций — будет еще лучше.

Посмотреть

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

stalkermustang 18 сен в 11:24

Справедливости ради там не написано, что оно делает перебор всех состояний. Играть "до конца" можно текущей стратегией в упрощённом виде + эвристикой, да даже делая случайные ходы.

Посмотреть

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

stalkermustang 18 сен в 11:12

Да, и цена на модель пока кусается, но на GPT-4 за полтора года с момента релиза уронили цену более чем в 5 раз (а модель при этом улучшилась). Нет оснований полагать, что и тут не произойдет то же самое.

Плюс, многие компании работают над специальными ускорителями, которые как GPU, но заточены конкретно под одну архитектуру. Сами OpenAI точно хотят делать свои чипы и даже ведут переговоры с компаниями-производителями/поставщиками. Чипы не появятся завтра или до конца года, но на горизонте 5 лет мы точно увидим существенное ускорение + удешевление даже при условии того, что модели будут и больше, и дороже.

Посмотреть

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

stalkermustang 18 сен в 10:35

Я думал написать так, но мне кажется это слово не передаёт смысла. Кто мыслитель, что мыслитель...

Посмотреть

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

stalkermustang 18 сен в 10:18

Думаю, тут всё же другая интерпретация. Скорее всего модель просто немного подзабыла, как те задачи хорошо решать, потому что последние итерации обучения были сугубо на математику/физику/программирование. Эти навыки как бы немного вытеснили работу с текстом, отчего качество просело.

Также думаю, что в продуктовой линейке моделей GPT (4.5 или 5) это пофиксят, то есть сделают так, что модель и в выбранных топиках сильно лучше (как o1), и в на других задачах немного, но прирастает.

о1 это в некотором смысле всё же прототип технологии обучения и работы, который ещё обкатывают.

Посмотреть

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

stalkermustang 15 сен в 23:05

Самый умный в классе был? :)

Посмотреть

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

stalkermustang 13 сен в 14:22

:(((((

Посмотреть

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

stalkermustang 13 сен в 01:51

Думаю, хорошее место чтобы начать (после прохождения курса) - это вот тут. Несмотря на то, что указано, что outdated - многое всё еще актуально.

Посмотреть

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

stalkermustang 13 сен в 01:49

БРАААААААААААААААААААААТ ПРОСТИ Я СЛУЧАЙНО, я просто мимо тыкнул. Не вижу, как отменить или снять...... сорян(((

написал в поддержку, чтобы это исправить, надеюсь, помогут и отменят.

Посмотреть

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

stalkermustang 11 сен в 17:21

Перспектива есть, вот один шаг был описан в статье, где мы отслеживаем внимание модели и проверяем, что оно указывает на реальный текст, а не на <start of sentence>

С внутренними знаниями тема сложнее, но прогресс ожидаю. И думаю, что масштабирование LLM тоже уменьшит величину проблемы — то есть от GPT-5 стоит ждать сподвижек.

Посмотреть

2 3 ...

7 8