rk-helper Oct 15 2024 at 15:19

Построим GPT: с нуля и шаг за шагом

Easy

11 min

24K

Artificial IntelligenceMachine learning*

Review

+41

Comments 18

lazy_val Oct 15 2024 at 16:02

датасет

loss функцию

сделаем энкодинг

данных, которых не было в трэйн датасете

простой даталоадер

бейзлайн модели

несколько attention-голов

Статья на каком языке написана?

TerryChan2003 Oct 15 2024 at 16:19

Ранглишь

Wesha Oct 15 2024 at 16:21

Статья на каком языке написана?

Есть такое слово — рунглиш...

Покупатель: Мне полпаунда свисс-доу-фетного творогу.
Продавец: Тю!.. То разве ж творог - Свисс лоу-фетный? То ж чиз!
Покупатель (удивляясь): Чиз?
Очередь (в нетерпении): Чиз, чиз! Не задерживайте, люди же ждут.
Покупатель (колеблясь): Ну свесьте полпаунда чизу.
Продавец: Вам послайсить или целым писом?

Продавец: Фиш свежайший, малосольный салмон, к нам аж с Филадельфии ездиют.
Покупатель: А джус вон тот строберри, - что, немецкий?
Продавец: джус польский. А вот язык, очень рекомендую, - шо-то исключительное.
Покупатель: Та он в аспике?
Продавец: Ну и шо, што в аспике?! Шо, что в аспике?! Мы его сами дома с удовольствием кушаем.

Жена мужу: "Из драйвэя сразу бери направо, на следующем огне будет ю-терн, бери направо, бери его и пили две мили до плазы. За севен-элевеном опять направо, через три блока будет экзит, не пропусти. Номера у него нет, но это не тот экзит, где газ, а тот, где хот-дожная".

— Дай квотер, я митер подкормлю.

— Купи диллу пучок, силантро пучок, два лика.
— Кто это лик?
— Черт его знает. На нем лейбел: лик.

Krasnoarmeec Oct 15 2024 at 17:28

Довлатов, "Встретились, поговорили":

Моя жена спросила тихо:
— Почему Рон Фини этого не делает?
— Чего?
— Не путает английские слова и русские?
Я ответил:
— Потому что Фини в совершенстве знает оба языка…

lazy_val Oct 15 2024 at 17:31

вы поедете без меняния пересядок

Маяковский "Мое открытие Америки"

Сто лет прошло, ничего не меняется

Myself12 Oct 15 2024 at 18:52

На понятном :-)

UFO landed and left these words here

codecity Oct 15 2024 at 17:29

Спасибо. Интересно было бы с русским текстом каким, может Пушкина того же. А то Шексира не все могут прочувствовать.

buyyes Oct 21 2024 at 05:47

Когда эта лекция Карпаты выходила, я как раз на Пушкине обучал, оказалось его очень мало, вышла полная хрень. Но было интересно

alexhu Oct 15 2024 at 20:03

Весной и летом делал примерно такие же опыты, с такими же результатами - на авторские произведения совсем не похоже. Конечно, у меня мизерные машинные ресурсы, относительно небольшие датасеты - всё равно мой результат не тянет даже на "pet" решение и похож на приведённый в посте. Направление решения я понял, только реализовывать их можно на масштабах таких же как и OpenAI, с их масштабами ресурсов.

RodionGork Oct 15 2024 at 22:33

на небольшом датасете всех произведений Шекспира... в датасете содержится около миллиона символов

это подозрительно :) должно быть в несколько раз больше

за познавательную статью спасибо, хотя не 100% понятно насколько она относится к GPT

maxcat Oct 15 2024 at 23:25

А какие требования к железу?

dmiche Oct 16 2024 at 00:40

Чего-то у вас к концу ленту зажевало.

Куда MultiHeadAttention()-то вставлять? В примере Вы снова биграммы трените.

fixik_21 Oct 16 2024 at 07:18

Спасибо за статью! Если у кого есть хорошие (проверенные) аналогичные примеры, закиньте плиз в комменты, пытаюсь тоже делать такие штуки, но пока не очень выходит(

shadrap Oct 16 2024 at 08:02

спасибо! отличная статья. мне кажется не раскрыта тема коррекции обучения.

Kingas Oct 16 2024 at 16:36

Интересная статья. Для экспериментов прикольно.

Интересно ещё в какую сторону можно развивать даже такую простую модель, чтобы повысить качество результата.

koreychenko Oct 20 2024 at 06:44

А можно поинтересоваться почему для этой задачи автор выбрал букву, а не слово, как наименьшую единицу данных? Если бы он тренировал на словах, то у него не было бы в результате "несуществующих" слов. (Я не специалист, сильно не пинайте)

Входной словарик был бы побольше, конечно.

pese Oct 20 2024 at 11:50

Возможно, потому что нет полного словаря всех английских слов. Я о том, что c течением времени появляются новые слова.