Комментарии / Профиль NagaevDen / Хабр

Денис Нагаев@NagaevDen

CTO OSMI IT

Рейтинг

Как я дообучал модель на своих текстах после провала статьи на Хабре

Да, “быстрее” не должно значить “хуже”. Но научная статья и пост на Хабре - разные жанры. На Хабре ценность часто в практическом опыте: что пробовали, где ошиблись, какие выводы сделали. И постить апдейты статей, которые появляются в процессе - тоже ок. Поэтому такой формат интереснее и аудитория Хабра шире, чем у научных журналов.

Как я дообучал модель на своих текстах после провала статьи на Хабре

NagaevDen 3 мая в 11:54

Само собой 1 хорошая статья лучше 10 проходных. Цель не в том, чтобы писать больше, а в том, чтобы быстрее доходить до нормального качества: собрать фактуру, не потерять мысль, убрать воду. Если на выходе посредственно — виноват не ИИ, а косячит процесс и значит, что его нужно дорабатывать дальше. Даже чисто для эксперимента

Как я дообучал модель на своих текстах после провала статьи на Хабре

NagaevDen 2 мая в 07:55

Согласен, обмен сгенерированными полотнами текста вместо нормальной коммуникации — плохой сценарий. Поэтому LLM — это не замена мышления, а помощник, чтобы структурировать, проверить слепые зоны. Ответственность за смысл и решения все равно на человеке.

Как я дообучал модель на своих текстах после провала статьи на Хабре

NagaevDen 30 апр в 08:34

Брали gpt5.4-mini и дотюнили ее через их ЛК

У нас есть джун, и мы его учим

NagaevDen 3 мар в 14:23

Джун он пайтон разработчик и не знает как создавать LLM-приложения. Соответственно в этом и заключается смысл – быстро переквалифицировать его в этом направлении

У нас есть джун, и мы его учим

NagaevDen 1 мар в 16:35

В нашем случае потребовалось полтора месяца до момента, когда он смог приносить коммерческую выгоду. Речи о благотворительности в статье не было)

Как выбрать между облаком, арендой GPU и своим железом для LLM-систем

NagaevDen 4 дек 2025 в 13:13

Mac Studio — ок вариант, согласен. Для локальных экспериментов, пэт проектов и маленьких команд удобно и выгодно. Но в статье у меня другой сценарий на ~100 000 диалогов в день. Тут и требования по SLA, отказоустойчивости, масштабированию. Там не столько "настроить за 5 минут" надо, а параллельность, управляемость и стоимость токена при росте трафика обеспечить.

Как выбрать между облаком, арендой GPU и своим железом для LLM-систем

NagaevDen 4 дек 2025 в 13:11

4090/5090 дешевле, но это другой класс железа уже. Памяти меньше, нужен шардинг по нескольким GPU и больше компромиссов по надёжности. Поэтому в табличку сознательно не добавил