Articles / Profile of mDOGx / Habr

Maksim@mDOGx

Пользователь

ProfileArticles5PostsNewsComments145

mDOGx Dec 16 2025 at 09:20

От вайб-проверок к регрессии: зачем LLM-фичам нужны quality gates в CI

Medium

4 min

IT systems testing *

Opinion

На демо всё выглядит нормально. Промпт аккуратный, ответы связные, JSON парсится, никто не задаёт вопросов. Несколько прогонов спустя — всё ещё работает. Релизим.

Через неделю тот же самый запрос три раза подряд возвращает некорректный ответ. Не так, чтобы всё упало. Просто достаточно, чтобы сломать downstream парсер и разбудить кого-то в два часа ночи. Ничего драматичного. Просто отказ, который повторяется достаточно часто, чтобы начать мешать.

Этот сценарий возникает снова и снова не потому, что команды некомпетентны. Проверка “на глаз” кажется разумной. LLM-фича не падает с исключением, не даёт stack trace, не нарушает очевидных инвариантов. Таблицы expected output здесь не существует. Истину проверить нельзя — проверяют правдоподобие. Ответ звучит нормально, структура в целом держится, а edge cases выглядят академическими.

Есть и культурный зазор. CI вырос вокруг детерминированного кода: фиксированные входы, выходы, которые либо совпадают, либо нет. LLM-фичи выглядят как интерфейсы, но ведут себя как стохастические сервисы с памятью. В ответ команды делают то, что умеют: несколько ручных прогонов, пара промптов в стейдже, галочка “ок”. Это не халатность, а привычная реакция на систему, которая при первом контакте выглядит вежливой и стабильной.

Ломается всё не на демонстрации. Ломается на повторении, дрейфе и накоплении мелких изменений. В промпте сдвинули запятую. Обновилась модель. Temperature подкрутили с 0.2 до 0.4 “для живости”. Прогоните это пятьдесят раз — и картина меняется.

-1

mDOGx Aug 19 2013 at 06:49

Упражнение n-back

2 min

141K

GTD *

Расскажу немного об упражнении для развития концентрации и кратковременной памяти.

+16

mDOGx Feb 24 2010 at 21:29

Наш программируемый мозг. Часть третья

4 min

3.1K

Popular scienceBrain

Мы продолжаем рассматривать теорию строения сознания и его программирования от Тимоти Лири и Роберта Уилсона (РАУ).

Подробнее...

mDOGx Feb 22 2010 at 10:17

Наш программируемый мозг. Часть вторая

4 min

6.6K

Popular scienceBrain

Итак, мы условно разделили весь процесс эволюции человечества на 8 этапов, которые, в свою очередь, в ходе собственного индивидуального развития проходит каждый разумный примат. Подобное разделение может казаться натянутым, но оно является удобной моделью и ничем больше. Эволюция не настолько простое и быстрое явление, чтобы быть описанным в 3-5 пунктах, а более подробное разделение думаю заинтересует не всех читателей)

Скорее дальше.

+10

137

mDOGx Feb 20 2010 at 20:23

Наш программируемый мозг. Часть первая

2 min

8.7K

Popular scienceBrain

Думаю многим будет интересна теория строения сознания человека от признанного гуру психоделической революции Тима Лири, и Роберта Антона Уилсона, эту теорию расширивший и во многом способствующий её распространению.

Рассмотрим наше сознание как биокомпьютер, имеющий программное и аппаратное обеспечение. Сознание не является компьютером, а лишь моделируется, что вполне допустимо. Аппаратная часть представлена собственно мозгом, вспомогательной нервной сетью и прочей периферией, достаточно изученными в современной науке.

БОльший интерес представляет программная составлющая — оно не только «находится в мозгу», но и вне его — в форме книги, хранящей сигналы давно умерших людей или статьи на хабре, где находятся сигналы людей здравствующих. Вообще программное обеспечение человека состоит из всех сигналов когда-либо проходящих через мозг. Будь сознание только неупорядоченным вневременным комком подобных сигналов, у нас не было бы ни индивидуальности, ни пресловутого «Я».

Читать дальше →

+24