Pull to refresh
13
-1
Maksim@mDOGx

Пользователь

Send message

От вайб-проверок к регрессии: зачем LLM-фичам нужны quality gates в CI

Level of difficultyMedium
Reading time4 min
Reach and readers3.9K

На демо всё выглядит нормально. Промпт аккуратный, ответы связные, JSON парсится, никто не задаёт вопросов. Несколько прогонов спустя — всё ещё работает. Релизим.

Через неделю тот же самый запрос три раза подряд возвращает некорректный ответ. Не так, чтобы всё упало. Просто достаточно, чтобы сломать downstream парсер и разбудить кого-то в два часа ночи. Ничего драматичного. Просто отказ, который повторяется достаточно часто, чтобы начать мешать.

Этот сценарий возникает снова и снова не потому, что команды некомпетентны. Проверка “на глаз” кажется разумной. LLM-фича не падает с исключением, не даёт stack trace, не нарушает очевидных инвариантов. Таблицы expected output здесь не существует. Истину проверить нельзя — проверяют правдоподобие. Ответ звучит нормально, структура в целом держится, а edge cases выглядят академическими.

Есть и культурный зазор. CI вырос вокруг детерминированного кода: фиксированные входы, выходы, которые либо совпадают, либо нет. LLM-фичи выглядят как интерфейсы, но ведут себя как стохастические сервисы с памятью. В ответ команды делают то, что умеют: несколько ручных прогонов, пара промптов в стейдже, галочка “ок”. Это не халатность, а привычная реакция на систему, которая при первом контакте выглядит вежливой и стабильной.

Ломается всё не на демонстрации. Ломается на повторении, дрейфе и накоплении мелких изменений. В промпте сдвинули запятую. Обновилась модель. Temperature подкрутили с 0.2 до 0.4 “для живости”. Прогоните это пятьдесят раз — и картина меняется.

Читать далее

Наш программируемый мозг. Часть вторая

Reading time4 min
Reach and readers6.5K
Итак, мы условно разделили весь процесс эволюции человечества на 8 этапов, которые, в свою очередь, в ходе собственного индивидуального развития проходит каждый разумный примат. Подобное разделение может казаться натянутым, но оно является удобной моделью и ничем больше. Эволюция не настолько простое и быстрое явление, чтобы быть описанным в 3-5 пунктах, а более подробное разделение думаю заинтересует не всех читателей)
Скорее дальше.

Наш программируемый мозг. Часть первая

Reading time2 min
Reach and readers8.6K
Думаю многим будет интересна теория строения сознания человека от признанного гуру психоделической революции Тима Лири, и Роберта Антона Уилсона, эту теорию расширивший и во многом способствующий её распространению.

Рассмотрим наше сознание как биокомпьютер, имеющий программное и аппаратное обеспечение. Сознание не является компьютером, а лишь моделируется, что вполне допустимо. Аппаратная часть представлена собственно мозгом, вспомогательной нервной сетью и прочей периферией, достаточно изученными в современной науке.

БОльший интерес представляет программная составлющая — оно не только «находится в мозгу», но и вне его — в форме книги, хранящей сигналы давно умерших людей или статьи на хабре, где находятся сигналы людей здравствующих. Вообще программное обеспечение человека состоит из всех сигналов когда-либо проходящих через мозг. Будь сознание только неупорядоченным вневременным комком подобных сигналов, у нас не было бы ни индивидуальности, ни пресловутого «Я».
Читать дальше →

Information

Rating
Does not participate
Location
Польша
Registered
Activity