Обновить
13
-1
Maksim@mDOGx

Пользователь

Отправить сообщение

От вайб-проверок к регрессии: зачем LLM-фичам нужны quality gates в CI

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели3.9K

На демо всё выглядит нормально. Промпт аккуратный, ответы связные, JSON парсится, никто не задаёт вопросов. Несколько прогонов спустя — всё ещё работает. Релизим.

Через неделю тот же самый запрос три раза подряд возвращает некорректный ответ. Не так, чтобы всё упало. Просто достаточно, чтобы сломать downstream парсер и разбудить кого-то в два часа ночи. Ничего драматичного. Просто отказ, который повторяется достаточно часто, чтобы начать мешать.

Этот сценарий возникает снова и снова не потому, что команды некомпетентны. Проверка “на глаз” кажется разумной. LLM-фича не падает с исключением, не даёт stack trace, не нарушает очевидных инвариантов. Таблицы expected output здесь не существует. Истину проверить нельзя — проверяют правдоподобие. Ответ звучит нормально, структура в целом держится, а edge cases выглядят академическими.

Есть и культурный зазор. CI вырос вокруг детерминированного кода: фиксированные входы, выходы, которые либо совпадают, либо нет. LLM-фичи выглядят как интерфейсы, но ведут себя как стохастические сервисы с памятью. В ответ команды делают то, что умеют: несколько ручных прогонов, пара промптов в стейдже, галочка “ок”. Это не халатность, а привычная реакция на систему, которая при первом контакте выглядит вежливой и стабильной.

Ломается всё не на демонстрации. Ломается на повторении, дрейфе и накоплении мелких изменений. В промпте сдвинули запятую. Обновилась модель. Temperature подкрутили с 0.2 до 0.4 “для живости”. Прогоните это пятьдесят раз — и картина меняется.

Читать далее

Наш программируемый мозг. Часть третья

Время на прочтение4 мин
Охват и читатели3.1K
Мы продолжаем рассматривать теорию строения сознания и его программирования от Тимоти Лири и Роберта Уилсона (РАУ).

Подробнее...

Наш программируемый мозг. Часть вторая

Время на прочтение4 мин
Охват и читатели6.5K
Итак, мы условно разделили весь процесс эволюции человечества на 8 этапов, которые, в свою очередь, в ходе собственного индивидуального развития проходит каждый разумный примат. Подобное разделение может казаться натянутым, но оно является удобной моделью и ничем больше. Эволюция не настолько простое и быстрое явление, чтобы быть описанным в 3-5 пунктах, а более подробное разделение думаю заинтересует не всех читателей)
Скорее дальше.

Наш программируемый мозг. Часть первая

Время на прочтение2 мин
Охват и читатели8.6K
Думаю многим будет интересна теория строения сознания человека от признанного гуру психоделической революции Тима Лири, и Роберта Антона Уилсона, эту теорию расширивший и во многом способствующий её распространению.

Рассмотрим наше сознание как биокомпьютер, имеющий программное и аппаратное обеспечение. Сознание не является компьютером, а лишь моделируется, что вполне допустимо. Аппаратная часть представлена собственно мозгом, вспомогательной нервной сетью и прочей периферией, достаточно изученными в современной науке.

БОльший интерес представляет программная составлющая — оно не только «находится в мозгу», но и вне его — в форме книги, хранящей сигналы давно умерших людей или статьи на хабре, где находятся сигналы людей здравствующих. Вообще программное обеспечение человека состоит из всех сигналов когда-либо проходящих через мозг. Будь сознание только неупорядоченным вневременным комком подобных сигналов, у нас не было бы ни индивидуальности, ни пресловутого «Я».
Читать дальше →

Информация

В рейтинге
Не участвует
Откуда
Польша
Зарегистрирован
Активность