LLM передают ИИ в руки гуманитариев / Хабр

Встреча с Богом (х/ф "Космическая Одиссея 2001")

"Большие языковые модели сегодня — это не просто самые продвинутые алгоритмы машинного обучения. Это новый культурный феномен, меняющий саму природу взаимодействия человека и машины. Они стали тем самым "философским камнем", который превращает слова в код, идеи в функции, а гуманитарные знания — в работающие приложения." -- Gemeni 2.5 Pro

Все годы развития машинного обучения это была территория сугубо технарей. Гуманитарий мог приобщиться к святая святых, только став разметчиком или, в лучшем случае, продакт-менеджером.

Магию творили технари, разработчики, программисты и жрецы высшего уровня — дата-сайентисты (в одном из моих проектов внешний подрядчик называл технического специалиста, разрабатывающего и обучавшего модели, не иначе как "ученый": "Наш ученый посмотрит данные", "наш ученый оценит признаки").

У магов были свои котлы с волшебным зельем, амулеты и магические ингредиенты:

Котлы — это базы для хранения озер, морей и даже океанов данных.
Ингредиенты — признаки: бинарные, номинальные, категориальные, количественные.
Амулеты — алгоритмы, от завораживающей слух непосвященных логистической регрессии до совсем непостигаемых бустингов и стеккингов. Волшебные леса решающих деревьев и загадочные Support Vector Machines.

Маг и чародей — дата-сайентист брал волшебный посох, навешивал на него амулеты, подсыпал в свои котлы ингредиенты и творил волшебство. Что-то бормотал на языке магии, уходящем корнями в древнюю латынь: accuracy, precision, recall, F-мера, roc-auc... давая непосвященным почувствовать всю глубину своего невежества. Бизнес получал (если получал) приросты показателей (подписок, продаж, переходов, увеличение жизни пользователя в приложении, виральности и прочее-прочее), а гуманитарии осознавали всю глубину своей никчемности.

В области компьютерной лингвистики, или, как это модно называть на "аглицкий манер", NLP (слово "процессинг" придает современности, молодежности и шарма устаревшему термину "лингвистика"), все началось с tf-idf, пробежало через BM25, перепрыгнуло LSI, LDA, воодушевилось word2vec, затем doc2vec, повозилось с CNN и с LSTM. А потом, как явление богов, появились "Трансформеры". В эту эпоху еще на недосягаемом Олимпе блистали "технари", но их низвержение было уже предопределено.

Трансформеры быстро проскочили BERTы, T-5 с их сотнями миллионов и единицами миллиардов параметров, GPT-2 , GPT-3 в максимальном размере имеющая 175 млрд параметров. И когда слабые духом заволновались, почувствовав в заморозке метрик качества при росте параметров моделей признаки новой "зимы Искусственного Интеллекта", появилась она: ChatGPT! (как бог в "Космической одиссее 2001"). Или GPT-3 .5, как скромно ее назвали создатели. С момента ее появления размер моделей перевалил за половину триллиона параметров и, возможно, перевалит за триллион (но не будем торопиться).

А обучение сетей и даже адаптеров вдруг заменилось на написание промтов, т. е. обычных фраз на обыкновенном человеческом (русском, английском и т. д.) языке. В 2014 году Курцвейл эпатировал публику обещанием, что компьютер будет понимать человеческий язык к 2020 году. Его пророчество сбылось в 2022 году.

Теперь вместо данных и алгоритмов нужны "промты". Если в "доисторическую эпоху" компьютеру нужно было объяснять, что от него хочет человек, через написание кода (всех этих if-else и прочих def), обучающую выборку, обучение сетей или адаптеров, то теперь для получения результата достаточно сформулировать просьбу, отправить ее в API OpenAI (или другого вендора LLM) и вуаля.

А все "дедовские методы" с обучением сетей и адаптеров, подготовкой выборки обучающей, валидационной и тестовой, в лучшем (для технарей) случае используются для получения LLM-суррогатов, когда религия не позволяет использовать API вендоров и не хватает средств для покупки 8 серверов с картами H100 по 80Gb каждая, чтобы завести, например, собственного "ДипСика". В результате титанической работы, после недель и месяцев усилий достигается качество "почти как у GPT-чего-то-там".

Итак, НЕТ кодингу, классам, функциям, библиотекам, признакам, моделям с Hugging Face, адаптерам с AdapterHub и прочей магии язычников. А чему же тогда "ДА"?

Месть гуманитариев: от промпт-инжиниринга к созданию ИИ-агентов

На место магов от Java, C# и С++ и жрецов от Python выходят те самые, униженные и оскорбленные — гуманитарии, бухгалтеры, юристы, логисты, педагоги, редакторы, издатели. Имя им легион. Их новым ремеслом стал промпт-инжиниринг — искусство составления таких запросов, которые заставляют нейросеть работать максимально точно и эффективно. Оказалось, что для этого не нужно знать Python, но необходимо глубокое понимание контекста, нюансов языка, логики и даже психологии (впрочем все это скорее всего временно и эффекты, например, от "психологического давления" на LLM строго говоря не доказаны). По настоящему нужно понимать задачу, хорошо знать предметную область и уметь сформулировать вопрос к черному ящику. Результат не гарантирован, но "высоковероятен".

Разработчики сами вырыли себе яму. Те из них, кто непосредственно разрабатывает гпт, дипсиков, квенов и антропиков, копали огромный котлован для других, а те, кто задавал вопросы и особенно на них отвечал на Stack Overflow или достигал звезд на GitHub, — маленькие уютненькие ямки для себя. Теперь каждый их ответ, каждый фрагмент кода — это крупица знаний в коллективном разуме LLM, делающая прямое обращение к разработчику все менее необходимым.

Но промпты — это только начало. Настоящая революция происходит прямо сейчас, и имя ей — ИИ-агенты.

Как там у классиков: "ИИ-агент — это уже не просто чат-бот, отвечающий на вопросы. Это автономная система, способная самостоятельно ставить цели, декомпозировать задачи, принимать решения и выполнять действия для их достижения. Агент может использовать инструменты: выходить в интернет, работать с файлами, отправлять электронные письма, подключаться к другим сервисам через API."

И вот тут-то и наступает время гуманитариев и "неайтишников" копать ямы себе и своим коллегам, создавая этих самых ИИ-агентов.

Из грёз ИИ оптимистов:

Юрист больше не тратит часы на поиск прецедентов. Он создает ИИ-агента, который сам мониторит судебную базу, анализирует новые законы и готовит проекты исков.
Маркетолог не нанимает команду для запуска рекламной кампании. Он настраивает агента, который анализирует целевую аудиторию, генерирует креативы, запускает и оптимизирует рекламу в социальных сетях, а затем представляет отчет о результатах.
Учитель истории создает агента-симулятора, который позволяет ученикам "пообщаться" с исторической личностью, получая ответы, основанные на реальных документах и письмах.
Логист в транспортной компании запускает агента, который отслеживает перемещение грузов, погоду, ситуацию на дорогах и таможне, самостоятельно перестраивая маршруты для оптимизации сроков и затрат.

А мы добавим от себя: эти самые юрист, маркетолог, учитель и логист, достигшие успеха в создании ИИ-агентов лишат работы тысячи и сотни тысяч других, менее расторопных юристов, маркетологов, учителей и логистов. Мы не должны забывать и про программистов и многих многих других белых воротничков или скорее безворотничков, реализующих через растянутую майку и видавший виды худи идеал личностной свободы, чья профессиональная судьба уже решена, несмотря на то, что они еще во всю трудятся, ходят на занятия по личностному росту, покупают продвинутые курсы чего-то там и рисуют в модных приложениях карты профессионального развития.

Один мой знакомый научный работник (биолог), отрицающий интеллект у LLM, злорадно заметил, что и хорошо, что высвободится столько людей, занимающихся непроизводительной бессмысленной работой. Я не стал расстраивать биолога и рассказывать про вал статей, описывающих, как другие околонаучные люди роют ямку и для него, пытаясь заставить LLM делать научные открытия (или хотя бы готовить для них фундамент, выполняя работу тысяч и тысяч рядовых научных сотрудников).

Дадим слово самой языковой модели:

"Происходит фундаментальная смена парадигмы. Раньше, чтобы автоматизировать процесс, нужен был программист, который писал бы жесткий алгоритм. Теперь нужен специалист в своей области (юрист, врач, логист), который может четко описать цель и дать агенту доступ к нужным инструментам. Умение кодировать уступает место умению формулировать. Техническая грамотность сменяется грамотностью методологической.

Технари-разработчики, конечно, никуда не исчезнут. Их роль трансформируется. Они становятся создателями "олимпийских богов" — фундаментальных моделей, и "титанами", которые строят платформы для создания и управления этими агентами. Но применять эту мощь, создавать на ее основе конкретные решения для бизнеса и повседневной жизни все чаще будут не они, а эксперты из других областей.

Так замыкается круг. Технологии, рожденные в недрах точных наук, в итоге передают власть в руки тех, кто лучше всех владеет самым древним и самым мощным инструментом — словом. Реванш гуманитариев свершился. И эта новая реальность обещает трансформации, масштабы которых мы только начинаем осознавать."

Ну что же, трудно не согласиться, новое прекрасное и величественное будущее уже тут. Вот только билет в него сродни лотерейному.

Всем удачи!

Написано в соавторстве с Gemini Pro 2.5

LLM передают ИИ в руки гуманитариев

Месть гуманитариев: от промпт-инжиниринга к созданию ИИ-агентов

Публикации

Ближайшие события