iSamsonov 1 июн 2023 в 11:51

Кто такой погонщик нейросетей и как им стать: большая подборка ресурсов по ML для начинающих

Средний

7 мин

9.3K

Блог компании VKМашинное обучение*Карьера в IT-индустрииИскусственный интеллектЛайфхаки для гиков

Мнение

Может ли искусственный интеллект прогнать нас от компьютеров и отправить работать на завод? Большие языковые модели действительно меняют интеллектуальные профессии: взамен старых приходят новые, более разнообразные. И начинают появляться люди, которых я называю погонщиками нейросетей — они могут обучать модели и ставить им задачи. В этой статье расскажу, почему считаю AI не соперником на рынке труда, а инструментом, который поможет нам стать более эффективными. А главное — поделюсь большой подборкой материалов для каждого, кто хочет сделать нейросети своими помощниками.

Меня зовут Ваня Самсонов, за последние семь лет я собрал булшит-бинго из хайповых технологий: крипта + No-code + ML. Сейчас руковожу продуктовым направлением по ML ВКонтакте — и у меня две основные задачи.

Сделать так, чтобы в компании не осталось людей, которые считают ML магией — перенести машинное обучение в плоскость понятной обыденности.
Причинять пользователям добро и радовать их с помощью новых технологий (отвечаю за машинное обучение в обработке текстов, изображений и звука).

Как продакт, я слежу за трендами и вижу, что нейросети постепенно забирают часть работы у людей с интеллектуальными профессиями (разработчиков, маркетологов, дизайнеров, консультантов и т. д.). Но заменить их полностью не могут — сейчас нейросети не умеют работать с нечётко поставленными задачами и договариваться с другими моделями, как правильно поступить. В этих недостатках моделей кроется сила человека, и я постараюсь дать инструменты, которые помогут использовать её на полную. И кратко расскажу, как их применять.

Эта статья написана по мотивам моего выступления на конференции ProductCamp Moscow 2023 — можно посмотреть видео доклада.

Пока руководители не научатся чётко формулировать свои задачи, мы в безопасности — нейронки нас не заменят

Подборка ресурсов по ML и не только

Вот здесь я собираю все полезные материалы.

Этот документ с подборкой ресурсов уже активно распространяют, и это очень круто. Но именно эту версию я буду постоянно пополнять самой актуальной и интересной информацией по теме. Кстати, вы тоже можете предложить в документе полезные материалы.

Ресурсы разбиты на несколько блоков. В первом — исследования учёных, которые помогут увидеть масштаб развития AI с точки зрения науки. Например, среди материалов есть огромный социальный отчёт сотрудников OpenAI и других исследователей о том, как большие языковые модели будут влиять на рынок труда в США. Они выяснили, что если все компании и предприятия в стране массово внедрят ML, у 80% работников AI может затронуть до 10% задач, а у 19% — до половины.

Во втором блоке — ресурсы, которые помогут хакнуть ChatGPT и достать из его глубин информацию, которую он не захочет так просто вам отдавать. Почему не захочет — расскажу ниже. Этот блок самый быстроменяющийся — ещё вчера советы из статей оттуда могли работать, а сегодня эти хаки уже пофиксили и они больше не действуют.

В оставшихся блоках — материалы для знакомства со сферой ML. Я разделил их на три уровня, чтобы каждый мог выбрать, насколько глубоко хочет погрузиться в эту область знаний.

Третий блок пригодится тем, кому просто интересно, что происходит в ML-сфере. В него я добавил крутой подкаст о машинном обучении и подборку телеграм-каналов на тему AI.
В четвёртом блоке я собрал доклады и статьи, которые помогут разобраться, как работает искусственный интеллект в бизнесе и продуктах.
Пятый блок — для тех, кто хочет не просто разобраться, но и быть полезным другим людям в проектах, связанных с ML. В нём — курс для ML-продактов, тренажёр по SQL и другие обучающие материалы, которые помогут понять, что такое градиентный бустинг, почему так или иначе работают модели по генеративке и диффузии и многое другое.

Дальше расскажу, как использовать информацию из подборки, чтобы стать погонщиком нейросетей.

Какую работу могут сделать за нас нейросети, а какую — нет

Недавно мы с командой провели эксперимент, который показал, что нейросети могут справляться с интеллектуальной работой не хуже профессионалов. Мы попросили написать рекламные тексты маркетолога, который уже пять лет в профессии. Параллельно в течение 10 дней учили специалиста без знаний и опыта в маркетинге составлять промты в ChatGPT.

Что такое промты?

Промты — это текстовые запросы, которые описывают, какой ответ должна дать модель. Их мастерски умеют составлять специально обученные люди — промт-инженеры. Они знают тонкости запросов и могут быстро получить необходимый результат при работе с любой генеративной моделью: от ChatGPT до Midjourney.

После обучения всем тонкостям промта обученный специалист тоже создавал рекламу, но только с помощью нейросети. В итоге сложно было понять, какие тексты писал маркетолог, а какие — ChatGPT. Примеры — ниже. Такие небольшие тексты можно написать и за пять минут, это только часть креативов из большой работы.

Я уверен, что такой же результат получится и в других сферах, где используют нейросети. Модели умеют уже очень многое: рисовать, генерировать звук и текст. Некоторые даже могут пройти капчу — они способны пойти в интернет, притвориться человеком со слабым зрением и попросить помощи в расшифровке картинок. Чего пока не умеют нейросети, так это ставить бизнес-задачи.

Модели хорошо могут выполнять декомпозированные задачи, но при этом сами не умеют планировать. Если что-то меняется, они не способны быстро перестроиться, хотя сейчас разработчики активно пытаются решить эту проблему. Пока такой расклад сохраняется, мы в безопасности — нас не заменят. Эту особенность нейросетей важно учитывать, когда вы будете ставить задачу — постарайтесь её максимально сузить. Не просите сразу разработать продающий и привлекательный сайт, а начните с конкретных кнопочек, текста для блоков, наполнения корзины и так далее.

«Вы сказали нарисовать кисть руки. Вот, пожалуйста — кисть с пальцами». Надо было просить более детально. Типичная ситуация с генерацией картинок в Stable Diffusion

В поисках сокровищ AI: зачем учиться составлять промты

Всё самое интересное спрятано в глубинах AI. Например, ChatGPT училась на огромном количестве данных, куда попали закрытые отчёты большой четвёрки, слитые данные компаний о том, как делать процессоры и платы, закрытые отчёты военных. Есть там и много такого, о чём лучше действительно не знать. Разработчики из OpenAI полгода работали над тем, чтобы модель не выдавала «чувствительную» информацию. Например, как сделать коктейль Молотова или добыть яд. В проектировании моделей этой проблеме посвящено отдельное направление: alignment. Его смысл в том, чтобы результаты работы AI соответствовали человеческим «целям и ценностям» и не вредили другим людям. Подробнее про alignment можно почитать в этой крутой статье.

Чтобы извлечь из модели полезную информацию, нужно уметь составлять хорошие промты. Уже появились люди, которых называют джейлбрейкерами нейронных сетей, или по-простому — хакерами. С помощью хитрых приёмов они вытягивают информацию из самой глубины модели. Представьте хакера-маркетолога, который делает текстовые запросы нейросети и пытается дотянуться до того, что спрятано в ней. Пара недель — и он может вытащить информацию, за которую кто-то готов заплатить сотни тысяч долларов: например, большой отчёт Gartner.

Если вы разберётесь, как работает нейросеть, какие запросы ей давать и как она отвечает, то сможете докопаться до очень крутых вещей и сделать модель своим карманным помощником. Ваша задача — быть максимально любопытными и делать всё, чтобы модель пыталась вам ответить. Не верьте ей, если она будет говорить, что чего-то не знает или не умеет. Возможно, просто нужно по-другому сформулировать вопрос.

Как модели, плагины и погонщики нейросетей могут работать на бизнес

Чтобы модель решала задачи для бизнеса, она должна давать актуальную информацию. Обучение нейросети занимает 35–40 дней, так что к концу этого срока она ничего не будет знать про последний месяц. Модель нужно учить заново — придётся вновь собирать и чистить очень много данных. А на выходе она может деградировать и выдавать глупые вещи.

Основная сила модели в том, что ей не нужно держать в себе всю информацию. Ребята из OpenAI в марте запустили плагины, которые дают чат-боту доступ к актуальной информации из интернета и различным сервисам. Плагины позволяют боту в режиме реального времени выдавать, например, прогноз погоды, курс акций или результаты спортивных соревнований. Если модель умеет ходить в интернет, значит, она может зайти в любой из наших продуктов. С помощью этого нейросеть можно монетизировать.

Есть и ещё одна вещь, которую модели потенциально могут делать — давать задание другим моделям. Представьте себе мир, где существует тысячи нейросетей, которые могут управлять друг другом. Тут на помощь придёт огромная база моделей Hugging Face. На сегодня в ней почти 200 тысяч моделей: какие-то из них лучше оптимизируют цены, другие заточены на рекомендации или расшифровывают тексты картинок.

Возможно, через время авторы моделей будут объяснять в Hugging Face, какие задачи решает их модель, а продакты будут делать запросы на нейросети, которые принесут пользу бизнесу. Это будет мир, в котором любой любопытный и усидчивый человек может стать полноценным погонщиком нейросетей. И для этого ему не потребуется разработчик, как сейчас. Ему даже не надо будет задумываться, как модель достигла результата — достаточно чётко сформулировать задачу.

Чтобы комфортно общаться с моделью, нужно понимать, как она работает и какие задачи может решать. Я выделяю три группы специалистов по степени погружённости в ML-сферу.

Люди, которые знают про модели, могут написать промт в ChatGPT и получить необходимый результат, который потом ещё желательно перепроверить.
Специалисты, знающие про существование разных моделей по компьютерному зрению, звуку и ещё многих других. Они примерно понимают, какие задачи такие модели решают, но не знают, как их запустить и внедрить в бизнес или продукт.
Продакты, которые понимают, как работает машинное обучение, но не умеют писать код. Это нормально — им просто важно понимать, что до них хочет донести их разработчик. И уметь переработать эту информацию в метрики, по которым живёт бизнес.

Модели меняют наше мышление

В том, что модели не умеют декомпозировать задачи, есть неочевидная польза для нас. Многие люди тоже не умеют раскладывать большие задачи на маленькие и выполнять их поэтапно. Вместе с нейросетями мы получили тренировочный агрегат, который требует от нас ставить чёткие задачи, учит выстраивать план и разбивать сложные задачи на более простые. Он помогает структурировать наше мышление и даёт скиллы, которые было бы сложнее получать другими способами. А это делает нас лучше.

Не бойтесь использовать новые технологии в своей работе — теперь у вас есть инструменты для этого. Чем раньше вы их освоите, тем меньше шансов, что они вас заменят. И чем больше опыта вы получите в работе с нейросетями, тем больше возможностей сможете найти для их применения.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Уже используете генеративные модели в работе?

15.15% Да, постоянно5

36.36% Периодически, но пока не вижу много пользы12

12.12% Было несколько попыток, результат разочаровал4

27.27% Нет, но пора начинать9

9.09% Нет! Верю только в силу естественного интеллекта3

Проголосовали 33 пользователя. Воздержались 6 пользователей.

Теги:

Хабы:

Кто такой погонщик нейросетей и как им стать: большая подборка ресурсов по ML для начинающих

Подборка ресурсов по ML и не только

Какую работу могут сделать за нас нейросети, а какую — нет

В поисках сокровищ AI: зачем учиться составлять промты

Как модели, плагины и погонщики нейросетей могут работать на бизнес

Модели меняют наше мышление

Публикации

Информация