Комментарии / Профиль Nastaa / Хабр

Маркианова Анастасия@Nastaa

AI Lead at Flocktory

Подписчики

Начинаем работу с PyTorch 2.0 и Hugging Face Transformers

Nastaa 23 дек 2023 в 13:45

Измерение скорости здесь присутствует только для демонстрации ускорения в Pytorch 2.0. Да, это может вводить в заблуждение. По сути у статьи 2 цели - туториал для запуска и демонстрация ускорения.

Скорее всего вы почти во всем разобрались, что вам нужно для запуска) В 3 пункте главное - это Trainer. Он запускает обучение. Все, что после в 3 пункте - это уже не часть туториал, ее не надо повторять.

4 пункт здесь самый простой. Он своего рода hello world. Там нет обучения, его можно отдельно запустить для любой модели и получить предсказание.

ML System Design: основные способы деплоя и тестирования моделей машинного обучения в продакшене

Nastaa 4 июн 2023 в 12:00

Спасибо, что поделились соображениями насчет автора оригинала. Действительно, правильнее написать, что он раньше работал в Meta.

На счет других его текстов не могу сказать, только конкретно про этот, который переводила. Поскольку сама ML-инженер текст конечно проверила, здесь не вижу никаких проблем: конкретно в этом тексте сухие факты, которые также можно прочитать в других книгах по ML System Design.

Если здесь видите ошибку, можете указать.

Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback

Nastaa 26 апр 2023 в 07:29

Спасибо за ссылку, раньше не читала, очень интересно)

Получается так)

Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback

Nastaa 26 апр 2023 в 07:18

Да, действительно, gpt-4 гораздо лучше.

Ошибки прошлых версий модели - это источник новых данных для дообучения их модели. Поэтому косяков все меньше.

Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback

Nastaa 26 апр 2023 в 07:00

OpenAI пошли по стандартному пути. Обратились к компании Sama, с которой уже сотрудничали Meta, Google и тд для разметки токсичности своего контента.

У Sama все работники заняты в "бедных" странах, типа Кении, Индии, Уганды.

Разметка большого количества данных - это дорого, поэтому они используют самую дешёвую рабочую силу.

Плюс к тому, к сожалению, условия труда сотрудников из таких стран мало кого волнуют. А им приходится просматривать очень жёсткий контент с насилием, например. Чтобы потом мы получили этичный ИИ. Об этом как раз статья в Time.

Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback

Nastaa 25 апр 2023 в 20:58

Все верно)

Но он способен обрабатывать чисто человеческие запросы, типа "объясни, как работает этот код", "перепиши мой текст более понятным языком" и в принципе научен, как общаться с людьми, чтобы отвечать, как ожидают люди.

Эти вещи очень сложно формализовать для алгоритма, для просты это можно называть имитацией "человечности".

Конечно, речь совсем не про то, что он обладает человеческими качествами.

Пишем простой ML веб-сервис на FastAPI

Nastaa 21 апр 2023 в 10:14

Спасибо, сама не пользовалась, но выглядит действительно удобным инструментом для автоматизации деплоя моделей!

С другой стороны, изучение и понимание процесса создания приложений самому имеет ряд преимуществ. Например, существует много проектов, для которых не подходят автоматические инструменты. Где-то это дает больше гибкости и контроля за кодом. В целом, написание собственного приложения дает понимание, как работают разные инструменты.

Nastaa 20 апр 2023 в 06:21

Спасибо за отзыв! Рада, что статья была полезной)

Nastaa 17 апр 2023 в 19:04

Пузыри они фактически и описали, это их SimClusters, которые оказались очень полезны по метрикам. Хоть они показали только "ванильные" примеры кластеров вроде поп-звезд, но конечно, там есть и политические кластеры и что-то более жуткое по-любому.

Насчет Илона, все может быть, практика залезания сверху в процесс рекомендаций распространена. Типа, я вижу не то, что хочу, значит у вас ошибка в алгоритме - поправьте. А править алгоритм неясно где и непонятно зачем - он же оптимизирует глобальные метрики. Тогда, могли сделать и просто косметическую доработку с флагом.

Nastaa 17 апр 2023 в 14:32

Они утверждают, что используют эти флаги только для мониторинга) Формально опровержений в коде рекомендаций никто не нашел. Но в опенсурсе далеко не весь их код, конечно.

Маск вроде тоже не знал про это и сказал удалить этот флаг и флаги пользователей "республиканцев"/"демократов".

Nastaa 13 апр 2023 в 06:27

Согласно их алгоритму отдельно подмешивается только реклама. Как формируется реклама мы не знаем, так как это не опенсорс (пока по крайней мере).

В остальном, хоть у них это явно не сказано, рекомендательная система будет больше предпочтения отдавать "вирусному" контенту, то есть где много реакций.

Как мы научились понимать продажи в колл-центре, или С чего начать ML-проект, если непонятно ничего

Nastaa 10 янв 2022 в 09:20

Реализовали то решение, которое описано в пункте "Переходим к постановке задачи". На базе разметки обучили модель, сейчас она скорит все звонки. Все то, что планировали, модель сейчас умеет делать, например, мы: понимаем, сколько раз клиент уже отказывался от продукта (когда пора перестать предлагать), оцениваем работу менеджера в каждом звонке, определяем скилы продаж у сотрудников.

Как мы научились понимать продажи в колл-центре, или С чего начать ML-проект, если непонятно ничего

Nastaa 17 дек 2021 в 12:44

Смотря, что вы имеете в виду :)

На этапе аналитики задачи мы использовали бинарные вопросы для проверки гипотез, и они очень помогли.

Непосредственно модель мы обучали end-to-end на текстах, то есть прям внутри звонка модель анализирует каждую фразу и предсказывает, например, сейчас мы говорим про этот продукт или нет (бинарный таргет).

Как мы научились понимать продажи в колл-центре, или С чего начать ML-проект, если непонятно ничего

Nastaa 16 дек 2021 в 05:31

Да, все верно. В одном звонке могут обсуждаться несколько продуктов и также несколько других тем, не связанных с продажами. Чтобы модель смогла обучиться, нужно явное выделение интервалов.

Как мы научились понимать продажи в колл-центре, или С чего начать ML-проект, если непонятно ничего

Nastaa 14 дек 2021 в 11:09

Такое происходит, если сотрудники заполняют данные в перерыве между своей основной работой. Например, после того, как поговорили с клиентом, проставляют метки в этом звонке.

Мы же используем другой подход. Разметчики - это специально выделенная группа сотрудников, которые на время разметки занимаются только нашей задачей. Их несколько человек, поэтому мы постоянно на связи со всеми и просим переделать, если что-то не так. Стоит сказать, что они действительно ответственно подходят к разметке, за что мы им очень благодарны.