Статьи / Закладки / Профиль azsh1725 / Хабр

@azsh1725

Пользователь

Профиль Публикации Комментарии 5Закладки 30

ruslandevlabs 6 авг в 14:16

Бенчмарки больших языковых моделей. Мультиязычный MT-Bench

4 мин

1.4K

Искусственный интеллект

В последнее время я занимался файнтюнингом Llama 3 на открытых датасетах, а сейчас планирую собрать собственный датасет для новых экспериментов. Встает вопрос, как оценивать эффективность обучения.

Для оценки моделей используются специальные наборы текстовых запросов, промптов, которые проверяют, например, насколько хорошо модель следует инструкциям. Для разных типов задач будут разные критерии оценки.

Например, есть GLUE (General Language Understanding Evaluation), оценка общего понимания естественного языка. Оценивает в том числе способность модели отвечать на вопросы, логическую связность и sentiment analysis - умение распознавать эмоциональную окраску. Это обширная область задач, и одного GLUE-бенчмарка явно мало, чтобы как следует оценить общее понимание моделью естественного языка, поэтому существуют другие тестовые наборы, например, SuperGLUE и MMLU (Massive Multitask Language Understanding). Последний бенчмарк оценивает, насколько хорошо в среднем модель понимает сложные вопросы из разных категорий - гуманитарной, социальной, STEM - то есть точные науки и естествознание.

Есть HellaSwag - это интересный бенчмарк, составленный из непростых вопросов, которые проверяют модель на здравый смысл, common sense. HellaSwag датасет содержит текстовое описание события, записанного на видео, и несколько вариантов завершения этого события, только один из которых правильный.

AlanRobotics 31 июл в 15:32

Вызов функций с помощью LLM

14 мин

4.9K

Блог компании MTS AIБлог компании МТСNatural Language Processing*Искусственный интеллектМашинное обучение*

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

+15

iovodov 16 июл в 10:19

Какой трансформер в океане плавает быстрее всех? Тестируем скорость нейросетей для видео-энкодеров

Средний

10 мин

1.9K

Обработка изображений*Машинное обучение*Искусственный интеллект

Одно из направлений работы нашей команды компьютерного зрения Vision RnD в SberDevices — распознавание жестового языка. Об этой задаче и о том, как мы ее решаем, мы уже писали на Хабре тут и тут (а еще тут и тут). Некоторое время назад перед нами встал вопрос выбора архитектуры нейросети для быстрой и качественной обработки изображений (видео‑энкодера). Хотя сама задача распознавания жестового языка предполагает обработку видео, в качестве первого этапа нужна нейросеть, обрабатывающая изображения на отдельных кадрах. Причем делающая это достаточно быстро, чтобы обеспечить работу всей конструкции в реальном времени. Безусловно, за последний десяток лет человечеству стало известно немало архитектур нейросетей для обработки изображений. Однако, сопоставить их по критерию ~~цена‑качество~~ точность‑производительность и выбрать лидера не так просто. Мы решили собрать несколько популярных решений‑претендентов на звание чемпиона и провести ~~состязание в славном городе Гамбурге~~ тестирование в идентичных условиях. Результатами этого исследования делимся под катом.

+10

murat_apishev 19 апр в 16:57

Как учить большие языковые модели (теоретический туториал)

Средний

1 мин

6.7K

Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Обзорное видео с доклада об особенностях обучения LLM для тех, кто в теме ML/DL, но хочет расширить кругозор в области работы с большими языковыми моделями. На основе личного опыта и обзора множества научных статей и инструментов. Ссылка на презентацию прилагается.

Смотреть

BarakAdama 16 ноя 2021 в 09:55

Суперкомпьютеры Яндекса: взгляд изнутри

12 мин

35K

Блог компании ЯндексВысокая производительность*Компьютерное железоМашинное обучение*Суперкомпьютеры

Недавно три наших новых GPU-кластера заняли 19, 36 и 40 места в рейтинге суперкомпьютеров Top500. Это лучшие результаты среди всех участвующих в нём суперкомпьютеров России. Но сегодня мы поговорим не о местах в рейтинге, а о том, чем полезно на практике участие в подобных замерах.

Из этого поста вы узнаете про наши первые попытки создать свои кластеры и грабли на этом пути. Расскажем, как устроены суперкомпьютеры для машинного обучения и почему мы в итоге пришли к собственной архитектуре. Важная часть истории будет посвящена разбору проблем замеров производительности, которые, вопреки первым впечатлениям, принесли нам не только места в рейтинге, но и реальную пользу для наших ML-проектов.

Поможет мне в этом Дмитрий Монахов dmtrmonakhov. Он уже известен читателям Хабра по докладу о разработке ядра Linux. Передаю ему слово.

Читать дальше →

+123

sdukanov 5 авг 2022 в 09:55

Голосовой перевод трансляций в Яндекс Браузере: как он устроен и чем отличается от перевода обычных видео

6 мин

43K

Блог компании ЯндексБраузерыИскусственный интеллектМашинное обучение*Софт

Осенью прошлого года мы рассказали читателям Хабра, как работает голосовой перевод видео в Яндекс Браузере. За первые десять месяцев пользователи посмотрели видеоролики с закадровым переводом 81 миллион раз. Механизм действует по запросу: нейросеть получает аудиодорожку целиком, а звук на понятном пользователю языке появляется с задержкой в пару минут.

Но такой способ не подходит для прямых трансляций, когда нужно переводить почти в режиме реального времени. Поэтому сегодня мы открываем для всех отдельный, более сложный механизм — потоковый перевод стримов.

Чтобы всё заработало, перезапустите Яндекс Браузер. Анонсы новых устройств, спортивные соревнования, вдохновляющие космические запуски — этот и другой контент теперь можно смотреть сразу на родном языке. Закадровый голосовой перевод сейчас доступен для некоторых каналов на YouTube, а в будущем, конечно, включить дубляж можно будет в любой YouTube-трансляции. Чтобы адаптировать механизм перевода для стримов, потребовалось переработать всю архитектуру.

Читать дальше →

+45

BarakAdama 7 сен 2021 в 10:02

Как Яндекс помогает преодолеть языковой барьер: нейросетевой перевод видео, картинок и текста

8 мин

100K

Блог компании ЯндексIT-компанииБраузерыИскусственный интеллектСофт

Недавно мы впервые показали прототип переводчика видео в Яндекс.Браузере. Прототип работал с ограниченным числом роликов, но даже в таком виде вызвал интерес у пользователей. Теперь мы переходим к следующему ключевому этапу: в новых версиях Браузера и приложения Яндекс перевод доступен для всех англоязычных роликов на YouTube, Vimeo, Facebook и других популярных платформах.

Сегодня я не только расскажу о том, как устроен новый переводчик видео и какие у нас планы, но и поделюсь предысторией. Потому что считаю, что контекст важен: мы шли к этому шагу более десяти лет. Но если история вам вдруг не интересна, то можете сразу переходить к разделу «Перевод видео», где я описал работу технологии (а точнее, целого комплекса наших технологий) по шагам.

Десятью годами ранее

В 2011 году в Яндексе решалась судьба собственного полноценного браузера. На тот момент браузеров на любой цвет и вкус уже хватало. Но почти все они создавались «где-то там»: без оглядки на рунет и потребности тех пользователей, для которых английский язык и латиница не были родными. Поэтому мы решили создать свой браузер, который бы в числе прочего более полно поддерживал русский язык и наши с вами «региональные» потребности. Уверен, эта фраза звучит непонятно, поэтому ниже вас ждут два моих любимых примера. Они не связаны с переводом, но показательны.

Переведётся всё!

+96

177

avdosev 4 мар в 10:00

Как мы научили YandexGPT пересказывать видео

Средний

14 мин

17K

Блог компании ЯндексИскусственный интеллектМашинное обучение*БраузерыNatural Language Processing*

✏️ Технотекст 2023

Порой бывает сложно перематывать длинный ролик в надежде найти хоть что-то интересное или тот самый момент из Shorts. Или иногда хочется за ночь узнать, о чём шла речь на паре научных конференций. Для этого в Браузере есть волшебная кнопка — «Пересказать», которая экономит время и помогает лучше понять, стоит ли смотреть видео, есть ли в нём полезная информация, и сразу перейти к интересующей части.

Сегодня я расскажу про модель, которая быстро перескажет видео любой длины и покажет таймкоды для каждой части. Под катом — история о том, как мы смогли выйти за лимиты контекста модели и научить её пересказывать даже очень длинные видео.

+63

Takagi 7 сен 2023 в 12:11

Как (быстро) сделать русский локальный ChatGPT

Средний

7 мин

42K

Программирование*Машинное обучение*Искусственный интеллектNatural Language Processing*

Ретроспектива

Эта история началась в начале марта этого года. ChatGPT тогда был в самом расцвете. Мне в Telegram пришёл Саша Кукушкин, с которым мы знакомы довольно давно. Спросил, не занимаемся ли мы с Сашей Николичем языковыми моделями для русского языка, и как можно нам помочь.

И так вышло, что мы действительно занимались, я пытался собрать набор данных для обучения нормальной базовой модели, rulm, а Саша экспериментировал с существующими русскими базовыми моделями и кустарными инструктивными наборами данных.

После этого мы какое-то время продолжали какое-то время делать всё то же самое. Я потихоньку по инерции расширял rulm новыми наборами данных. Посчитав, что обучить базовую модель нам в ближайшее время не светит, мы решили сосредоточиться на дообучении на инструкциях и почти начали конвертировать то, что есть, в формат инструкций по аналогии с Flan. И тут меня угораздило внимательно перечитать статью.

+88

murat_apishev 4 мая 2023 в 15:11

Зоопарк трансформеров: большой обзор моделей от BERT до Alpaca

Сложный

59 мин

22K

Блог компании Just AIМашинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

Авторский обзор 90+ нейросетевых моделей на основе Transformer для тех, кто не успевает читать статьи, но хочет быть в курсе ситуации и понимать технические детали идущей революции ИИ.

+28

ADSoroka 3 июн 2022 в 14:27

Как мы подходим к поддержке ML-моделей в синтезе речи

10 мин

2.8K

Блог компании Т-БанкМашинное обучение*

Всем привет! Меня зовут Александра Сорока, я занимаюсь синтезом речи в Тинькофф. А это — мой текст о том, зачем вообще думать о долгосрочной поддержке кода и ML-моделей. Я расскажу, почему мы отказались от опенсорсных решений, как работаем с датасетами и разными версиями моделей и как замеряем их качество. Статья может оказаться полезной для всех, кто хочет знать, как ничего не поломать.

cointegrated 28 июн 2021 в 09:53

Перефразирование русских текстов: корпуса, модели, метрики

13 мин

20K

Python*Семантика*Программирование*Машинное обучение*Natural Language Processing*

Автоматическое перефразирование текстов может быть полезно в куче задач, от рерайтинга текстов до аугментации данных. В этой статье я собрал русскоязычные корпуса и модели парафраз, а также попробовал создать собственный корпус, обучить свою модель для перефразирования, и собрать набор автоматических метрик для оценки их качества.

В итоге оказалось, что модель для перевода перефразирует лучше, чем специализированные модели. Но, по крайней мере, стало более понятно, чего вообще от автоматического перефразирования можно хотеть и ожидать.

+16

DimaFromMai 27 мар 2021 в 17:06

Развертывание ML модели в Docker с использованием Flask (REST API) + масштабирование нагрузки через Nginx балансер

5 мин

16K

Микросервисы*Машинное обучение*Nginx*Flask*DevOps*

Туториал

Как известно настройка и обучение моделей машинного обучения это только одна из частей цикла разработки, не менее важной частью является развертывание модели для её дальнейшего использования. В этой статье я расскажу о том, как модель машинного обучения может быть развернута в виде Docker микросервиса, а также о том, как можно распараллелить работу микросервиса с помощью распределения нагрузки в несколько потоков через Load balancer. В последнее время Docker набрал большую популярность, однако здесь будет описан только один из видов стратегий развертывания моделей, и в каждом конкретном случае выбор лучшего варианта остаётся за разработчиком.

Читать дальше →

alexbuk 26 апр 2012 в 18:38

Аналог Teamviewer или VNC сила

3 мин

209K

Системное администрирование*

Из песочницы

Очень часто, мне приходится удаленно админить компьютеры пользователей.
Первое, что приходит на ум, это TeamViewer, и правда, это можно сказать монополист в сфере RemoteControl.
Но, есть также большое кол-во программ, как платных (большинство), так и бесплатных.

Читать дальше →

snakers4 25 ноя 2021 в 15:40

Telegram-бот Silero бесплатно переводит речь в текст

3 мин

164K

Голосовые интерфейсы*Искусственный интеллектМашинное обучение*Мессенджеры*Развитие стартапа

header

Мы сделали бесплатного телеграм-бота, который переводит аудио в текст. В отличие от нашего бесплатного публичного решения для транскрибации длинных аудио, этот бот скорее настроен для удобства работы с короткими голосовыми сообщениями, заметками и аудио средней длины (несколько минут).

Боту можно послать аудио как напрямую, так и добавить в группу. В группе бот будет реагировать на все аудиофайлы (но сообщения об ошибках выводиться не будут). Более подробно об ограничениях и особенностях работы можно узнать в методах /help и /faq.

Основная UX фишка работы бота — проработанный и удобный формат чтения и навигации по распознанным сообщениям и заметкам (а не стена текста).

попробовать

+49

nurtdinovadf 5 ноя 2021 в 16:50

Бесплатное распознавание речи для всех желающих

3 мин

18K

Natural Language Processing*Голосовые интерфейсы*ЗвукМашинное обучение*Развитие стартапа

Читать дальше →

+20

snakers4 27 мая 2021 в 15:51

Ультимативное сравнение систем распознавания речи: Ashmanov, Google, Sber, Silero, Tinkoff, Yandex

8 мин

21K

Голосовые интерфейсы*ЗвукИскусственный интеллектМашинное обучение*

sandwich_fake

Какое-то время назад мы писали цикл статей про то, как правильно измерять качество систем распознавания речи, и собственно снимали метрики с доступных решений (цикл статей — 1, 2, 3) (на тот момент и коммерческих и некоммерческих решений). На Хабре была выжимка из этого цикла в рамках этой статьи, но до масштабного обновления исследования, достойного публикации на Хабре, руки никак не доходили (это требует как минимум большого количества усилий и подготовки).

Прошло некоторое время и пора обновить наше исследование, сделав его по-настоящему ультимативным. По сравнению с прошлыми исследованиями изменилось или добавилось следующее:

Добавилось много валидационных сетов из разных реальных доменов;
На рынок вышел Сбер, в первую очередь интересно протестировать именно его;
Для чистоты эксперимента, мы не предупреждали разработчиков систем о доменах и факте проведения тестов;
Мы также попробовали немного протестировать пропускную способность сервисов (понятно, что мы не знаем какое железо и ограничения стоят в облаке);
Мы рассматриваем только коммерческие системы, к которым у нас получилось получить доступ и которые показали хоть какой-то намек на "всеядность", работу с холодного старта и "энтерпрайзность";

Читать дальше →

+20

neuroonet 7 ноя 2021 в 15:11

Юлий Цезарь в мире ИИ: Google разрабатывает многозадачную ИИ-модель Pathways

3 мин

5.6K

Блог компании Neuro.netИскусственный интеллектБудущее здесь

Корпорация Google заявила о начале работы над проектом из сферы ИИ, в рамках которого корпорация планирует создавать комплексные нейросети. Они, по словам разработчиков, смогут одновременно работать над решением тысяч или даже миллионов разных тасков одновременно. Проект получил название Pathways.

В общем-то компьютерные системы некорректно сравнивать с мозгом человека, но сами разработчики заявили о том, что принцип работы Pathways несколько похож на принцип работы мозга человека. Под катом - подробности проекта.

Особенности Pathways

Чаще всего нейросети "затачивают" на решение одной специализированной задачи. Как только эта задача выполнена, нейросеть можно обучить по-новому для решения другой задачи. После обучения она напрочь "забывает" о своей предыдущей специализации. Pathways же сможет работать параллельно над решением самых разных задач, "помня" обо всех своих специальностях.

Вице-президент Google Джефф Дин (Jeff Dean) заявил следующее: "Сейчас именно так обучается подавляющее большинство моделей машинного обучения. Мы на увеличиваем количество задач, которые решают отдельные модели, вместо этого разрабатываются тысячи уникальных моделей. Соответственно, обучение каждой новой задаче требует времени и большого количества данных".

По его словам, новая модель может все изменить - нейросети могут справляться с решением разных задач, как и говорилось выше, тысяч и миллионов уникальных тасков. Более того, "опыт", полученный нейросетью в ходе решения одной из задач, может быть скомбинирован с "опытом" решения другой. И, соответственно, такой комплексный подход даст возможность решить третью, более сложную или специфическую задачу.

+14

cointegrated 10 июн 2021 в 02:16

Маленький и быстрый BERT для русского языка

9 мин

62K

Семантика*Программирование*Data Mining*Машинное обучение*Natural Language Processing*

Технотекст 2021

BERT – нейросеть, способная неплохо понимать смысл текстов на человеческом языке. Впервые появившись в 2018 году, эта модель совершила переворот в компьютерной лингвистике. Базовая версия модели долго предобучается, читая миллионы текстов и постепенно осваивая язык, а потом её можно дообучить на собственной прикладной задаче, например, классификации комментариев или выделении в тексте имён, названий и адресов. Стандартная версия BERT довольно толстая: весит больше 600 мегабайт, обрабатывает предложение около 120 миллисекунд (на CPU). В этом посте я предлагаю уменьшенную версию BERT для русского языка – 45 мегабайт, 6 миллисекунд на предложение. Она была получена в результате дистилляции нескольких больших моделей. Уже есть tinybert для английского от Хуавея, есть моя уменьшалка FastText'а, а вот маленький (англо-)русский BERT, кажется, появился впервые. Но насколько он хорош?

+57

egor_labintcev 12 мая 2017 в 13:59

Метрики в задачах машинного обучения

9 мин

676K

Блог компании Open Data ScienceData Mining*Python*Математика*Машинное обучение*

Привет, Хабр!

В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста.

В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так.

Читать дальше →

+38