Все потоки

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

СтатьиПостыНовостиАвторыКомпании

Sitnich 8 авг 2024 в 11:26

Оценка LLM с большим окном контекста

7 мин

3K

Блог компании MWS AIБлог компании МТСИскусственный интеллектNatural Language Processing *

Всем привет!

Мы в команде фундаментальных исследований MTS AI занимаемся исследованиями в области обработки естественного языка и компьютерного зрения, а также строим свои фундаментальные языковые модели. Недавно у нас получилось достичь уровня gpt-4 на собственном ограниченном датасете большого контекста. Расскажем, как нам это удалось.

Читать далее

+9

Gscraid 8 авг 2024 в 09:02

LIBRA: Long Input Benchmark for Russian Analysis

Средний

6 мин

3.1K

Блог компании SberDevicesNatural Language Processing * Искусственный интеллектМашинное обучение * Открытые данные *

Обзор

Мы разработали бенчмарк LIBRA, который включает в себя 21 адаптированный набор данных для тщательного изучения способности LLM понимать длинный контекст. Помимо самих данных для оценки, мы опубликовали кодовую базу и лидерборд для сравнения моделей.

Читать далее

+29

AlexanderAnisimov 7 авг 2024 в 17:34

Использование ответов OpenAI API в формате JSON: Введение

Средний

9 мин

5.1K

Искусственный интеллектNatural Language Processing *

Туториал

Тема использования JSON в ответах OpenAI API звучала в анонсах примерно год назад и до некоторой степени описана в документации. В частности, Сэм Альтман на презентации одного из крупных релизов говорил о том что о такой фиче активно просили разработчики. Однако с тех пор мне не удалось найти целостных описаний решений, сценариев и паттернов, которые выглядели бы как практически полезные и на основе которых можно было бы быстро составить целостное понимание. Те материалы, которые попадались мне до сих пор, показались мне довольно абстрактными, недостаточно целостными, оторванными от реальности, иногда перегруженными техническими подробностями, за которыми теряется общая картина.

Вчера (6 августа) OpenAI выпустила обновление этого функционала и вместе с ним заметно обновила и дополнила документацию в этой части. С одной стороны, в новой версии документации стало больше конкретных и наглядных примеров. С другой, - в дополнение к понятию Function calling добавилось еще новое понятие Structured Outputs, которое для начинающего пользователя на первых шагах может усложнить понимание.

В этой статье я хотел на небольшом примере дать краткий поверхностный обзор того как, на мой взгляд, можно задействовать JSON-ответы для конкретной задачи. Сразу скажу, что мой пример оказался крайне примитивным (чуть сложнее чем "Hello, World!"). Я старался достичь наглядности за счет демонстрации всего цикла от идеи "продукта", до его рабочего прототипа. Свою задачу я реализовал в трех вариантах (по мере возрастания сложности): "Чат без Function calling", "Чат с Function calling" и "Assistant Function calling". Возможно, кто-то найдет для себя в этом что-то полезное.

Читать далее

+6

DiTy 7 авг 2024 в 05:15

Семантический поиск (homemade)

Средний

127 мин

6.1K

Поисковые технологии * Python * Машинное обучение * Natural Language Processing *

Туториал

Из песочницы

Основой семантического поиска может являться ML задача Sentence Similarity, а если быть еще конкретнее, то это Semantic Textual Similarity. Модели, обученные под эту задачу, способны оценивать насколько близки предложения по своему смыслу. Всё, что нам дальше остается, так это засунуть модель в некоторую поисковую систему...

Но тут давайте по порядку

+11

MrsWallbreaker 6 авг 2024 в 06:00

Не любой In-context learning одинаково полезен

8 мин

736

Машинное обучение * Искусственный интеллектNatural Language Processing *

Промпт-инжиниринг (Prompt engineering) - широко используемая техника для улучшения качества генерации LLM. Few-shot learning и Chain-of-thought - основные техники современного промпт-инжиниринга.

Оказывается, не любые Few-shot prompting и Chain-of-thought одинаково полезны и могут принести свои биасы в генерацию модели и испортить всю магию от их применения.

Читать далее

+5

atomlib 3 авг 2024 в 13:14

Уход к дообучению моделей? Исследователи и технологии Character.ai выкуплены Google

Простой

7 мин

4.2K

Машинное обучение * Искусственный интеллектБиографии гиковIT-компанииNatural Language Processing *

Компания Google и стартап Character.ai объявили о сотрудничестве. В рамках достигнутых соглашений Google получит неэксклюзивные права на технологии больших языковых моделей Character.ai, а исполнительный директор стартапа Ноам Шазир и второй сооснователь Даниэль Де Фрейтас начнут работать в подразделении DeepMind. Сама Character.ai собирается поробовать перейти на дообучение открытых моделей.

Читать далее

+14

MrsWallbreaker 3 авг 2024 в 06:00

RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL

Простой

8 мин

808

Машинное обучение * Искусственный интеллектNatural Language Processing *

Продолжаем разбирать части пайплайна RLHF с точки зрения исторической ретроспективы, чтобы понять, как сформировалась идея, которая сегодня лежит в основе самых популярных LLM.

В первой части мы ознакомились с общим пайплайном RLHF, LLM, KL-контролем и необходимостью предобучения на пусть и грязных, но больших данных

Во второй - сравнили Offline RL и Online RL, увидели их ограничения, попробовали имитировать Online RL через self-play и непрерывную обратную связь от среды через Reward Modelling. А еще первый раз задумались о сборе непротиворечивой но достаточно полной обратной связи от человека.

Здесь мы, наконец-таки, добавляем этап дообучения с учителем на качественных демонстрациях и осознаем важность контроля за сбором человеческой обратной связи.

Читать далее

+2

dumonten 3 авг 2024 в 05:17

OpenSource на поле против OpenAI: Function Calls здесь и сейчас для самых маленьких… ресурсов

Средний

12 мин

3.6K

Natural Language Processing * Open source * Искусственный интеллектМашинное обучение * Программирование *

Из песочницы

Вызов функций на локально развернутых LLM возможен. Прочитайте статью и узнайте, как это можно реализовать и насколько хорошо это работает!

Читать далее

+7

yakvenalex 2 авг 2024 в 04:00

Эффективные запросы к ChatGPT и подобным моделям: Полное руководство по идеальной формуле

Простой

3 мин

3.6K

Natural Language Processing *

Туториал

Всем привет! В этой статье я расскажу вам о единственной формуле, которую нужно знать, чтобы мастерски составлять запросы (промты) к ChatGPT и получать точные и полезные результаты. Я потратил множество часов на составление текстовых запросов к ChatGPT и анализирование полученных результатов, а также изучил множество научных публикаций по этой теме. Сегодня я поделюсь с вами этими знаниями.

Читать далее

+1

AlanRobotics 31 июл 2024 в 12:32

Вызов функций с помощью LLM

14 мин

7.1K

Блог компании MWS AIБлог компании МТСNatural Language Processing * Искусственный интеллектМашинное обучение *

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

Читать далее

+12

pavelmedvedev79 30 июл 2024 в 15:36

Мобильный AI на рабочем месте. Ищем реальную ценность

Простой

10 мин

2.6K

Блог компании SamsungNatural Language Processing * Искусственный интеллектБизнес-модели * Машинное обучение *

Кейс

Ещё пятнадцать лет назад я думал о том, почему в смартфоне нет функции создания транскрипта аудиозаписи. Диктофон превратился в приложение для смартфона, но по-прежнему требовал последующего прослушивания и ручного конспектирования аудио. А вот AI сделал транскрибирование доступным рядовому пользователю.

И эта мысль навела меня на размышления об искусственном интеллекте вообще. Я не понимал причину шума вокруг AI все эти годы. Можно понять специалистов по Natural Language Processing или компьютерному зрению, у которых реально возросла эффективность алгоритмов благодаря глубинному обучению. Остальным-то что с этого?

Читать далее

+6

aarmaageedoon 29 июл 2024 в 13:54

Долой рандом, или ищем лучшие настройки для аугментации текстов

Средний

9 мин

1.2K

Блог компании MWS AIБлог компании МТСNatural Language Processing * Искусственный интеллектМашинное обучение *

Туториал

Всем привет. На связи Игорь Буянов, старший разработчик в MTS AI. Этот пост — текстовый вариант моего доклада, с которым я выступал в прошлую пятницу на Pycon 2024. Расскажу о том, как мы оптимизировали параметры аугментаций для текстовых данных и что из этого получилось. Текст рассчитан на широкий круг читателей, поэтому если вы слышите про аугментации впервые — не пугайтесь, разберемся.

Читать далее

+3

svetofor_columb 29 июл 2024 в 09:57

Используем LLM, чтобы найти «бриллианты» в тексте

Средний

6 мин

2.7K

Блог компании Innovative PeopleNatural Language Processing * Big Data * Data Mining *

Туториал

Привет всем! Меня зовут Александр Григорьев и я продуктовый аналитик в Innovative People.

Год назад я писал про то, как с помощью современных LLM извлечь из множества текстовых данных эмбеддинги, и на их основе сделать аналитику того, какие темы есть в тексте.

Спустя время у меня и моих коллег накопилось несколько вопросов:

Читать далее

+1

ivolake 29 июл 2024 в 09:00

Turbo ML Conf 2024 — по следам

Сложный

10 мин

886

Информационная безопасность * Машинное обучение * Natural Language Processing *

Репортаж

В формате разбора содержания докладов я, автор канала @borismlsec, приведу три интереснейших из тех, что мне довелось посетить на конференции Turbo ML 2024. Они привлекли меня не только как дата саентиста, но и как сотрудника вендора решений по кибербезопасности. И по каждому докладу в конце я расскажу, почему.

Читать далее

+2

Tarzan3668 27 июл 2024 в 08:10

Как оживить Кандинский матрицами вращений для генерации видео — модель Splitter (часть 2-я)

Средний

7 мин

917

Работа с видео * Обработка изображений * Машинное обучение * Искусственный интеллектNatural Language Processing *

В первой части, я познакомил вас с новым подходом, использующим матрицы вращений для генерации видео моделями text-2-image.

Во второй части двигаемся к решению задачи на основе машинного обучения через:
- формализацию функции потерь;

- построение базовой модели Splitter, по сути, обучаемой матрицы вращений;

- построение алгоритма обучения на векторизованном датасете из 200-500 роликов.

И посмотрим первые результаты.

Читать далее

+1

MrsWallbreaker 26 июл 2024 в 06:00

RLHF. История становления идеи — 2. Offline RL, Self-play, Reward Model

Средний

10 мин

1.1K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Продолжаем разбирать внутренние детали пайплайна RLHF (обучение с подкреплением на основе обратной связи от человека). Это крайне популярный и широко используемый способ повысить согласованность языковой модели. Разбираем части пайплайна RLHF с точки зрения исторической ретроспективы, чтобы понять, как сформировалась идея, которая сегодня лежит в основе самых популярных LLM.

Прошлый раз мы поговорили об LLM, предобучении на больших данных и KL‑контроле.

В этой части разбираемся с тем, какую обратную связь и как собирать, какую технику обучения использовать - Offline или Online RL, можно ли как то обойти ограничения Offline и Online RL и одновременно использовать преимущества обоих подходов, пробуем self-play и учимся имитировать человеческую обратную связь с помощью модели вознаграждений (Reward Model).

Читать далее

+5

ngmdite 23 июл 2024 в 10:52

Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных

Простой

13 мин

1.6K

Анализ и проектирование систем * Big Data * Машинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

Всем привет!

Меня зовут Дима Савелко, я лид команды нейро-сети.рф.

В мире, где короткие видеоролики становятся все более популярными, создателям видео контента все сложнее находить релевантные видео для своих целей. Мы решили эту проблему, создав сервис по поиску видеоконтента с помощью текста.

В статье мы расскажем, как мы использовали современные AI-технологии, чтобы сделать поиск видео быстрым и точным. Узнайте, какие решения мы приняли на каждом этапе разработки, и как наш сервис может улучшить вашу работу с видеоконтентом. Мы поделимся практическими советами и опытом, чтобы помочь вам избежать ошибок и максимально эффективно использовать возможности AI. Читайте нашу статью и узнайте, как сделать поиск видео проще и эффективнее!

Читать далее

+7

LegalResources 23 июл 2024 в 09:30

Наш опыт применения AI-технологий для классификации документов для подачи в суд

Простой

5 мин

1.3K

Обработка изображений * Машинное обучение * Natural Language Processing *

Из песочницы

Как мы создали, обучили и выпустили в свет сервис, использующий технологию машинного обучения для распознавания и классификации юридических документов? В этой статье мы расскажем об опыте разработки этого решения для автоматизации труда юристов и взыскателей, и о трудностях на этом пути.

Читать далее

+3

aufklarer 22 июл 2024 в 20:16

Большие языковые модели: от предобучения до обучения на инструкциях

Средний

9 мин

3.1K

Natural Language Processing * Искусственный интеллект

Обзор

Перевод

Это перевод моей статьи об обучении языковых моделей на medium.com. Год назад я подготовил краткое исследование на тему языковых моделей, и для закрепления практики начал пробовать дообучение (fine-tuning) больших языковых моделей (LLM) для различных прикладных задач. Первоначально, я получил противоричивые результаты, это подтолкнуло меня к более глубокому изучению теории обучения. В этой статье я решил описать мои теоретические изыскания, и дополнить рядом примеров, полученных на личном опыте. Для обучения opensource модели используются различные дадасеты, так же они публикуются с разлиных стадий обучения, и успех дообучения зависит от выбора правильной базовой модели. На практике, конвейер обучения больших языковых моделей состоит из нескольких фиксированных этапов: Первый этап — предварительное обучение, которое включает обучение на массивном корпусе текста с использованием задачи предсказания следующего токена. На этом этапе модель учит модель языка или языков. Далее следует обучение с учителем (Supervised fine-tuning) на парах "запрос-ответ”, адаптированных к конкретной задаче. Одной из самых распространенных задач на этом этапе является способность модели отвечать на запросы в формате чата. Наконец, подстройка под пользовательские предпочтения, она проводится с использованием техники обучения с подкреплением на основе обратной связи от человека (Reinforcement Learning from Human Feedback), так же назваемся instruct fine-tuning. Хорошим описанием этого процесса является технический отчет по языковой модели Qwen [1]. Они описали этапы обучения и опубликовали три модели: предварительно обученную базовую модель, обученную с учителем модель чат-модель и модель, дообученную на пользовательских предпочтениях с использованием RLHF.

Читать далее

+4

vignatovic 21 июл 2024 в 23:23

Проблемы с логикой у LLM и с доверием не только у LLM

Простой

21 мин

3.8K

Машинное обучение * Исследования и прогнозы в IT * Искусственный интеллектБудущее здесьNatural Language Processing *

Аналитика

Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной — оценке доверия к публикациям и их авторам вообще. Вторая проблема — LLM не умеет решать простые логические задачи легко решаемые грамотными людьми, что свидетельствует о сходстве LLM с неграмотными людьми неспособными к абстрактному мышлению. В ближайшем будущем LLM не сможет достичь уровня логического мышления грамотного человека, зато LLM обладает большими чем у человека способностями к эриксоновскому гипнозу, а значит и к мошенничеству.

Читать далее

+21

1 2 ...

20

21 22 ...