Natural Language Processing *

Компьютерный анализ и синтез естественных языков

СтатьиПостыНовостиАвторыКомпании

murat_apishev 4 мая 2023 в 12:11

Зоопарк трансформеров: большой обзор моделей от BERT до Alpaca

Сложный

59 мин

35K

Блог компании Just AIМашинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

Авторский обзор 90+ нейросетевых моделей на основе Transformer для тех, кто не успевает читать статьи, но хочет быть в курсе ситуации и понимать технические детали идущей революции ИИ.

+27

einhorn 29 апр 2023 в 07:55

Исправляем грамматику с помощью GPT-4 API

Средний

14 мин

20K

JavaScript * Машинное обучение * Искусственный интеллектИзучение языковNatural Language Processing *

Туториал

С самого выхода ChatGPT я начал ее использовать для решения задач корректуры текста: устранения опечаток, исправления ошибок и улучшения стилистики.

Однако, при использовании веб-версии ChatGPT возникают некоторые проблемы:

1. Приходится вчитываться в исправленный текст, чтобы найти изменения

2. Не используется вся мощь API, в котором есть возможности для более тонкой настройки бота: можно задать системное сообщение, в котором объяснить ассистенту смысл его существования; few-shot learning: можно предоставить набор примеров коррекции сообщений

3. Неудобство: нужно вставлять свой текст в веб-версию, затем набирать свой промт для его улучшения (который может быть разным в зависимости от типа коррекции). Хотелось бы иметь Web UI, где нужно просто вставить текст и выбрать тип коррекции - а далее текст будет обрабатываться оптимизированным промтом

Данный проект призван устранить эти недостатки. Потыкать приложение можно здесь (для использования нужен OpenAI API-ключ).

+15

took_the_lead 25 апр 2023 в 08:01

Engshell — автоматизация управления ОС из консоли на базе ИИ

Средний

6 мин

4.1K

Блог компании Timeweb CloudNatural Language Processing * Искусственный интеллектПрограммирование *

Туториал

Изображение взято тут https://morioh.com/p/3c422b57e74e

С появлением больших языковых моделей и доступа к ним, у разработчиков с каждым днем появляется всё больше способов их прикладного применения.

А что, если разработать механизм управления своей операционной системой c помощью ИИ?

Легко! Энтузиасты реализовали логику взаимодействия с системой из консоли с помощью нейросети ChatGPT (GPT-3.5\GPT-4), получив ИИ ассистента. Engshell — умный shell, принимает команды на человеческом языке в свободной форме и с помощью ИИ преобразовывает их в понятные компьютеру консольные команды или исполняемый код на Python.

Читать дальше →

ovsale 24 апр 2023 в 12:36

GPT агент для запросов к большим структурированным документам с «пошаговым сохранением информации»

Простой

3 мин

6.1K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Мнение

Хотел бы продемонстрировать сообществу экспериментальный подход к решению проблемы ограниченного размера контекста в GPT-4. Модель GPT-4 имеет ограничение в 8 тысяч токенов (32 тысячи токенов пока еще недоступны?), что эквивалентно примерно 32 Кбайт английского текста (128 Кбайт для 32 тысяч токенов). Это ограничение подразумевает, что суммарный размер вашего запроса и ответа модели должен быть в пределах этих ограничений. В результате модель не может отвечать на вопросы о больших документах (или обширных программных проектах), так как они не умещаются в контексте модели.

averkij 24 апр 2023 в 09:02

Это не чат, это GigaChat. Русскоязычная ChatGPT от Сбера

Средний

14 мин

129K

Блог компании СберБлог компании SberDevicesМашинное обучение * Искусственный интеллектNatural Language Processing *

Хайп вокруг нейросетей, выровненных при помощи инструкций и человеческой оценки (известных в народе под единым брендом «ChatGPT»), трудно не заметить. Люди разных профессий и возрастов дивятся примерами нейросетевых генераций, используют ChatGPT для создания контента и рассуждают на темы сознания, а также повсеместного отнимания нейросетями рабочих мест. Отдадим должное качеству продукта от OpenAI — так и подмывает использовать эту технологию по любому поводу — «напиши статью», «исправь код», «дай совет по общению с девушками».

Но как достичь или хотя бы приблизиться к подобному качеству? Что играет ключевую роль при обучении — данные, архитектура, ёмкость модели или что-то ещё? Создатели ChatGPT, к сожалению, не раскрывают деталей своих экспериментов, поэтому многочисленные исследователи нащупывают свой путь и опираются на результаты друг друга.

Мы с радостью хотим поделиться с сообществом своим опытом по созданию подобной модели, включая технические детали, а также дать возможность попробовать её, в том числе через API. Итак, «Салют, GigaChat! Как приручить дракона?»

+220

233

leftToddler 24 апр 2023 в 05:34

GPT-4 добавляем новые знания: Git репозиторий

Простой

11 мин

18K

Python * Машинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

GPT-4 позволяет достаточно просто писать boilerplate код с использованием различных языков, технологий и библиотек. Но, есть небольшая проблема, данные GPT-4 не совсем актуальные и ограничены серединой 2021 года.

Проблема ясна, надо как то решать, потому что работать по-старому совсем не хочется. Уже привык, что можно достаточно просто попросить объяснить и сгенерировать код, пускай даже достаточно простого и можно сказать примитивного, но этого зачастую хватает, чтобы быстро понять как можно сделать задачу или найти нужную информацию.

Поехали

+12

AlexBryl27 21 апр 2023 в 09:23

Продолжаем учить английский с chatGPT

Простой

8 мин

6.7K

Изучение языковNatural Language Processing *

3 недели назад я написал статью о том, как я применяю chatGPT для практики разговорного английского. В ней я описал в общих чертах о том, какое задание я отправляю в API openai.com и как прикрутил к этому всему телеграм‑бота на удаленном сервере. Несколько человек спросили, не хочу ли я сделать такого бота не приватным. Я немного подумал и решил, что хочу, поэтому следующие 2 недели я вечерами дописывал бота вместо практики английского языка. В этой статье я расскажу о некоторых интересных вещах, которые я узнал в процессе работы над ботом.

Nastaa 21 апр 2023 в 06:23

Пишем простой ML веб-сервис на FastAPI

Простой

9 мин

27K

Natural Language Processing * Машинное обучение * Python *

Туториал

Данный туториал пошагово разбирает процесс создания веб-приложения для определения тональности текста на основе NLP-модели.

Мы будем использовать модель из библиотеки Hugging Face Hub, но описанный подход подойдет для любой задачи машинного обучения.

План:

1. Загрузка и подготовка модели машинного обучения для использования в веб-сервисе.

2. Создание веб-сервиса с помощью FastAPI.

3. Изучение пользовательского интерфейса FastAPI для удобного ручного тестирования и демонстрации работы приложения.

4. Написание автоматических тестов с помощью библиотеки pytest.

5. Запуск приложения в Docker-контейнере.

Код доступен на GitHub.

Dmitry_zm 19 апр 2023 в 14:41

FRED-T5. Новая SOTA модель для русского языка от SberDevices

10 мин

28K

Блог компании SberDevicesNatural Language Processing * Искусственный интеллектМашинное обучение * Open source *

Уже много времени прошло с момента публикации наших последних языковых моделей ruT5, ruRoBERTa, ruGPT-3. За это время много что изменилось в NLP. Наши модели легли в основу множества русскоязычных NLP-сервисов. Многие коллеги на базе наших моделей выпустили свои доменно-адаптированные решения и поделились ими с сообществом. Надеемся, что наша новая модель поможет вам поднять метрики качества, и ее возможности вдохновят вас на создание новых интересных продуктов и сервисов.

Появление ChatGPT и, как следствие, возросший интерес к методам обучения с подкреплением обратной связью от человека (Reinforcement Learning with Human Feedback, RLHF), привели к росту потребности в эффективных архитектурах для reward-сетей. Именно от «интеллекта» и продуктопригодности reward-модели зависит то, насколько эффективно модель для инструктивной диалоговой генерации будет дообучаться, взаимодействуя с экспертами. Разрабатывая FRED-T5, мы имели в виду и эту задачу, поскольку от качества её решения будет во многом зависеть успех в конкуренции с продуктами OpenAI. Так что если ваша команда строит в гараже свой собственный ChatGPT, то, возможно, вам следует присмотреться и к FRED’у. Мы уже ранее рассказывали в общих чертах об этой модели, а сейчас, вместе с публичным релизом, настало время раскрытия некоторых технических подробностей.

Появление новых, более производительных GPU и TPU открывает возможности для использования в массовых продуктах и сервисах всё более емких моделей машинного обучения. Выбирая архитектуру своей модели, мы целились именно в ее пригодность к массовому realtime-инференсу, поскольку время выполнения и доступное оборудование — это основные факторы, лимитирующие возможность создания массовых решений на основе нейросетевых моделей. Если вы уже используете в своем решении модель ruT5, то подменив ее на FRED-T5 вы, вероятно, получите заметное улучшение значений ваших целевых метрик. Конечно, в скором будущем мы обучим еще более емкие варианты модели FRED-T5 и проверим их возможности — мы планируем и дальнейшее развитие линейки энкодер-декодерных моделей для обработки русского языка.

+39

ru_vds 18 апр 2023 в 13:00

Всё, что вам нужно — это внимание (часть 2)

Сложный

15 мин

15K

Блог компании RUVDS.comNatural Language Processing * Искусственный интеллектМашинное обучение *

Перевод

Источник

Примечание переводчика: Это вторая часть перевода статьи Attention is all you need, с которой началось развитие больших языковых моделей, в том числе чат-бота ChatGPT. Первую часть можно найти здесь.

Читать дальше →

+40

AlexeyChijov 17 апр 2023 в 05:48

Подробная пошаговая инструкция как настроить сервер на Linux и подключение по API к ChatGPT. Для Python и Node.js

Простой

9 мин

21K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

ChatGPT набирает все большую популярность, ведь он может помочь человеку или даже заменить его в ряде задач. С ним можно взаимодействовать не только через графический интерфейс, но и по API. Таким образом его можно встраивать в свои системы, чтобы решать практические задачи бизнеса. Сейчас реализую подобный проект. Решил написать статью, где подробно и пошагово описываю, как настроить сервер Linux (Ubuntu) для интеграции по API с данной нейросетью, на примере Python (Flask) и Node.js (Next.js). Опять же, вы можете использовать не Ubuntu, не Flask и не Next.js, просто адаптировав примеры под себя.

В данной статье описано, как развернуть демо проект от OpenAI (описание здесь: Build your application), а затем доработать его, чтобы задавать свои собственные произвольные вопросы, в том числе и на русском. Также в конце статьи скажу немного про параметры API запросов и модели. Все команды и действия будут из консоли.

use_magic 14 апр 2023 в 14:36

Bag of tricks для разметки текстовых данных: Часть 2. Удаление дубликатов

Средний

9 мин

4.5K

Блог компании MWS AIМашинное обучение * Natural Language Processing * Big Data * Искусственный интеллект

Туториал

Привет! Меня зовут Ирина Кротова, я NLP-исследователь из компании MTS AI. В этой статье из цикла про разметку данных я расскажу об ещё одном способе собирать данные более качественно и экономить на разметке — фильтрации похожих друг на друга текстов.

В предыдущей статье я рассказывала о том, что такое аннотация данных, как это связано с работой инженера машинного обучения и о способах сократить количество ручной разметки в проекте.

NewTechAudit 13 апр 2023 в 07:54

Как научить Наивного Байеса давать персональные рекомендации

Сложный

15 мин

3.2K

Программирование * Машинное обучение * Natural Language Processing *

Кейс

✏️ Технотекст 2023

Привет, Хабр!

С вами Дворников Дмитрий — Data Scientist и участник профессионального сообщества NTA.

Подход, о котором я расскажу, позволяет расширить функциональные возможности метода Наивного Байеса благодаря использованию весовых коэффициентов для различных групп признаков объекта датасета (модель может обучаться не только на отдельных словах в тексте, но также на некоторых метаданных, таких как авторы текста и источник информации).

С помощью разработанной ML‑модели можно улучшить качество классификации текстов при использовании обучающей выборки небольшого объёма (всего 30 объектов) и сократить время обучения модели.

Задача решалась в рамках разработки системы рекомендаций научных статей. Наработки могут быть использованы в любых задачах NLP и Text Mining.

Узнать решение

Zachar_5 11 апр 2023 в 15:47

Решаем проблему галлюцинаций LLM с помощью алгоритма фрактального синтеза ответа

Простой

8 мин

12K

Natural Language Processing * Искусственный интеллектМашинное обучение *

Кейс

Мы с командой разрабатываем FractalGPT — проект самообучающегося ИИ на базе больших языковых моделей(LLM) и логического вывода (reasoning). В этой статье мы расскажем о разработанном нами новом подходе, который называется fractal answer synthesis. Фрактальный синтез ответа позволяет существенно уменьшить уровень «галлюционирования» LLM и, как следствие, является важным шагом к решению проблемы фактологии генеративных нейросетей. По сути подход позволяет перейти от простого векторного представления текста(базы знаний) к его фрактальному представлению — более сложной структуре, инкапсулирующей внутри себя дополнительные «смыслы», которые в содержатся в тексте. В статье мы кратко описали преимущества и недостатки подхода, показали алгоритм построения «фрактального графа», представили принципиальную схему алгоритма и результаты тестирования на нашей базе знаний — статьях и книгах.

+13

gritger 10 апр 2023 в 14:07

За кулисами интеллекта ChatGPT: рассказ о том, как определяют тексты, созданные ИИ

Средний

10 мин

37K

Блог компании «Антиплагиат»Natural Language Processing * Алгоритмы * Машинное обучение * Программирование *

Кейс

Изображение сгенерировано ИИ с помощью сервиса rudalle.ru

В течение нескольких последних месяцев многих, похоже, не покидает ощущение, что на глобальном рынке ИТ могут произойти серьёзные структурные изменения. Сопоставимые с тем, что происходило при появлении графических операционок, или в эпоху бума доткомов, или с появлением смартфонов.

Кто-то предрекает, что «обычные» поисковики и соцсети уйдут в прошлое, а им на смену придёт ChatGPT. Предрекают большое количество новых возможностей — и настолько же большие потрясения на рынке труда: целые профессии станут не нужны. Есть и те, кто считает, что сильный искусственный интеллект совсем рядом и серьёзное внимание нужно уделять вопросам безопасности человечества перед лицом открывающихся угроз со стороны искусственного разума.

Читать дальше →

+12

svetofor_columb 10 апр 2023 в 07:36

О чём все эти люди говорят, ChatGPT?

Простой

7 мин

6.4K

Python * Big Data * Машинное обучение * Natural Language Processing *

Туториал

Всем привет! Я продуктовый аналитик компании Интерсвязь, и у меня, как и у многих, часто всплывает потребность в том чтобы «разложить по полочкам» кучу разных текстов. Например:

1. Я хочу знать, о чем вообще все отзывы в маркете про мой продукт.

2. У меня есть много писем от клиентов на разные темы, и я хочу их систематизировать.

3. Мне может понадобиться проанализировать старые обращения пользователей в техподдержку, которые не были размечены.

+10

Nastaa 7 апр 2023 в 14:37

Начинаем работу с PyTorch 2.0 и Hugging Face Transformers

6 мин

23K

Python * Natural Language Processing * Искусственный интеллектМашинное обучение *

Туториал

Перевод

В этом посте разберем работу с PyTorch 2.0 и Hugging Face Transformers на примере fine‑tune модели BERT для классификации текста.

PyTorch 2.0 лучше по производительности, скорости работы, более удобный для Python, но при этом остается таким же динамическим, как и ранее.

1. Настройка окружения и установка PyTorch 2.0.

2. Загрузка и подготовка датасета.

3. Fine‑tune и оценка модели BERT с помощью Hugging Face Trainer.

4. Запуск инференса и тестирование модели.

+13

leftToddler 6 апр 2023 в 15:39

ChatGPT: влияем на галлюцинации или как потопаешь, так и полопаешь

Простой

10 мин

15K

Машинное обучение * Искусственный интеллектБудущее здесьNatural Language Processing *

Из песочницы

В этой статье посмотрим как можно влиять на так называемые «галлюцинации» ChatGPT.

А что такое эти «галлюцинации»? По сути это придумывание фактов нейронной сетью, ну или просто — враньё. Управление «галлюцинациями» позволит получать то что мы хотим, ну или по крайней мере улучшит вероятность получения правдивого ответа.

+15

NewTechAudit 6 апр 2023 в 08:00

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

Средний

10 мин

5.5K

Машинное обучение * Natural Language Processing * Python *

Кейс

✏️ Технотекст 2023

Привет, Хабр!

Меня зовут Николай Шукан, я Data Scientist и участник профессионального сообщества NTA. Сегодня речь пойдет о методах снижения размерности эмбеддингов для задач определения семантического сходства предложений.

С каждым годом растет сложность моделей, решающих вопросы семантически- и контекстно-ориентированной обработки естественного языка (NLP). Также нельзя забывать и про проблемы мультиязычности моделей. Все это сильно сказывается на увеличении их размеров и системных требований к железу для их обучения, дообучения, да и просто запуска.

Перед мной стояла задача найти и обобщить текстовые данные, представляющие собой массив предложений. Я точно знал, что среди них есть семантически схожие фразы. Однако прямой подход для определения семантического сходства наборов фраз требовал очень много памяти и времени. Чтобы решить эту проблему, я попытался уменьшить размерность векторов признаков предложений, но как понять, когда остановиться и что это даст?

Узнать подробности

mvs 4 апр 2023 в 13:37

От Amazon Lex до GPT-4: как сделать бота со «своими» данными?

Средний

5 мин

6.7K

Natural Language Processing * Искусственный интеллектМашинное обучение * Big Data *

Обзор

Тема ChatGPT и OpenAI моделей сейчас на хайпе. Но на них одних свет клином не сошёлся. Или всё-таки сошёлся? Попробуем разобраться и обойдёмся сегодня без кода, только общие понятия, боль и страдание.

1 2 ...

31 32

34 35 ...

58 59

Natural Language Processing *

Зоопарк трансформеров: большой обзор моделей от BERT до Alpaca

Исправляем грамматику с помощью GPT-4 API

Engshell — автоматизация управления ОС из консоли на базе ИИ

GPT агент для запросов к большим структурированным документам с «пошаговым сохранением информации»

Это не чат, это GigaChat. Русскоязычная ChatGPT от Сбера

GPT-4 добавляем новые знания: Git репозиторий

Продолжаем учить английский с chatGPT

Пишем простой ML веб-сервис на FastAPI

FRED-T5. Новая SOTA модель для русского языка от SberDevices

Всё, что вам нужно — это внимание (часть 2)

Подробная пошаговая инструкция как настроить сервер на Linux и подключение по API к ChatGPT. Для Python и Node.js

Bag of tricks для разметки текстовых данных: Часть 2. Удаление дубликатов

Как научить Наивного Байеса давать персональные рекомендации

Ближайшие события

Решаем проблему галлюцинаций LLM с помощью алгоритма фрактального синтеза ответа

За кулисами интеллекта ChatGPT: рассказ о том, как определяют тексты, созданные ИИ

О чём все эти люди говорят, ChatGPT?

Начинаем работу с PyTorch 2.0 и Hugging Face Transformers

ChatGPT: влияем на галлюцинации или как потопаешь, так и полопаешь

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

От Amazon Lex до GPT-4: как сделать бота со «своими» данными?

Вклад авторов