Natural Language Processing *

Компьютерный анализ и синтез естественных языков

СтатьиПостыНовостиАвторыКомпании

janvarev 15 мая 2024 в 14:01

Да, это не OpenAI — на Google I/O показали LLM Gemini Flash 1.5 с дешевым контекстом на 1 миллион токенов

Простой

5 мин

8.6K

Блог компании Timeweb CloudNatural Language Processing * Искусственный интеллектМашинное обучение *

Google I/O, на удивление, не повезло. Крупнейшие анонсы от Google в сфере ИИ остались в тени конференции OpenAI, которая прошла 13 мая — на Хабре было сразу несколько постов о бьющей рекорды GPT-4o, в то время как о конференции Гугла была достаточно небольшая новость.

В общем, давайте вкратце расскажу, на что (предположительно) делает ставку Google, а также как я, как ~~упоротый~~ большой фанат LLM уже подключил Gemini Flash и GPT-4o в свой сервис VseGPT (доступ к нейросетям из России по API), и про то, как они ощущаются на русском языке.

Читать дальше →

+15

ozlik 15 мая 2024 в 12:45

Создаём свою стример-тян из зефира и палок

Средний

127 мин

59K

Python * Java * SQLite * Машинное обучение * Natural Language Processing *

Наверняка вы слышали о нашумевшей в своё время ИИ стримерше NeuroSama. Однако мое внимание привлекало не само шоу и эти нашумевшие самые «крутейшие» моменты стримов, а сам факт того, что нейросеть реально может полностью автономно и полноценно вести стрим, удерживая внимание зрителей! Меня очень заинтересовала такая задумка, и я решился её повторить!

В этой статье я расскажу о попытке создать свою нейро-тян для русского сегмента, которая сможет автономно и без перерывов играть и вести трансляции на различных стриминг-платформах и ~~буллить кожаных мешков~~ конечно же развлекать зрителей и игроков, не получая баны! В результате получился самый настоящий ~~гомункул~~ киборг-убийца (мозгов) квадратных людей, поэтому запасайтесь бочкой кваса и ванной попкрона, как и в прошлый раз, приключение обещает быть жарким, но не только потому, что скоро лето, а ещё потому, что сейчас весна (и сопутствующее весеннее обострение), ведь мы с вами будем создавать настоящую (виртуальную) девушку-стримера!

Может, немного опоздал с трендом, но не пропадать же добру просто так! Кому-нибудь да пригодится (хотя бы для того, чтобы посмеяться или кринжануть с человека, который год занимался никому не нужной фигнёй).

Статья получилась без преувеличения огромной из-за совмещения просто ТУЧИ разных технологий и необходимости погружения в тонкости некоторых, так что отправьте ссылку себе на комп, расположитесь поудобнее и предупредите свою попу, что она рискует не отрываться от стула на протяжении целого часа!

Будет весело, сложно и очень интересно как опытному «бойцу», так и простому обывателю!

Читать далее →

+62

Jlyu 14 мая 2024 в 09:00

Prompt engineering — путь к эффективной работе с ChatGPT

16 мин

25K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftИскусственный интеллектNatural Language Processing *

Привет, Хабр! Меня зовут Илья Козырёв, я — CTO и Co-Founder в Raft. Много работал в консалтинге в сфере ритейла и фармацевтики, имею экспертизу в обработке данных, специализируюсь на ML/AI. А ещё я — участник опенсорсного продукта по обработке данных Apache Beam, помогаю запускать продукт по ценообразованию.

В этой статье расскажу, как эффективно работать с ChatGPT в разных задачах и архитектуре. Многие пробовали, но не у всех получилось.

+29

perevalov_a 13 мая 2024 в 20:46

OpenAI релизнула GPT-4o и мы её уже внедрили

Простой

3 мин

50K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

13 мая 2024 года запомнится как важная веха в мире искусственного интеллекта. OpenAI провела долгожданное обновление, представив GPT-4o и множество улучшений для ChatGPT. Эти новинки имеют все шансы изменить то, как мы взаимодействуем с ИИ в повседневной жизни. Мы уже успели внедрить новую модель и протестировали как она работает.

OlegSivchenko 12 мая 2024 в 18:11

ChatGPT как мутная ксерокопия Интернета

13 мин

28K

Машинное обучение * Научно-популярноеИскусственный интеллектNatural Language Processing *

Перевод

В 2013 году сотрудники одной немецкой строительной компании заметили кое-какую странность в работе корпоративного аппарата Xerox. Всякий раз, когда копировалась планировка этажа в стоящемся здании, копия отличалась от оригинала в одном тонком, но в очень важном аспекте. В оригинальной версии планировки в доме различались три комнаты, и у каждой из них в прямоугольнике была подписана площадь этой комнаты: 14,13, 21,11 и 17,42 квадратных метра соответственно. Но на ксерокопии было написано, что все три комнаты имеют площадь по 14,13 квадратных метра. Компания обратилась к информатику Давиду Кризелю с просьбой, почему получается такой, казалось бы, немыслимый результат. Здесь требовалась именно консультация информатика, так как в современных аппаратах не применяется физический ксерографический процесс, впервые популяризованный в 1960-е. Вместо этого аппарат создаёт цифровую копию документа, а затем распечатывает полученный файл (изображение). При этом учтём, что для экономии дискового пространства почти все цифровые файлы изображений подвергаются сжатию — и разгадка этого таинственного случая начинает напрашиваться сама собой.

+73

slivka_83 29 апр 2024 в 15:34

Подбор гиперпараметров RAG-системы с помощью Optuna

Средний

16 мин

13K

Python * Data Mining * Машинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

Сказ о том, как с помощью Opuna’ы сделать вашу RAG-систему чуточку (а может и не чуточку) эффективнее :)

Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

+15

Motoroller_love 28 апр 2024 в 14:15

LLM Leaderboard за апрель 2024

Простой

2 мин

6.3K

Natural Language Processing * Машинное обучение * Python * Open source *

Обзор

Привет, Хабр!

Сегодня мы поговорим о том, какие LLM лучше всего работают на бизнес-задачах. AI-хайп находится на локальном пике, похоже, что весь мир только и делает, что внедряет AI-фичи в свои продукты, собирает миллионы на разработку еще одной оболочки для ChatGPT, заполняет свои ряды AI-тулами и, кажется, предоставляет работу роботам, пока сами попивают кофе в старбаксе.

SergeyBPshenichnikov 27 апр 2024 в 07:21

Вербальные вычисления (VC) в доказательных DSS и NLP

Средний

13 мин

1.4K

Natural Language Processing * Искусственный интеллектМатематика * Семантические сети *

FAQ

С.Б. Пшеничников

В статье изложен новый математический аппарат вербальных вычислений в NLP (обработке естественного языка). Слова погружаются не в действительное векторное пространство, а в алгебру предельно разреженных матричных единиц. Вычисления становятся доказательными и прозрачными. На примере показаны развилки в вычислениях, которые остаются незамеченными при использовании традиционных подходов, а результат при этом может быть неожиданным.

Использование IT в обработке естественного языка (Natural Language Processing, NLP) требует стандартизации текстов, например, токенизации или лемматизации. После этого можно пробовать применять математику, поскольку она является высшей формой стандартизации и превращает исследуемые объекты в идеальные, например, таблицы данных в матрицы элементов. Только на языке матриц можно искать общие закономерности данных (чисел и текстов).

Если текст превращается в числа, то в NLP это сначала натуральные числа для нумерации слов, которые затем погружаются в действительное векторное пространство.

Возможно, следует не торопиться это делать, а придумать новый вид чисел более пригодный для NLP, чем числа для исследования физических явлений. Такими являются матричные гипербинарные числа. Гипербинарные числа - один из видов гиперкомплексных чисел.

Для гипербинарных чисел существует своя арифметика и если к ней привыкнуть, то она покажется привычнее и проще пифагорейской арифметики.

В системах поддержки принятия решений (DSS) текстами являются оценочные суждения и пронумерованная шкала вербальных оценок. Далее (как и в NLP) номера превращаются в векторы действительных чисел и используются как наборы коэффициентов средних арифметических взвешенных.

phillennium 26 апр 2024 в 11:04

Про ML по-серьёзному: что расскажут в докладах на I'ML

7 мин

3.5K

Блог компании JUG Ru GroupNatural Language Processing * Искусственный интеллектКонференцииМашинное обучение *

Слова «доклад про AI/ML» могут звучать словно очередной рассказ про будущее, где вкалывают роботы, а не человек. Такое мы все уже слышали сто раз.

Но на нашей онлайн-конференции I'ML всё будет иначе:
— Она рассчитана на тех, кто лично использует ML в проектах.
— Она не о далёком будущем, а о вопросах, актуальных уже здесь и сейчас.
— Она не об абстрактном («было бы здорово…»), а о конкретном: «как бороться с ML-галлюцинациями», «как рекомендовать размер одежды с помощью ML».
— Она не о том, как «нейросети отберут работу», а наоборот: о ML-работе, которую нейросети нам дали.

В общем, она не для желающих просто пофантазировать, а для специалистов, желающих эффективно работать.

А что именно там будет? До конференции остался месяц, и мы представляем Хабру её программу:

efreelancer 26 апр 2024 в 07:00

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Средний

11 мин

Python * Машинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

Приветствую, хабровчане!

Сегодня пятница, поэтому предлагаю немного пошалить и поговорить о слегка необычном, но весьма забавном проекте обучения нейросетевой модели на базе LLaMA2 7B, которая умеет превращать невинные предложения на русском языке в чуть более "токсичные" их версии.

Но обучать модель мы будем не абы как, а при помощи недавно вышедшего в свет проекта под названием TorchTune, так как надо ведь пробовать новые инструменты, иными словами, предлагаю соединить тему интересную с темой полезной.

Так что пристегнитесь, будет весело и слегка токсично!

badcasedaily1 19 апр 2024 в 18:05

Пять лучших NLP инструментов для работы с русским языком на Python

Простой

5 мин

29K

Блог компании OTUSПрограммирование * Машинное обучение * Natural Language Processing *

Обзор

В этой статье рассмотрим пять лучших библиотек Python, предназначенных специально для работы с русским языком в контексте NLP. От базовых задач, таких как токенизация и морфологический анализ, до сложных задач обработки и понимания естественного языка.

+10

murat_apishev 19 апр 2024 в 13:57

Как учить большие языковые модели (теоретический туториал)

Средний

1 мин

8.7K

Natural Language Processing * Искусственный интеллектМашинное обучение *

Туториал

Обзорное видео с доклада об особенностях обучения LLM для тех, кто в теме ML/DL, но хочет расширить кругозор в области работы с большими языковыми моделями. На основе личного опыта и обзора множества научных статей и инструментов. Ссылка на презентацию прилагается.

Смотреть

dt_sicutglacies 19 апр 2024 в 09:21

Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

Простой

11 мин

12K

Блог компании DoubletappМашинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

✏️ Технотекст 7

Привет, Хабр! Меня зовут Даниил, работаю в ML-отделе Doubletapp. В статье расскажу про особенности применения больших языковых моделей для оптимизации бизнес-процессов.

Большая языковая модель (LLM) — это тип языковой модели, который способен распознавать и генерировать осмысленные тексты, а также другие сложные типы данных (например, код). Такого рода модели обучаются на огромных массивах данных, чаще всего собранных из открытых источников.

Тем не менее LLM все еще имеют ряд проблем, одной из которых является галлюцинирование (придумывание фактов). Сложно винить модель за то, что она не знает, как устроен тот или иной процесс/продукт в вашей компании, и пытается придумать вразумительный ответ. Поэтому нужно подсказать LLM фактическую информацию, а она уже даст нам понятную человеку персонализированную реплику.

Такая система ответов на вопросы с использованием фактической информации называется RAG (Retrieval Augmented Generation).

Данная статья состоит из двух частей:

• мы рассмотрим построение RAG-системы на основе библиотеки langchain;

• объективно оценим работоспособность созданной системы, используя синтетические данные на русском языке с помощью фреймворка RAGAs.

ArchitectSimbirSoft 19 апр 2024 в 08:09

«Ревизорро» в IT: тестируем суммаризацию текста в GigaChat и YandexGPT

Простой

7 мин

3.6K

Блог компании SimbirSoftИскусственный интеллектNatural Language Processing *

Мнение

После появления на рынке API для беседы с ChatGPT 3.5 каждый второй заказчик решения на основе машинного обучения (ML) хочет внедрить у себя ИИ, который может красиво и содержательно общаться на русском языке.

Меня зовут Екатерина, я IT-архитектор команды SimbirSoft, специалист по ML и поклонница всего, что связано с обработкой текстов на естественном языке (NLP). Сегодня будем разбираться в тонкостях решения одной из популярных на рынке задач – автоматического составления аннотаций. Для эксперимента мы использовали две GPT-подобных модели, «заточенных» на русский язык: GigaChat и YandexGPT. Заявленный потенциал систем тестировали на текстах трёх жанров: научном, научно-популярном и художественном. Что из этого получилось, расскажем в статье.

Материал будет полезен тем, кто следит за тенденциями развития машинного обучения на рынке и в целом интересуется внедрением больших языковых моделей (LLM) в ML-проектах – для оценки их возможностей «из коробки».

skillfactory_school 17 апр 2024 в 15:17

Как избирательное забывание помогает в обучении ИИ

Средний

4 мин

1.8K

Блог компании SkillfactoryМашинное обучение * Natural Language Processing *

Обзор

Перевод

Удаление определенной информации в процессе обучения помогает моделям машинного обучения быстрее и лучше осваивать новые языки.

Группа ученых в области компьютерных наук придумала более гибкую модель машинного обучения. В чем особенность: модель должна периодически забывать кое-что из того, что знает. Новый подход не заменит огромные модели, но зато, возможно, подскажет нам, как именно они понимают естественный язык.

makeross 15 апр 2024 в 22:11

Векторные БД vs Точность — часть 1

Простой

6 мин

8.6K

Искусственный интеллектNatural Language Processing *

Кейс

Как я пытался собрать "по-быстрому" локальный RAG(retrieval augmentation generation), который будет находить термины из словаря Ожегова. На просторах интернетах все просто. Но на практике для моей задачи это оказалось не так. Точность...

Sivchenko_translate 15 апр 2024 в 14:34

На пути к 1-разрядным моделям машинного обучения

8 мин

4.9K

Natural Language Processing * Машинное обучение * Математика * Программирование *

Перевод

В последнее время активно разрабатываются технологии экстремально малоразрядного квантования, например, BitNet и 1.58 bit. Они пользуются большим интересом в сообществе машинного обучения. Основная идея данного подхода заключается в том, что перемножение матриц с квантованными весами можно реализовать и умножения, что потенциально полностью меняет правила игры применительно к скорости вычислений и эффективности больших моделей машинного обучения.

Эта статья написана в схожем ключе, но нас наиболее интересует, возможно ли напрямую квантовать предобученные модели при экстремальных настройках, в том числе, при двоичных весах (0 и 1). Уже имеющиеся работы нацелены на обучение моделей с нуля. Но в открытом доступе сейчас достаточно много отличных предобученных моделей, таких как Llama2. Более того, обучение с нуля — это ресурсозатратная задача в пересчёте как на вычисления, так и на данные, поэтому такие подходы не слишком доступны в свободном сообществе.

В этой статье мы подробно разберём крайне малоразрядное (2 и 1-разрядное) квантование предобученных моделей с применением HQQ+. HQQ+ — это адаптация HQQ (полуквадратичного квантования), в которой для повышения производительности используется адаптер с низкой размерностью. Наши результаты показывают, что при обучении лишь небольшой части весов в верхней части HQQ-квантованной модели (даже одноразрядной) качество вывода значительно возрастает, такая модель может даже превосходить небольшие модели полной точности.

Модели находятся на Hugging Face: 1-разрядная, 2-разрядная.

+16

VokaMut 15 апр 2024 в 13:32

Тестируем AI на создании прикладного приложения

Средний

11 мин

2.6K

Веб-разработка * Искусственный интеллектNatural Language Processing *

Кейс

Всем привет, я Григорий Тумаков, CTO в Моризо Диджитал.

Недавно рассказал на Хабре, как мы в компании “потрогали” нейросети для прикладных задач разработки. Но там никаких серьезных выводов сделать не удалось.

Поэтому решил на этом не останавливаться. Если есть инструменты — их надо протестировать на какой-то реальной задаче.

Далее в статье наш опыт сравнения для прикладной задачи трех AI-инструментов: Phind, ChatGPT, Machinet.

+11

rmilovanov 12 апр 2024 в 05:01

Как мы тестировали большие языковые модели для модерации отзывов

10 мин

Блог компании Magnit TechМашинное обучение * Искусственный интеллектNatural Language Processing *

Кейс

В приложении «Магнит: акции и доставка» можно оставлять отзывы на товары. Отзывы модерируются: мы публикуем те, которые считаем полезными для других покупателей, — они должны описывать потребительские свойства товара. Отклоняем все остальные: как правило, это жалобы на ценники, сервис в магазине, условия хранения либо просто нерелевантные тексты. Отзывы с жалобами обрабатывают службы поддержки и сервиса.

Рассказываем о том, как мы попробовали применять большие языковые модели, чтобы автоматизировать модерацию отзывов.

+10

ph_piter 11 апр 2024 в 13:56

Книга «Разработка приложений на базе GPT-4 и ChatGPT»

11 мин

18K

Блог компании Издательский дом «Питер»Natural Language Processing * Искусственный интеллектМашинное обучение * Программирование *

Привет, Хаброжители!

Эта небольшая книга представляет собой подробное руководство для разработчиков на Python, желающих научиться создавать приложения с использованием больших языковых моделей. Авторы расскажут об основных возможностях и преимуществах GPT-4 и ChatGPT, а также принципах их работы. Здесь же вы найдете пошаговые инструкции по разработке приложений с использованием библиотеки поддержки GPT-4 и ChatGPT для Python, в том числе инструментов для генерирования текста, отправки вопросов и получения ответов и обобщения контента.

«Разработка приложений на базе GPT-4 и ChatGPT» содержит множество легковоспроизводимых примеров, которые помогут освоить особенности применения моделей в своих проектах. Все примеры кода на Python доступны в репозитории GitHub. Решили использовать возможности LLM в своих приложениях? Тогда вы выбрали правильную книгу.

Читать дальше →

1 2 ...

21 22

24 25 ...

57 58

Natural Language Processing *

Да, это не OpenAI — на Google I/O показали LLM Gemini Flash 1.5 с дешевым контекстом на 1 миллион токенов

Создаём свою стример-тян из зефира и палок

Prompt engineering — путь к эффективной работе с ChatGPT

OpenAI релизнула GPT-4o и мы её уже внедрили

ChatGPT как мутная ксерокопия Интернета

Подбор гиперпараметров RAG-системы с помощью Optuna

LLM Leaderboard за апрель 2024

Вербальные вычисления (VC) в доказательных DSS и NLP

Про ML по-серьёзному: что расскажут в докладах на I'ML

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Пять лучших NLP инструментов для работы с русским языком на Python

Как учить большие языковые модели (теоретический туториал)

Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

Ближайшие события

«Ревизорро» в IT: тестируем суммаризацию текста в GigaChat и YandexGPT

Как избирательное забывание помогает в обучении ИИ

Векторные БД vs Точность — часть 1

На пути к 1-разрядным моделям машинного обучения

Тестируем AI на создании прикладного приложения

Как мы тестировали большие языковые модели для модерации отзывов

Книга «Разработка приложений на базе GPT-4 и ChatGPT»

Вклад авторов