Все потоки

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

СтатьиПостыНовостиАвторыКомпании

Ata_Akhunzhanov 5 часов назад

Как спроектировать AI ассистента для поддержки и не слить бюджет. Часть 1: От идеи до выбора архитектуры

Простой

19 мин

2.5K

Open source * Natural Language Processing *

Из песочницы

Каждая команда сейчас хочет заменить людей на AI. Но есть другой подход - усилить текущие возможности с помощью AI. Это может быть крутым драйвером для масштабирования и роста, а не поводом для увольнения.

Покажу как спроектировать агента который решает проблемы и можно внедрять в продакшен. Буду рассказывать на примере юридической поддержки, но подход универсальный. Поговорим про RAG и GraphRAG, про развёртывание и выбор модели. Статья будет полезна как для больших компаний так и для маленьких - разница только в том где вы будете хранить и обрабатывать данные с LLM.

Читать далее

0

python_leader 8 дек в 09:14

Гибридный подход к контексту: как сделать LLM-агентов быстрее и дешевле

Средний

11 мин

6.9K

Программирование * Искусственный интеллектМашинное обучение * Natural Language Processing * Будущее здесь

Аналитика

Перевод

Команда AI for Devs подготовила перевод статьи о том, как AI-агенты на базе LLM тратят лишние деньги из-за разрастающегося контекста и как простое маскирование наблюдений нередко работает лучше сложного LLM-суммирования. Авторы предлагают гибридный метод, который делает агентов дешевле и надёжнее без дообучения модели.

Читать далее

+2

PaGul 8 дек в 08:47

GigaMemory на AI Journey Contest 2025: итоги

Средний

7 мин

7.5K

Блог компании СберИскусственный интеллектNatural Language Processing * Алгоритмы * Машинное обучение *

Приветствуем всех! С вами снова ML-команда RnD для B2C SberAI. Этой осенью в рамках AI Journey Contest 2025 мы представили задачу GigaMemory: global memory for LLM. Её цель — создание автономного модуля долговременной памяти для языковых моделей, способного накапливать и использовать знания о конкретном пользователе, по сути наделяя ИИ способностью «помнить» своего собеседника.

Пришло время объявить результаты соревнования и разобрать лучшие решения участников!

Читать далее

+19

master_program 8 дек в 03:59

Логический компас для искусственного интеллекта

Средний

6 мин

7.4K

Искусственный интеллектМатематика * Научно-популярноеNatural Language Processing * Контент и копирайтинг *

Международный коллектив ученых из Сколковского института науки и технологий, МФТИ, Института исследований искусственного интеллекта (AIRI) и Университета Париж-Сите разработал новый, элегантный метод для проверки логических способностей больших языковых моделей (LLM). Вместо того чтобы судить о правильности рассуждений нейросети лишь по ее финальному ответу, исследователи научились заглядывать внутрь ее механизма «внимания» и находить там скрытые паттерны, отвечающие за проверку логики. Этот подход, названный QK-score, позволяет с высокой точностью определять, следует ли модель законам логики на каждом шаге своих рассуждений, делая ее работу более прозрачной и надежной. Результаты исследования, открывающие путь к созданию более предсказуемого и безопасного ИИ, были приняты на main track of EMNLP 2025, и опубликованы в виде препринта на портале arXiv.

Читать далее

+2

DankosJP 7 дек в 23:19

Фактчекинг за $0.09: GPT-5-mini + Perplexity sonar-pro в продакшене

Средний

12 мин

11K

Машинное обучение * Kotlin * Искусственный интеллектNatural Language Processing * Анализ и проектирование систем *

Кейс

35–40 фактчеков в день. $110 в месяц. 30 секунд на проверку вместо часа.
Это не маркетинговые обещания — это наш production за два месяца. Рассказываю, как мы построили автоматический фактчекинг для новостного пайплайна: почему Perplexity, а не LLM + web_search; какие параметры поиска реально работают; и почему пришлось писать свой клиент вместо SpringAI.

Читать далее

+5

Biryukovlex 7 дек в 09:33

Вайб-ЛЛМинг. AI агенты теперь сами обучают LLM с помощью Hugging Face Skills

Простой

3 мин

7.9K

Искусственный интеллектБудущее здесьНаучно-популярноеOpen source * Natural Language Processing *

Обзор

Hugging Face релизнули Skills — Agent Context Protocol (ACP), через который упаковываются определения разных задач для ИИ агентов. По сути — это папки, в которых собраны инструкции, скрипты и ресурсы для использования ИИ агентом под конкретный кейс.

Один из перых скиллов — дообучение опенсорсных LLM. Разбираемся подробнее.

Читать далее

-2

Tr3z0r 5 дек в 17:47

Fine-tune Qwen3 за написание позитивных отзывов о ресторанах

Средний

5 мин

7.2K

Python * Natural Language Processing * Изучение языковМашинное обучение *

Из песочницы

Генератор отзывов о ресторане:

Собрано почти 16 000 положительных отзывов от ресторанов с оценкой выше 4,7 (из 5), расположенных в Москве с https://yandex.ru/maps. Использованная модель — Qwen3-4B Qwen3 как поддерживающий русский язык. Для обучения модели в течение двух эпох использовалась библиотека Unsloth с LoRA. В результате был выбран LoRA 32-го ранга и обучено 66 млн параметров. Теперь модель может дать хороший новый обзор:

Целью было понять, как можно начать проект с нуля.

Читать далее

-1

madballer34 4 дек в 14:52

«Когда агенты перестают говорить»: как LatentMAS предлагает новый язык общения ИИ-агентов

Простой

4 мин

7.3K

Блог компании ТехнократияИскусственный интеллектNatural Language Processing * Научно-популярное

Мультиагентные системы на базе LLM почти всегда строятся вокруг текстовой коммуникации. Агенты объясняют друг другу планы, уточняют шаги, формируют выводы — всё это через генерацию токенов. Такой подход кажется естественным, но он порождает фундаментальные проблемы: текст генерируется медленно, ошибки формулировок на ранних этапах распространяются вниз по цепочке, а количество токенов растёт лавинообразно.

Исследователи из Принстона, Стенфорда и Иллинойса предлагают другой путь: отказаться от текстовых сообщений между агентами и вместо этого обмениваться скрытыми представлениями модели. Их система, LatentMAS, показывает, что модели могут сотрудничать напрямую в латентном пространстве — там, где их мысли существуют изначально.

Читать далее

+4

Kubataba 4 дек в 14:24

Токенизация, как ключ к языковым моделям для низкоресурсных языков

Средний

10 мин

6.7K

Natural Language Processing * Python * Машинное обучение * Изучение языков

Мнение

Привет Хабр, меня зовут Эдуард, и я хочу поделиться своими наблюдениями о том, как статистические алгоритмы извлекают грамматику из текстов.

Читать далее

+1

Eco_coder 4 дек в 06:33

Сердце не сыто. Python помогает раскрыть особенности мастерства поэта Вознесенского

Простой

4 мин

6.2K

Научно-популярноеЧитальный залPython * Natural Language Processing * Занимательные задачки

Аналитика

Можно ли было читать советские стихи американцам? Пытаюсь выяснить это с помощью Python на примере Андрея Вознесенского.

Читать далее

+1

python_leader 2 дек в 11:30

Огромный гайд: продвинутые советы и хитрости для работы с Gemini CLI и другими AI CLI утилитами

Простой

67 мин

8K

Программирование * Машинное обучение * Искусственный интеллектБудущее здесьNatural Language Processing *

Туториал

Сезон ИИ в разработке

Перевод

Команда AI for Devs подготовила перевод большого гайда о скрытых возможностях и продвинутых техниках работы с Gemini CLI. Если для вас терминал — рабочий дом, то этот материал покажет, как превратить Gemini CLI в полноценного ИИ-агента, который автоматизирует рутину, подключается к внешним сервисам и расширяется под любые задачи.

Читать далее

+2

Kubataba 2 дек в 08:53

Локальный переводчик и синтез голоса на Кабардинском языке

Средний

4 мин

5.5K

macOS * Natural Language Processing * Изучение языков

Из песочницы

Привет, Хабр! Меня зовут Эдуард, и сегодня я хочу рассказать о своём проекте Kabardian Translator — локальном переводчике с озвучкой для кабардинского языка. Эта история началась с сотрудничества с командой Silero TTS и превратилась в инструмент, который, надеюсь, поможет соотечественникам за границей учить родной язык.

Читать далее

+14

Eco_coder 1 дек в 15:10

«Король глядит угрюмо…» — а я считаю звуки. Цифровое сравнение Стивенсона и Маршака

Простой

4 мин

8.9K

Python * Natural Language Processing * Занимательные задачкиЧитальный зал

Аналитика

Стивенсон и Маршак. Схватка поэтических тяжеловесов, которую можно судить с помощью кода Python. Награда - вересковый мед.

Читать далее

+5

andrewargatkiny 1 дек в 12:39

Как свергнуть короля: формула для линейной альтернативы Трансформеру без побочных эффектов

Сложный

11 мин

8.2K

Блог компании VKМашинное обучение * Искусственный интеллектNatural Language Processing * Алгоритмы *

Обзор

Привет! На связи Андрей Аргаткин, руководитель научной группы исследований эффективных архитектур нейронных сетей ИМШ ВШЭ. Я хочу рассказать о нашем текущем исследовании в рамках совместного образовательного проекта с VK. В ходе исследования мы надеемся выделить волшебную формулу из недавней архитектуры DANet (1, 2) и экстраполировать её на широкий спектр других моделей, что позволит им стать такими же крутыми по качеству, но гораздо более быстрыми и эффективными, чем бессменный король мира нейронных сетей — Трансформер. Эта формула должна избавить от побочных эффектов предыдущих архитектур, пытавшихся стать ему заменой. Но сначала поговорим, зачем всё это вообще нужно.

Читать далее

+18

ContentAI_Team 28 ноя в 18:27

Как корпоративный поисковый портал стал платформой для цифровых ассистентов

11 мин

3.5K

Блог компании Content AIИскусственный интеллектNatural Language Processing * Поисковые технологии *

Привет! Меня зовут Антон Фролов — я ведущий менеджер продукта в Content AI. В этой статье расскажу, как мы превратили корпоративный поисковый портал Intelligent Search в платформу для создания цифровых ассистентов с поддержкой LLM.

Если у вас уже есть прототип ассистента на базе open-source компонентов, платформа может помочь оперативно разработать решение production-уровня для автоматизации различных процессов с внутренними документами.

Читать далее

+9

void0null 28 ноя в 12:23

Kandinsky 5.0: линейка open-source моделей генерации изображений и видео нового поколения

Сложный

9 мин

11K

Блог компании СберБлог компании SberDevicesМашинное обучение * Natural Language Processing * Обработка изображений *

Обзор

В сентябре мы открыли доступ к Kandinsky 5.0 Video Lite, лёгкой модели с 2 млрд параметров для создания видео по тексту или на основе изображения. Теперь мы выкладываем в open source и все остальные модели линейки Kandinsky 5.0: Video Pro и Image Lite!

Читать далее

+28

Eco_coder 28 ноя в 08:24

Я пена морская. Как BERT не справился с анализом простой поэзии

Простой

3 мин

7.5K

Natural Language Processing * Python * Занимательные задачкиЧитальный зал

Аналитика

Небольшой опыт использования модели для определения эмоций. Я пытался найти эмоции у Цветаевой с помощью Python. Да не смог.

Читать далее

+2

yaroslav_bespalov 26 ноя в 12:31

MAESTRO — новый фреймворк для построения мультиагентных систем и цифровых ассистентов на основе LLM

Сложный

19 мин

7.2K

Блог компании AIRIИскусственный интеллектМашинное обучение * Алгоритмы * Natural Language Processing *

Кейс

Привет, Хабр! За последний год стало ясно, что использование нескольких LLM в агентном режиме приносит существенно больше пользы, чем простая сумма их компьюта по отдельности. Гибкость, распределение ролей и активное взаимодействие моделей позволяет достичь значительных успехов в самых различных задачах, включая создание полезных цифровых ассистентов.

Построением таких систем заняты многие команды по всему миру. Чтобы ускорить прогресс в этом направлении и помочь коллегам, мы в группе «Мультимодальные архитектуры ИИ» AIRI создали новый фреймворк под названием MAESTRO — Multi‑Agent Ecosystem of Task Reasoning and Orchestration. Мы представили его на конференции AI Journey 2025, которая прошла в Москве на прошлой неделе.

В этой статье нам бы хотелось поподробнее рассказать о нашей разработке, описать устройство фреймворка и дать примеры его использования.

Читать далее

+5

CyberexTech 26 ноя в 09:05

Как я Альфе новый навык делал и что из этого вышло

Средний

11 мин

8.3K

Блог компании Timeweb CloudNatural Language Processing * Python * Голосовые интерфейсы * DIY или Сделай сам

Кейс

Привет, Хабр!

Время от времени я возвращаюсь к своему pet-проекту голосового ассистента с кодовым именем «Альфа», который разрабатывался как приватный голосовой интерфейс (а-ля «умная колонка») для управления своим «Умным домом». И в этот раз – так сошлись звезды или под влиянием магнитных бурь – мне очень захотелось добавить новый навык. А что из этого вышло, читайте далее.

Читать далее

+24

python_leader 26 ноя в 08:30

Почему LLM врут настолько убедительно?

Простой

10 мин

7.8K

Программирование * Машинное обучение * Искусственный интеллектБудущее здесьNatural Language Processing *

Перевод

Команда AI for Devs подготовила перевод статьи о том, как быстро растущие AI-ассистенты меняют саму природу разработки. Их код выглядит безупречно — но всё чаще решает не ту задачу, что стоит перед нами. Где проходит граница между ускорением и самообманом, и какую новую ответственность это накладывает на инженеров?

Читать далее

+4

1

2 3 ...