Все потоки

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

СтатьиПостыНовостиАвторыКомпании

19blackadder97 20 окт в 08:00

EvoPress: новый подход к оптимизации и сжатию LLM от исследователей Яндекса

Средний

8 мин

3.3K

Блог компании ЯндексМашинное обучение * Искусственный интеллектАлгоритмы * Natural Language Processing *

Всем привет! Меня зовут Денис Кузнеделев, я работаю в команде Yandex Research. Моё основное направление деятельности на данный момент — задача сжатия и ускорения больших языковых и картиночных моделей. Затраты на обучение, инференс и деплой LLM стали одной из ключевых инфраструктурных проблем индустрии: дефицит вычислительных ресурсов, нехватка видеопамяти и высокие требования языковых моделей к вычислительным ресурсам препятствуют масштабированию решений.

Сегодня я расскажу о методе неравномерного сжатия нейронных сетей EvoPress, который мы предложили совместно с коллегами из ETH Zurich и представили в июле этого года на одной из ведущих конференций по машинному обучению — ICML.

Читать далее

+39

slivka_83 18 окт в 16:41

Разработка MCP-сервера на примере CRUD операций

10 мин

6.5K

Машинное обучение * Natural Language Processing * Искусственный интеллектData Mining * Python *

Туториал

Model Context Protocol (MCP) — это единый стандарт разработки API для сервисов, с которыми могут взаимодействовать LLM.

В этой статье на простом примере разберем, как создать свой MCP-сервер и как использовать его в связке с LLM.

Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

Читать далее

+20

itmo_mllab 17 окт в 15:25

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

Средний

6 мин

6.1K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

В этой статье мы представляем CoolPrompt - фреймворк автоматической оптимизации промптов (автопромптинга), который предлагает полный пайплайн оптимизации от постановки задачи до оценки результатов новых промптов.

Читать далее

+14

PaGul 17 окт в 10:57

GigaMemory: научи ИИ «помнить всё» с AI Journey Contest 2025

Простой

4 мин

2.8K

Блог компании СберИскусственный интеллектNatural Language Processing * Алгоритмы * Машинное обучение *

Мы всё чаще делегируем ИИ-ассистентам рабочую рутину и бытовые вопросы. Но во взаимодействии с ними есть существенная проблема: модели не помнят пользователя. Между сессиями теряются имя, контекст работы, желаемые ограничения и предпочтения, значительно влияющие на то, что и как стоит ответить пользователю. В итоге диалог каждый раз начинается «с нуля», а ответы звучат усреднённо. Это снижает эффективность и подрывает доверие: когда ассистент не помнит важное о вас, он превращается в поисковик с красивыми фразами.

Мы в команде RnD для B2C SberAI хотим это исправить. Представляем вашему вниманию задачу GigaMemory: global memory for LLM. Мы предлагаем участникам построить долгосрочную персональную память для языковой модели — систему, которая хранит, обновляет и надёжно извлекает знания о конкретном пользователе. Привычки, предпочтения, ограничения и прочие факты о пользователе, которые могут пригодиться в дальнейшем общении.

Цель — научить ИИ отвечать не «в среднем по больнице», а исходя из вашего реального контекста: от прошлых задач на работе до семейных дат и спортивных планов.

Читать далее

+16

python_leader 16 окт в 06:30

Небольшое количество примеров может отравить LLM любого размера

Простой

9 мин

1.8K

Программирование * Машинное обучение * Natural Language Processing * Будущее здесьИскусственный интеллект

Аналитика

Перевод

Команда AI for Devs подготовила перевод исследования в котором учёные показали: чтобы встроить «бэкдор» в большую языковую модель, вовсе не нужно контролировать огромную долю обучающих данных — достаточно около 250 вредоносных документов. Этот результат переворачивает представления о масштабируемости атак через отравление данных и ставит новые вопросы к безопасности ИИ.

Читать далее

+4

Natalia_Bruy 14 окт в 10:27

Почему «больше токенов ≠ лучше» или Как научить LLM работать с длинным контекстом

Простой

11 мин

3.8K

Блог компании MWS AIБлог компании МТСИскусственный интеллектМашинное обучение * Natural Language Processing *

Обзор

Всем привет! Меня зовут Наталья Бруй, я промпт-инженер в MWS AI. Вместе с моей коллегой Анастасией Тищенковой мы решили ответить на вопрос, который мучает ~~нашего пиарщика~~ многих – почему больше токенов не равно лучше и как заставить LLM работать адекватно на длинном контексте.

Если вы создаете ИИ-решения для работы с большим объемом документов и хотите, чтобы LLM вам в этом помогала ( отвечала на вопросы по содержанию, генерировала запросы и заявления на их основе, делала резюме и и пр.) не абы как, а опираясь на выданные ей данные, тогда вам под кат.

Оговорочка: эта статья для тех, кто находится на первых этапах освоения темы работы с длинным контекстом и вовлечен в создание каких-нибудь новых ИИ-продуктов на основе языковых моделей. Если вы уже две диссертации об этом написали, тогда можете сразу в комментариях ссылки оставить – мы почитаем.

Читать далее

+29

AnatolyBelov 14 окт в 07:00

Симуляция делового совещания с GigaChat. Вся сила в промпте

8 мин

699

Искусственный интеллектNatural Language Processing *

Недавно мне поступил необычный запрос: нужен инструмент, который позволил бы отрабатывать навыки управления командой в условиях, максимально приближенных к реальности.

Так родилась идея: создать деловую игру - симулятор делового совещания, где игрок выступает в роли CEO, а реплики остальных участников генерирует ИИ (GigaChat). Хотелось проверить, насколько реалистичными могут быть дискуссии, если задать правильные условия.

Эта статья - о проработке промпта, результатах и выводах.

Читать далее

0

SuperEstrad 13 окт в 16:02

Что я вынес из Oxford Machine Learning Summer School 2025

Средний

29 мин

2.1K

Natural Language Processing * Машинное обучение * РобототехникаУчебный процесс в IT

Репортаж

Побывал на Oxford Machine Learning Summer School 2025 — одной из крупнейших летних школ, посвящённых искусственному интеллекту, проходившей в самом центре Оксфорда. В течение четырёх дней мы слушали лекции исследователей из DeepMind, Hugging Face, Amazon, Google, ученых топовых европейских вузов. Обсуждали foundation models, reinforcement learning, generative AI и on-device ML. В статье делюсь своими впечатлениями и кратким пересказом программы, отражающей мировые тренды в развитии современного машинного обучения.

Читать далее

+2

python_leader 13 окт в 12:32

Какой табличный формат LLM понимают лучше всего? (Результаты по 11 форматам)

8 мин

3.3K

Программирование * Машинное обучение * Искусственный интеллектБудущее здесьNatural Language Processing *

Аналитика

Перевод

Команда AI for Devs подготовила перевод статьи о том, в каком формате лучше всего передавать таблицы LLM. Исследование охватило 11 популярных форматов — от CSV и JSON до YAML и Markdown. Результаты неожиданны: разница в точности достигает 16 процентных пунктов, а выбор формата напрямую влияет на стоимость инференса и стабильность RAG-пайплайнов.

Читать далее

+11

JetHabr 13 окт в 11:49

Зачем бизнесу GPT-платформа, а не просто LLM: опыт JET & Yandex GPT Lab

Средний

6 мин

1.1K

Блог компании Инфосистемы ДжетNatural Language Processing * Big Data * Искусственный интеллектМашинное обучение *

Обзор

Меня зовут Антон Чикин, я руковожу отделом интеллектуального анализа в «Инфосистемы Джет». В статье я попробую показать на практическом примере, почему корпоративный ИИ нельзя свести к установке готовой LLM — и что именно приходится выстраивать вокруг неё, чтобы получить реальную ценность для бизнеса.

Этот материал будет полезен тем, кто отвечает за внедрение ИИ в компаниях среднего и крупного масштаба: ИТ-директорам, архитекторам корпоративных систем, специалистам по информационной безопасности и тем, кто рассматривает генеративный ИИ как инструмент автоматизации бизнес-процессов.

Читать далее

0

rybakolbasa 12 окт в 12:41

Как я переводил с английского документ от 1704 года без ChatGPT

Простой

15 мин

18K

Natural Language Processing * Изучение языковИскусственный интеллектКонтент и копирайтинг * Читальный зал

Из песочницы

Сначала был звонок. «Здравствуйте, мне нужно перевести документ с английского на русский. Только он не совсем обычный». Разберемся, подумал я. А вечером увидел на почте это.

Читать далее

+211

python_leader 10 окт в 08:52

Как открытые веса раскрыли секреты обучения GPT-5

11 мин

9.7K

Программирование * Машинное обучение * Natural Language Processing * Искусственный интеллектБудущее здесь

Аналитика

Перевод

Команда AI for Devs перевела статью, показывающую, что открытые веса — это не только про прозрачность, но и про утечку тайн обучения. На примере модели GPT-oss автор показывает, как можно восстановить части обучающего пайплайна и даже выявить, что GPT-5 видела фразы с сайтов для взрослых.

Читать далее

+18

nlpist 10 окт в 07:23

Все еще борешься с галлюцинациями? Ты просто не умеешь их использовать

Средний

9 мин

2.2K

Блог компании AIRIБлог компании MWS AIМашинное обучение * Искусственный интеллектNatural Language Processing *

Кейс

Привет, Хабр! Меня зовут Василий Коновалов, я работаю в команде «Вычислительная семантика» в AIRI. Наша команда сфокусирована на исследовании галлюцинаций и на решении проблем доверительной генерации. Мы учимся находить галлюцинации и бороться с ними.

Но, возможно, мы не всегда должны делать это. Тем более, что научные работы показывают, что галлюцинации неизбежны. Вместо этого мы извлекли из них пользу: мы применили галлюцинации больших мультимодальных моделей для детекции странных картинок — то есть картинок, противоречащих здравому смыслу.

Об этом мы вместе с коллегами из Сколтеха, MWS AI и МФТИ написали научную статью Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images, которую приняли на NAACL. Здесь я кратко расскажу, что именно мы сделали.

Читать далее

+8

snakers4 9 окт в 18:34

Мы решили задачу омографов и ударений в русском языке

Средний

10 мин

11K

Машинное обучение * Natural Language Processing * Python * Open source * Data Mining *

Обзор

Мы наконец решили задачу омографов. Конечно, с рядом оговорок, куда без них. Получилось пресловутое приключение на 20 минут.

Несмотря на кажущуюся простоту (задача по сути является бинарной классификацией, число кейсов с тремя валидными вариантами ничтожно мало), задача является просто кладезем различных "мин замедленного действия" и типичных граблей в сфере машинного обучения. Да, задачу "ёфикации" (расстановка буквы ё там, где люди её поленились поставить) мы считаем частным случаем задачи простановки ударений и омографов.

Также мы опубликовали наше продуктовое решение для простановки ударений (в омографах в том числе) в рамках репозитория silero-stress и также напрямую через pypi. В ближайшее время добавим эту модель и обновим наши публичные модели синтеза и раскатим более мощную "большую" (тоже маленькую по современным меркам) версию модели в приватные сервисы и для клиентов. Также мы опубликовали бенчмарки качества и скорости публичных академических решений … и там всё очень неоднозначно.

Наливайте себе чай, садитесь поудобнее. Мы постараемся описать наш путь длиной в вечность без лишних подробностей.

Сели, налили, читаем

+70

python_leader 9 окт в 09:30

Как работает Context Engineering в Claude и других агентах

Простой

13 мин

4.7K

Программирование * Машинное обучение * Искусственный интеллектБудущее здесьNatural Language Processing *

Обзор

Перевод

Команда AI for Devs подготовила перевод статьи об инженерии контекста — новом ключевом подходе в построении AI-агентов. Если раньше все говорили о prompt engineering, то теперь на первый план выходит умение управлять ограниченным ресурсом — контекстом. Компакция, заметки, подагенты, динамическая подгрузка данных — всё это формирует новое искусство работы с LLM.

Читать далее

+5

Neurosonya 8 окт в 20:54

Мой промпт для ChatGPT-5 превратит конспекты лекций (в тексте ИЛИ НА ФОТО) в структурированный учебный материал

Простой

3 мин

18K

Машинное обучение * Natural Language Processing * Контент и копирайтинг * Подготовка технической документации *

Recovery Mode

Предлагаю на ваш суд мой промпт, который я разработала специально для ChatGPT-5. Вы можете загрузить свои конспекты или даже фото конспектов и получите материал: с логичной структурой, подзаголовками, списками, выделением ключевых понятий, вводной частью и резюме. Не выдумывает от себя, если что-то написано неразборчиво, пометит в отдельный блок. Cохраняет авторский стиль, поясняет термины, формирует обзор, основную часть, резюме и список вопросов. Результат оформляется в Markdown: удобно читать, редактировать и публиковать.

Сам промпт ниже:

-8

python_leader 6 окт в 09:31

90% кода

Простой

6 мин

18K

Программирование * Машинное обучение * Natural Language Processing * Искусственный интеллектБудущее здесь

Мнение

Перевод

Команда AI for Devs подготовила перевод статьи о том, как меняется программирование с приходом ИИ. Автор делится опытом: в его проекте уже 90% кода пишется агентами, но вся ответственность за архитектуру и продакшен остаётся на нём. Это не далёкий прогноз — это уже реальность, просто распределённая неравномерно.

Читать далее

+9

ya_ne_ivan 5 окт в 10:16

Паттерны программирования при работе с LLM

Средний

6 мин

10K

Искусственный интеллектМашинное обучение * Python * Natural Language Processing * Анализ и проектирование систем *

Из песочницы

LLM - мощный инструмент, но его эффективность в продакшене зависит не от одного «хитрого промпта», а от всей архитектуры: что мы даём модели, как управляем её рассуждением и как проверяем/обрабатываем результат. В этой статье - компактная карта паттернов, разбитая по этапам конвейера: Input -> Reasoning -> Output.

Читать далее

+20

notTGY 3 окт в 09:01

Как мы создали ИИ-бота для генерации презентаций, когда клиенты поставили в тупик

Простой

7 мин

1.1K

Go * VueJS * Natural Language Processing * Презентации

Кейс

У всех же была такая ситуация в школе или университете, что надо было подготовить презентацию, а из головы вылетело. И вот тебя вызывают выступать через 15 минут, а из заготовок есть только идея. Вот бы можно было написать эту идею чат боту, который сделал бы эту презентацию за минуту.

Так родилась идея нашего ИИ-чат-бота, который теперь берёт на себя всю рутину и создаёт презентации, от которых клиенты в восторге. Расскажу, как мы к этому пришли и что из этого получилось.

Читать далее

-3

Anokim 2 окт в 08:19

HeroBench: проверяем, как LLM справляются со сложным планированием в виртуальных RPG-мирах

Простой

7 мин

1.7K

Блог компании AIRINatural Language Processing * Машинное обучение * Искусственный интеллектПрограммирование *

Кейс

Привет! Меня зовут Петр Анохин, я руковожу группой «Нейрокогнитивные архитектуры» в Институте AIRI. Недавно мы выложили в открытый доступ новый бенчмарк для долгосрочного планирования LLM под названием HeroBench. Основанный на MMORPG‑песочнице для программистов, HeroBench проверяет способность современных моделей обрабатывать комплексный контекст, выполнять декомпозицию задач и формировать детализированные многошаговые планы достижения целей.

Мы прогнали через него 25 открытых и проприетарных LLM и выявили существенные различия в производительности, редко наблюдаемые в традиционных бенчмарках для анализа логических рассуждений. Другая особенность нашей работы в том, что новый бенчмарк вырос из небольшого студенческого проекта на летней школе AIRI.

Подробнее об этом и технических деталях — читайте в нашей статье.

Читать далее

+7

2

3 4 ...