Как стать автором

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

СтатьиПостыНовостиАвторыКомпании

ZaeBest 21 авг в 03:57

Сказка о зачарованной пасеке

Средний

8 мин

1.9K

TypeScript * Natural Language Processing * Python * Go * SQL *

Перевод

Басня о коде и мёде

Когда-то давно в обширном цифровом королевстве жила гильдия строителей. Не замков и мостов, а сложных, невидимых структур, созданных на основе чистой логики. Они были архитекторами и разработчиками программного обеспечения, и их самой большой проблемой было создание систем, которые могли бы расти и адаптироваться, не погружаясь в хаос.

Они трудились день и ночь, используя всевозможные чертежи и заклинания, однако их творения часто становились запутанными беспорядками — хрупкими и трудно поддающимися изменению. Строители просто жаждали создать программное обеспечение устойчивое, организованное и полное жизни, как шумный улей.

И вот однажды мудрый старый архитектор, известный как «Пчеловод», собрал молодых строителей. «Вы стремитесь строить «Великие вещи», — сказала она, и ее голос был теплым, как летний мед. «Но вы строите из камня и железа, когда вы должны строить из самой жизни. Посмотрите на пчел. Их ульи — шедевры дизайна, построенные на века на протяжении поколений. Давайте узнаем их секреты».

Так начинается наша история. История не только о коде, но и о вечных закономерностях природы, которые могут помочь нам создавать создавать красивые программы. Мы отправимся в самое сердце Шестиугольного Улья, откроем его секретный генетический код и узнаем, как выращивать собственных «рабочих пчел», которые будут служить нашему цифровому королевству добросовестно.

Читать далее

+3

KoiCode 19 авг в 11:32

Полное руководство по добавлению серверов MCP в Claude Code: от основ к мастерству

Простой

7 мин

627

Creative Commons * GitHub * IT-инфраструктура * Natural Language Processing *

Recovery Mode

Эта статья предоставляет самые современные методы настройки MCP, решения распространённых ошибок, а также рекомендует 10 протестированных практичных MCP-серверов. Это поможет решить более 90% проблем с настройкой и расширить функционал Claude Code.

Читать далее

+2

Yukajii 19 авг в 09:22

Не em dash'ем единым: как распознать ИИ-текст по гайду Википедии

Простой

3 мин

681

Искусственный интеллектNatural Language Processing * Машинное обучение * Контент и копирайтинг *

Честно говоря, охота на следы ИИ не самая увлекательная задача. Но инструмент полезный: помогает авторам убрать штампы из черновика, а редакторам сэкономить время. Ниже короткий пересказ актуального гайда сообщества Википедии Signs of AI writing и практичный чек-лист для самопроверки.

Читать далее

+5

DeadSailor 18 авг в 10:26

LLM на прокачку: практический гайд по Alignment

Простой

6 мин

1.5K

Блог компании Точка БанкNatural Language Processing * Python * Искусственный интеллектМашинное обучение *

Туториал

Мы в Точка Банке делаем свою LLM. Чтобы она работала хорошо, недостаточно просто обучить её на куче текстов. Для получения осмысленного и предсказуемого поведения модели, нужен Alignment — дообучение с учётом предпочтений и ограничений. В статье расскажу, какие методы применяют в современных моделях, и как мы адаптировали их под себя.

Читать далее

+8

avgalichin 15 авг в 11:35

Legen… Wait, Wait… Dary! Разбираемся с рефлексией LLM

Сложный

6 мин

1.8K

Блог компании AIRIИскусственный интеллектМашинное обучение * Natural Language Processing *

Кейс

Хабр, привет! Меня зовут Андрей Галичин, я младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» в Институте AIRI, инженер‑исследователь в лаборатории безопасного искусственного интеллекта SAIL AIRI‑МТУСИ, а также аспирант Сколтеха. Мы с коллегами занимаемся интерпретируемостью больших языковых моделей. В январе этого года, когда все обсуждали впечатляющие результаты новой рассуждающей языковой модели DeepSeek‑R1 (подробный разбор статьи от моего коллеги Антона Разжигаева можно найти здесь), мы задались вопросом: а что на самом деле происходит внутри этих моделей, когда они «думают»?

Главная особенность таких моделей — это способность к рефлексии, самопроверке и сомнениях в своих рассуждениях, которые магическим образом возникают в процессе обучения ("aha moment") и выражаются в использовании моделью человекоподобных фраз типа "Wait", "Alternatively" и других. Однако никто толком не разбирался, откуда они берутся и зачем нужны (работает — не трогай!).

Именно на эти вопросы мы и попытались ответить в нашей новой статье "I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders". Мы обнаружили, что эти фразы — не просто декорация, а действительно важные для модели вещи. Мы спустились на уровень скрытых представлений модели и нашли механизмы, отвечающие за рассуждающие способности. Более того, мы научились их контролировать — усиливая нужные компоненты, мы смогли заставить модель рассуждать глубже и точнее!

В этой статье я коротко расскажу про наши главные выводы.

Читать далее

+15

aaplakhin 15 авг в 07:30

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

8 мин

6.8K

Блог компании ЯндексМашинное обучение * Искусственный интеллектЗвукNatural Language Processing *

Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу чтения книг вслух без предзаписанных аудиоверсий, но иногда звучал однообразно. Дело в том, что он был основан на небольшой нейросети — Tacotron. Проблема заключалась в том, что мы обучали модель для каждого спикера. И если спикер пользовался несколькими интонационными паттернами, то модель просто выбирала самый частый из них.

Тогда мы начали активно экспериментировать c highres-моделями. Они могут учиться на большом количестве данных разного качества и поэтому способны воспроизводить более интонационно осмысленную речь. К тому же им не нужны вспомогательные модели, такие как PnG BERT или отдельные модели для расстановки пауз, — все эти интонационные нюансы они выучивают сами. У них есть хорошая способность к семплированию, в отличие от старых моделей, где один и тот же текст на разных генерациях произносился почти одинаково.

И вот мы покатили новые модели в прод. А я расскажу, как мы научились заводить highres-модели для синтеза книг и делать это в реалтайме, а также какую работу пришлось для этого провести.

Читать далее

+26

Liugger 13 авг в 07:42

Аналитика данных для RAG: как (не)наполнить базу решений для нулевой линии поддержки

Средний

19 мин

2.4K

Блог компании ИТ-холдинг Т1Natural Language Processing * Service Desk *

Кейс

Привет, я Азат Хакимов, аналитик данных команды «ИИ для ИТ Поддержки» в Т1 Иннотех. Мы разрабатываем интеллектуальные системы помощи и автоматизации для команд поддержки. В этой статье я расскажу про одну из задач анализа текстов, с которой столкнулась команда в ходе разработки системы для нулевой линии поддержки.

Задачу, которую пытались решить - наполнение базы готовых решений для RAG сервиса простыми и легкими, с точки зрения ресурсоемкости, методами

Читать далее

+8

ai-talent 11 авг в 09:30

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше

Средний

5 мин

1.1K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

Привет, Хабр!

Меня зовут Роман, я NLP-инженер в Сбере. Занимаюсь мультиагентными системами и работаю с LLM в проде. Сегодня расскажу про одну из самых интересных статей июня по версии Huggingface Daily Papers — Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning.

Читать далее

+4

aarmaageedoon 11 авг в 08:00

Стирая языковые границы для NLP-датасетов

Средний

12 мин

1K

Natural Language Processing * Машинное обучение * Искусственный интеллектData Mining *

Всем привет. В этом посте расскажем, как мы тестировали БЯМ для перевода англоязычных датасетов на русский. «Мы» — это ваш покорный слуга и ребята из ФИЦ ИУ РАН. Пост по факту перевод нашей статьи, которая была опубликована еще в апреле, но вот руки до поста дошли только сейчас.

Читать далее

+1

castos 9 авг в 05:56

Вебинары трека Наука о данных Летней цифровой школы Сбера

Средний

4 мин

549

Искусственный интеллектМашинное обучение * Data Mining * Data Engineering * Natural Language Processing *

Дайджест

Привет, коллеги ML инженеры, Data scientist'ы и все, кто интересуется искусственным интеллектом, созданием нейросетей, машинным обучением и анализом данных! Принёс вам пачку вебинаров с интенсива трека Наука о данных курсов повышения квалификации Летней цифровой школы Сбера.

Читать далее

+2

THunderCondOR 7 авг в 10:55

NLP в японском стиле. Репортаж с поездки в Канадзаву на конференцию NLDB 2025

Средний

6 мин

222

Блог компании AIRINatural Language Processing * КонференцииИскусственный интеллект

Репортаж

Всем привет! С 4 по 6 июля в японском городе Канадзава прошла небольшая, но очень ламповая конференция NLDB 2025, посвященная различным доменам в NLP. Мы, группа исследователей из AIRI, съездили на это мероприятие, других посмотреть и себя показать.

О том, что было на конференции и о красотах Канадзавы — читайте в тексте ниже.

Читать далее

+3

ContentAI_Team 5 авг в 16:00

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

6 мин

7.6K

Блог компании Content AIИскусственный интеллектNatural Language Processing *

В прошлой статье мы говорили, что нашли быстрый и простой способ, как с помощью LLM вытаскивать данные из юридических документов и доверенностей. А сегодня расскажем, какой промт мы для этого использовали.

Узнать подробности

+15

RoDeniss 5 авг в 11:01

Как мы учили нейросеть отвечать на вопросы

Простой

20 мин

2.2K

Блог компании БазисМашинное обучение * Natural Language Processing *

Кейс

Привет, Хабр! На связи Денис Романов, директор департамента Professional Services компании «Базис». Яркое появление китайских языковых моделей заставило нас по-новому посмотреть на возможности нейросетей, и вот уже несколько месяцев мы активно внедряем их в рабочие процессы — от автоматизации рутинных задач до поддержки клиентов.

Скрещиваем Elasticsearch, Ollama и QWen

+11

wingrune 4 авг в 09:22

Как рёбра графа 3D-сцены помогают LLM отвечать на вопросы?

Средний

9 мин

956

Блог компании AIRIИскусственный интеллектРобототехникаNatural Language Processing * Обработка изображений *

Кейс

Привет, Хабр! Меня зовут Татьяна Земскова, я аспирантка МФТИ и младший научный сотрудник команды Embodied Agents лаборатории Cognitive AI Systems AIRI. Областью моих научных интересов является компьютерное зрение для робототехники. Я изучаю, в частности, то, каким образом робот может использовать различные модальности (текст, 3D‑облака точек) для лучшего понимания 3D‑сцены.

Сегодня мы поговорим о понимании 3D‑сцены в контексте задач, где требуется одновременно и трёхмерное компьютерное зрение, и обработка естественного языка, а также о том, как представление 3D‑сцены в виде графа с рёбрами помогает в их решении. Главной особенностью графового представления 3D‑сцены является его компактность, поэтому граф можно использовать для сжатого описания 3D‑сцены, подающегося на вход в LLM. Это позволяет получать качественные ответы на вопросы о 3D‑сцене до 5 раз быстрее по сравнению с методами, использующими последовательности изображений для LVLM. Это мы показали вместе с моим научным руководителем Дмитрием Юдиным в недавней работе 3DGraphLLM: Сombining Semantic Graphs and Large Language Models for 3D Scene Understanding, принятой на ведущую конференцию по компьютерному зрению ICCV 2025.

Мы предоставляем открытый исходный код метода 3DGraphLLM с инструкциями по запуску, а также публикуем предварительно обученные веса модели на Hugging Face. Это позволяет каждому желающему легко воспроизвести результаты и опробовать все описанные методы на собственных данных. Здесь же хочется подробнее рассказать о новом методе и пути, по которому мы к нему пришли.

Читать далее

+6

Viacheslav-hub 4 авг в 05:40

Как устроены AI агенты: разбираемся на примере ReAct и Reflection

Средний

18 мин

3.1K

Natural Language Processing * Python * Программирование *

Туториал

Привет, Хабр!

2025 стал годом AI агентов. Мы видим, как их пытаются применить повсюду: от школ до банковского сектора.

Но все ли понимают, как они работают? Или разработчики просто используют готовые реализации, как create_react_agent из langchain? В этой статье мы заглянем в устройство этих шаблонов.

Читать далее

+3

igumnov 3 авг в 14:52

Учим LM Studio ходить в интернет при ответах на вопросы

Простой

3 мин

3.9K

Искусственный интеллектPython * Natural Language Processing *

Туториал

Мне очень нравится LM Studio, так как она позволяет локально запускать ИИ модели. Что позволяет сохранить приватность того о чем ты беседуешь с ИИ. Но по сравнению с коммерческими онлайн моделями, LM Studio не умеет ходить в интернет "из коробки". Те модели не могут использовать актуальную информацию из Интернета для ответов на вопросы.

Не так давно в LM Studio было добавлено возможность подключать MCP-сервера к моделям. Самое первое, что я сделал это, написал небольшой MCP-сервер, который позволяет извлекать текст из URL-адреса. Также может извлекать ссылки, которые есть на странице. Это дает возможность в запросе к ИИ указать адрес и попросить извлечь текст оттуда или ссылки, что бы использовать при ответе.

Что бы это все работало, для начала создаем pyproject.toml в папке mcp-server.

Читать далее

+15

atomlib 31 июл в 20:09

Системы ценностей больших языковых моделей

Простой

44 мин

14K

Искусственный интеллектNatural Language Processing * Научно-популярноеМашинное обучение * Будущее здесь

Дайджест

Каждый раз, когда человечество создаёт очередной инструмент на машинном обучении, оно сперва любуется пользой от его работы, а потом пугается своего отражения внутри. С большими языковыми моделями история повторилась с ускорением. От восторга перед ответами ChatGPT до шока от таблиц, где жизнь человека глубоко неравноценна, прошло меньше двух лет.

Звучит странно, но языковые модели предвзяты. У них есть политические взгляды, любимые расы и даже люди, которыми они не прочь пожертвовать. Но обо всём по порядку.

Читать далее

+78

ContentAI_Team 31 июл в 14:30

СontentCapture+LLM: как мы ускорили работу с неструктурированными документами

4 мин

1.4K

Блог компании Content AIИскусственный интеллектNatural Language Processing *

В эпоху цифровой трансформации каждая минута работы с документами на вес золота. Юридические отделы, банки, госучреждения ежедневно обрабатывают сотни договоров, доверенностей и судебных приказов. Ручной ввод данных, поиск реквизитов и проверка сроков могут отнимать до 20 минут на документ — и это если сотрудник не отвлекся на кофе.

В нашей линейке продуктов есть универсальная IDP-платформа ContentCapture. Она хорошо понимает структурированные документы, а вот при обработке неструктурированных данных раньше могли возникать сложности. Чтобы решить эту проблему, мы в новом релизе продукта настроили интеграцию с облачными большими языковыми моделями (LLM), такими как YandexGPT и GigaChat.

Делимся подробностями и рассказываем, как оценивали качество работы LLM с разными типами документов.

Читать далее

+4

jet-47 30 июл в 08:44

Где живут LLM: разбираем инференс-кластер YADRO и гоняем в нем модели

Средний

7 мин

2.8K

Блог компании YADROИскусственный интеллектВысоконагруженные системы * Машинное обучение * Natural Language Processing *

Кейс

Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO: зачем он нужен, что у него под капотом и как в такой конфигурации показывают себя популярные модели. Кроме того, я немного порассуждаю об альтернативных реализациях кластера и поделюсь планами по развитию реализации нашей.

Читать далее

+26

Aleron75 29 июл в 22:50

LLMops дома: быстрое разворачивание и настройка инфраструктуры с помощью Langfuse

Простой

6 мин

3.1K

Блог компании Data Feeling SchoolNatural Language Processing * Машинное обучение *

Обзор

Задумывались ли вы о том, как сделать трассировку в ML/LLM‑пайплайнах? А может, сталкивались с ситуацией, когда хотелось быстро понять, почему система сработала не так, как ожидалось, и в каком месте всё пошло не так? Мы вот задумались и сталкивались, поэтому расскажу о том, что пробуем сейчас.

В этой статье поделюсь нашим опытом использования Langfuse - мощного инструмента для трассировки и оценки пайплайнов, построенных на больших языковых моделях. Мы рассмотрим ключевые возможности Langfuse, особенности интеграции с Python SDK, покажем, как развернуть инфраструктуру локально, и подключим локальную LLM‑модель из Ollama для анализа результатов.

Читать далее

+6

1

2 3 ...