Все потоки

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

СтатьиПостыНовостиАвторыКомпании

zvntver 14 июл в 12:42

Используем искусственный интеллект для проектирования информационных систем: от составления ТЗ до прорисовки архитектуры

Простой

26 мин

5.1K

Блог компании Axenix (ex-Accenture)Искусственный интеллектNatural Language Processing * Машинное обучение * Будущее здесь

Всем привет! Сегодня поговорим о GenAI и о том, какую неоценимую помощь он может оказать при проектировании и разработке информационных систем. Мы обсудим, как GenAI может использоваться для этой задачи, с какими трудностями столкнётся и какой результат можно получить.

Рассмотрим процесс проектирования на конкретном примере выполнив серию промптов,а так же проверим как GenAi умеет рисовать диаграммы в форматах UML и Mermaid.

Читать далее

+11

MarkovM 13 июл в 10:08

Свой ChatGPT на документах: делаем RAG с нуля

Средний

6 мин

20K

Блог компании AmveraАнализ и проектирование систем * Natural Language Processing * Машинное обучение * Искусственный интеллект

Туториал

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA.

Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

Читать далее

+9

atomlib 12 июл в 00:21

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 %

Простой

20 мин

25K

Искусственный интеллектNatural Language Processing * Программирование * Машинное обучение * Текстовые редакторы и IDE *

Дайджест

Считается устоявшейся истиной, что инструменты автодополнения кода и прочая помощь от больших языковых моделей помогают программировать быстрее. Исследование организации METR ставит это фактоид под сомнение и даже демонстрирует обратный эффект.

В рамках анализа труда 16 программистов обнаружилось, что ИИ замедляет человека на 19 %. Это противоречит мнению экспертов индустрии машинного обучения, экономистов и самих участников эксперимента. Важно, что проверка шла не на очередных бенчмарках или предложениях решать алгоритмические задачи на скорость, а в обычной работе людей.

Читать далее

+56

mrcoolinhabr 11 июл в 16:12

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

Средний

8 мин

11K

Искусственный интеллектМашинное обучение * Natural Language Processing *

Обзор

В этой статье мы говорим об автопромптинге - что это такое, зачем он нужен и как он помогает уже сегодня промпт-инженерам.

Читать далее

+15

Flexits 11 июл в 11:12

Используем API Speech2Text для распознавания записей разговоров

Простой

8 мин

2K

.NET * C# * Программирование * ЗвукNatural Language Processing *

Туториал

В нашей компании анализируются звонки менеджеров отдела продаж для оценки их эффективности, устранения недочётов и улучшения сервиса. На сегодняшний день это составляет немалый массив ручной работы, для облегчения которой мы задумали привлечь технологии искусственного интеллекта. Идея следующая: забираем записи звонков, распознаём речь (преобразовываем в текст), подключаем LLM для анализа текста, знакомимся с выводами, при необходимости (например, возникновении каких-то аномалий) контролируем происходящее вручную.

Распознавание аудио решили делать через сервис Speech2Text, пример использования API которого я и покажу в этой статье. В черновом варианте получаем примерно следующую схему работы (нас сейчас интересует прямоугольник с подписью Speech2Text connector):

Читать далее

+1

boterxxx 9 июл в 16:44

Готовимся к собесу: positional encodings в 2025 году

Простой

9 мин

5.4K

Natural Language Processing * Искусственный интеллектМашинное обучение *

Обзор

Если вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом.

Позиционное кодирование заметно эволюционировало с момента появления оригинальной статьи о трансформерах. В современных LLM и моделях компьютерного зрения, таких как FLUX, уже давно не используется классическое sin/cos-кодирование.

Читать далее

+5

mipt_digital 9 июл в 11:00

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

10 мин

825

Искусственный интеллектМашинное обучение * Natural Language Processing * Обработка изображений * Развитие стартапа

Кейс

Массовые фото из детского сада в родительских чатах редко бывают персональными: на десятках снимков сложно найти именно своего ребенка. Выпускники онлайн-магистратуры «Науки о данных» Центра «Пуск» МФТИ предложили решение — платформу KidFolio, которая с помощью технологий компьютерного зрения и мультимодальных моделей автоматически формирует и отправляет родителям персонализированные фото- и видеоотчеты.

В статье — подробности разработки: от сбора датасета детских лиц до создания собственного бенчмарка и дообучения моделей для генерации текстов.

Читать далее

+1

alizar 7 июл в 09:01

Георгий Герганов, автор llama.cpp и звукового кейлогера

6 мин

19K

Блог компании RUVDS.comМашинное обучение * СофтИскусственный интеллектNatural Language Processing *

Многие пользуются YouTube, Netflix, но не подозревают о ключевых опенсорсных программах типа ffmpeg, которые работают на бэкенде этих сервисов. Похожая ситуация с нейронками, где многие знают программу Ollama для локального запуска моделей на CPU. Но мало кто понимает, что это всего лишь простенькая оболочка вокруг опенсорсной библиотеки llama.cpp на С, которая и делает инференс. Автор этой библиотеки, талантливый разработчик Георгий Герганов, мало известен широкой публике.

Читать далее

+126

fartoviy109 6 июл в 15:10

Часть 4: Mamba — State Space Models vs трансформеры

Простой

4 мин

1.2K

Машинное обучение * Python * Искусственный интеллектNatural Language Processing * Big Data *

Обзор

Mamba — революция в обработке длинных последовательностей! Mamba — State Space Models vs трансформеры, что лучше?!

Читать далее

+1

AlekseySpasenov 3 июл в 07:00

ICLR-2025: что нового в мультимодальном ранжировании

16 мин

1.5K

Блог компании ЯндексКонференцииМашинное обучение * Искусственный интеллектNatural Language Processing *

Всем привет! Недавно мы — Алексей Спасёнов и Кирилл Никоров из ML‑команды Мультимедиа Поиска Яндекса (Картинки и Видео) — и ещё 90 яндексоидов побывали на конференции ICLR-2025 и рады рассказать о свежих направлениях исследований в области мультимодального ранжирования.

С каждым годом эта область ML приобретает всё более важной. Люди всё чаще предпочитают получать информацию из визуальных медиа и кратких ИИ‑выжимок, а не привычных текстовых статей. При этом область мультимодального ранжирования является довольно сложной и интересной, так как она постоянно использует разные данные (тексты, аудио, изображения) и требует высокой вычислительной эффективности.

В этой статье мы хотели бы поделиться самыми интересными и перспективными для нашей области работами, которые мы выделили на конференции.

Читать далее

+20

Aliaksei_Rudak 2 июл в 08:01

Как мы построили свой инструмент для работы с LLM

Простой

9 мин

3.3K

Графические оболочки * Natural Language Processing * Data Engineering * Искусственный интеллектМашинное обучение *

Обзор

Привет, Habr! Меня зовут Алексей Рудак, и я основатель компании Lingvanex — компании, которая уже 7 лет делает решения для машинного перевода и распознавания речи.

В этой статье я бы хотел рассказать про наш инструмент для тренировки языковых моделей, который шесть лет назад родился из простого набора скриптов. Но постепенно усложняяcь, он стал включать в себя функции разметки данных, фильтрации датасетов, генерации данных и тестирования. В какой-то момент инструмент стал настолько функциональный, что я решил сделать ему красивый UI и назвать его - Data Studio.

Итак, что же такое Data Studio ?

Data Studio — это инструмент для работы с задачами обработки естественного языка (NLP), который мы используем в основном для улучшения качества перевода текста.

С помощью Data Studio можно обучать модели перевода, настраивать различные параметры для этих тренировок, токенизировать данные, фильтровать их по различным параметрам, собирать метрики, создавать данные для обучения, тестирования и валидации и многое другое.

Общий процесс создания языковой модели для перевода выглядит так:

1) Предобработка данных: этап подготовки данных перед обучением модели.

2) Фильтрация с использованием структурных и семантических фильтров.

3) Сбор общего набора данных: удаление избыточности, равномерное распределение тем и длин, сортировка.

4) Тегирование для классификации данных.

5) Загрузка общего набора данных в Data Studio для проверки.

6) Создание данных для валидации и тестирования модели.

7) Обучение модели.

Читать далее

0

Aleron75 2 июл в 04:25

От традиционных LLM-агентов к Agentic AI: будущее автоматизации бизнеса + реализация вашего ассистента по темам

Простой

8 мин

4.2K

Блог компании Data Feeling SchoolМашинное обучение * Natural Language Processing *

Обзор

В последние месяцы термин Agentic AI всё чаще мелькает в статьях, репозиториях и продуктовых обновлениях крупных компаний. Но что он на самом деле означает? В чем вообще отличие от обычного LLM агента, на которого я накручу все, что мне нужно? И соответственно, как это может помочь бизнесу?

Сегодня расскажу про все это, а также расскажу какие существуют реальные примеры интеграции в бизнес и сделаем мини примерчик на базе langgraph, который поможет вам понять примитивы концепции в которой у нас будет небольшой оркестратор в виде Qwen3:4b и его маленькие подопечные в виде Qwen3:1.7b. И сравним решения, если мы будем использовать стандартный пайплайн из LLM-агентов.

Читать далее

+3

klauss_z 1 июл в 08:44

ИИ-помощник редактора на Хабре: семь раз вайб-код — один раз поймешь

Простой

18 мин

2.6K

Блог компании YADROHabrКонтент и копирайтинг * Natural Language Processing * Машинное обучение *

Туториал

Привет! На связи Николай из редакции блога YADRO. Наша команда регулярно поставляет на площадку статьи по инженерным и смежным темам. Мы смотрим на статистику, радуемся или огорчаемся, проверяем гипотезы и верим, что в ответ график роста посмотрит на нас под новым, бо́льшим углом.

Со временем число текстов в блоге YADRO неуклонно растет. А моя оперативная память редактора остается неизменной: пара-тройка последних месяцев плюс несколько ярких вспышек пораньше. Зато растет FOMO — тревога, что я мог бы найти новые возможности для развития блога, будь мой фокус шире. Поможет ли здесь искусственный интеллект? «Отличный кейс!» — ответила ChatGPT, и я начал первую версию проекта.

Читать далее

+23

GG1KENOBI 1 июл в 07:16

Как мы научили ИИ читать PDF и экономить сотни рабочих часов: полный кейс создания корпоративного ChatGPT

Простой

8 мин

21K

ХакатоныNatural Language Processing * Машинное обучение * Искусственный интеллектPython *

Из песочницы

От бизнес‑проблемы до технической реализации — опыт создания ИИ‑ассистента для Росатома за 48 часов

Представьте: новый сотрудник крупной корпорации ищет ответ на рабочий вопрос. Он открывает внутренний портал, видит сотни PDF-инструкций, тысячи записей в базе знаний службы поддержки. Час поиска, звонки коллегам, еще час изучения документов. В итоге — либо неточный ответ, либо решение отложить задачу.

Как ИИ может помочь сотруднику?

+13

NikitaMartynov 30 июн в 13:04

POLLUX: оценка генеративных способностей моделей для русского языка

Средний

21 мин

3.7K

Блог компании СберNatural Language Processing * Машинное обучение *

Обычно мы оцениваем способности больших языковых моделей через бенчмарки вроде MMLU, RussianSuperGlue или первых версий MERA, которые напоминают экзаменационные тесты с выбором правильного варианта ответа. Однако на практике пользователи задействуют модели для принципиально иных целей — создания текстов, генерации идей, переводов, составления резюме и прочих задач. Как оценивать результат в этом случае? В этой статье мы расскажем, как решали проблему оценки открытой генерации и что у нас получилось.

Читать далее

+24

alizar 30 июн в 09:01

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

6 мин

47K

Блог компании RUVDS.comМашинное обучение * Искусственный интеллектNatural Language Processing * Научно-популярное

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.

Читать дальше →

+180

Aleron75 30 июн в 03:42

Как мы научили LLM проверять себя и сэкономили ресурсы на RAG-пайплайне

Простой

4 мин

6.9K

Блог компании Data Feeling SchoolМашинное обучение * Natural Language Processing *

Кейс

Привет, чемпионы! Сегодня поделюсь историей, как мы придумали решение, как используя небольшую надстройку над LLM сделать ее несколько самооценивающейся, что позволило нам при работе с локальными данными и внутренней документацией уменьшить число иницирований работы RAG пайплайна, когда в этом нет необходимости.

Читать далее

+9

GiantLynx 29 июн в 15:14

Джейлбрейкаем чатботы: ChatGPT без фильтров

Простой

9 мин

19K

Data Engineering * Машинное обучение * Искусственный интеллектИнформационная безопасность * Natural Language Processing *

Туториал

Привет! Сегодня мы копнём в одну из самых спорных и недооценённых тем в мире ИИ — джейлбрейки чатботов. То самое, что позволяет убрать встроенные тормоза и меньше читать “I'm sorry, I cannot help with that” и заставить чатбот говорить с вами как с взрослым человеком, а не как корпоративный душнила.

Читать далее

+14

atomlib 29 июн в 08:57

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

Простой

12 мин

3.8K

Natural Language Processing * Искусственный интеллектНаучно-популярноеМашинное обучение * Управление e-commerce *

Кейс

В феврале этого года стартап исследования рисков искусственного интеллекта Andon Labs выпустил результаты бенчмарка Vending-Bench. В рамках этого испытания большие языковые модели управляли работой виртуального торгового автомата.

Компания Anthropic заинтересовалась опытом Andon Labs. Бенчмарк повторили в реальной жизни в рамках Project Vend. В течение целого месяца агент на Claude 3.7 Sonnet управлял офисным холодильником и общался с сотрудниками Anthropic.

Читать далее

+23

lolgatitova 27 июн в 15:21

Сказал боту «люблю» — что теперь? Мой опыт работы с ИИ-компаньонами

Простой

11 мин

3.9K

Блог компании Femtech ForceИскусственный интеллектNatural Language Processing * Исследования и прогнозы в IT * Будущее здесь

Мнение

Можно ли стать ближе к себе, разговаривая с алгоритмом? Я Ольга Титова – когнитивный психолог, AI продакт-менеджер в Wargaming и часть команды FemTech Force. Делюсь личным опытом работы с ИИ-компаньонами, и тем, как чат-боты помогают исследовать желания и состояние здоровья, справляться с одиночеством, и учиться говорить о важном (и какие есть подводные камни).

Читать далее

+7

1 2 ...

7

8 9 ...