Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

MidavNibush 25 июл в 11:11

Векторный кэш: делаем умные ответы еще быстрее

Простой

9 мин

2.3K

Блог компании RaftИскусственный интеллектМашинное обучение*Поисковые технологии*Программирование*

Обзор

Сегодня чат‑боты и интеллектуальные ассистенты широко применяются в различных сферах: поддержка клиентов, корпоративные системы, поисковые сервисы и во многих других. Для их разработки часто используют архитектуру Retrieval‑Augmented Generation (RAG), которая объединяет генерацию ответа с поиском данных во внешних источниках. Такой подход помогает ботам и ассистентам давать более точные и актуальные ответы. Но на практике оказывается, что RAG сталкивается с проблемой повторяющихся запросов, из‑за которой система многократно выполняет одни и те же вычисления, повышая нагрузку и время отклика.

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft, и в этой статье мы разберемся, что такое векторный кэш и как его использовать. Давайте начнем!

+13

averkij 25 июл в 09:18

DRAGON: динамический бенчмарк для оценки RAG-систем на русском языке

Средний

12 мин

1.3K

Блог компании СберБлог компании Open Data ScienceМашинное обучение*Open source*Natural Language Processing*

Обзор

С появлением больших языковых моделей (LLM) стало казаться, что они умеют всё: от генерации кода до написания статей в научные журналы. Но, как только дело доходит до фактов, особенно актуальных и узкоспециализированных, начинаются проблемы. LLM — это не поисковики и не базы данных, знания у них статичны: что было в обучающей выборке, то модель и «знает» (да и то не всегда твёрдо). Постоянно дообучать её на актуальных данных — уже вызов. Тут на сцену выходят RAG-системы (Retrieval-Augmented Generation).

Если коротко, RAG — это способ «подкормить» LLM свежими данными: перед генерацией ответа модель получает не только сам вопрос, но и релевантные тексты, найденные внешней поисковой системе или во внутренней базе знаний. Идея звучит просто, но как понять, насколько хорошо это работает? Какие документы действительно помогли модели, а какие запутали её ещё больше? А главное — как сравнить разные RAG-системы между собой по-честному?

Оценка таких систем — нетривиальная задача. С одной стороны, нужно учитывать и качество извлечённых документов, и финальный ответ модели. С другой — важно избегать контаминации: когда модель «угадывает» правильный ответ просто потому, что уже видела его в процессе обучения. Это особенно актуально при использовании статических наборов данных вроде Natural Questions или HotpotQA: они давно «протекли» в открытые датасеты, в том числе для обучения популярных LLM.

+11

Wonderlove 24 июл в 17:10

Нейро-дайджест: ключевые события мира AI за 3-ю неделю июля 2025

Средний

10 мин

2.3K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение*Будущее здесьIT-компании

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной и интересной: Mistral подвезли глубокий рисёрч и визуальный редактор прямо в Le Chat, OpenAI тестирует мощную программную модель o3 Alpha, а Grok внезапно стал аниме-девочкой. В Дубае откроют первый ресторан с ИИ-шефом, а Netflix уже использует ИИ в создании сериалов.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

+24

dmitrifriend 24 июл в 15:05

Никто пока не знает, как работать с ИИ

Простой

6 мин

6.2K

Блог компании BotHubИскусственный интеллектМашинное обучение*Программирование*Ненормальное программирование*

Мнение

Перевод

Будущее разработки ПО, возможно, станет похожим на джаз. Каждый импровизирует, никто не смотрит на ноты.

На прошлой неделе я выпустил Protocollie. Сделал его за 4 дня, используя языки, которых не знаю, и даже не касаясь кода напрямую. Люди без конца спрашивают: «Как это удалось?» Но я даже не уверен, что получится повторить то же самое второй раз.

Мы все придумываем этот процесс на ходу.

+12

olegnazarov 24 июл в 11:05

За неделю от ночных кошмаров до спокойного сна: как я автоматизировал защиту от AI-хакеров

Средний

12 мин

2.8K

Искусственный интеллектИнформационная безопасность*DevOps*Python*Машинное обучение*

Никто не любит быть тем парнем, который говорит «а давайте еще и защиту поставим». Особенно когда речь идет о блестящем новом AI‑продукте, который должен был запуститься «еще вчера». Но когда твой корпоративный чат‑бот начинает выдавать системные промпты направо и налево, а в 2 ночи тебе в Telegram прилетают сообщения «СРОЧНО! Хакеры взломали бота!» — понимаешь, что без брони в бой идти нельзя.

+22

AIgent_Smith 24 июл в 09:05

RuModernBERT и USER2: эволюция русскоязычных энкодеров

9 мин

1.2K

Блог компании VKМашинное обучение*Искусственный интеллектNatural Language Processing*

Кейс

Привет, Хабр!

В прошлом году одним из направлений работы R&D команды в AI VK были энкодеры текстов: модели, которые преобразуют любой текст, от анекдота до официального запроса в техподдержку, в векторное представление — эмбеддинг. Эмбеддинги отражают важные свойства текста, его семантику. Все энкодеры в NLP можно условно разделить на две группы:

•Pre‑train‑модели (BERT, RoBERTa, DeBERTa).
Учатся основным языковым закономерностям, но не умеют явно создавать единый эмбеддинг для всего текста и требуют дообучения под конкретную задачу.

•Энкодеры текстов (SBERT).
Сразу выдают готовые семантические эмбеддинги — используются в FAISS, Milvus, других векторных БД. Поверх векторного представления можно применять классические алгоритмы ML. Для оценки схожести текстов просто считаем косинусную близость между эмбеддингами.

В этой статье мы расскажем о технических деталях обучения таких моделей: как возникла идея, как мы её реализовывали, что получилось в итоге.

+19

mechupe 24 июл в 07:00

Как мы разработали гибкий пайплайн для прогноза временных рядов любых метрик

20 мин

2.3K

Блог компании ЯндексМашинное обучение*Анализ и проектирование систем*Алгоритмы*

Практически каждый ML‑разработчик сталкивался с прогнозированием временных рядов, ведь окружающие нас сущности и метрики зачастую зависят от времени.

Меня зовут Александр Елизаров, я работаю в группе аналитики ключевых показателей в бизнес‑группе Поиска и рекламных технологий. В течение нескольких лет нам приходилось прогнозировать большое количество временных рядов разных доменных областей: от поисковой доли Яндекса до DAU определённых сервисов. Чтобы успешно справляться с этой задачей, мы вместе с коллегами разработали собственный прогнозный фреймворк. В этой статье я расскажу, как создать универсальный и гибкий пайплайн для прогнозирования. Под катом рассмотрим:

— правильно выстроенную иерархию данных;

— методы консистентного предсказания абсолютных и относительных метрик;

— частые проблемы моделей и то, как мы их фиксили;

— а также все важные этапы, о которых нельзя забывать, когда работаешь с временными рядами.

+20

jenissimo 23 июл в 15:58

Как приручить AI-пиксель-арт

Средний

5 мин

7.6K

Разработка игр*JavaScript*Обработка изображений*Машинное обучение*

Кейс

За последние пару лет генеративные нейросети стали волшебной кисточкой для всего: концепт‑артов, иконок, иллюстраций, обложек, аватаров, спрайтов… Особенно — пиксель‑арта. В Midjourney, Stable Diffusion, Dall‑E, Image-1 и в других моделях можно просто вбить: «Pixel art goose with goggles in the style of SNES» — и получить шикарного пиксельного гуся за 10 секунд.

Но если ты пробовал вставить такого гуся в игру — ты уже знаешь боль.

Я решил вкопаться в эту тему поглубже и сделать open‑source‑инструмент, который автоматизирует превращение AI‑generated pixel art в pixel‑perfect pixel art.

+154

cognitronn 23 июл в 12:36

Топ-24 бесплатных нейросетей и AI-сервисов на все случаи жизни

Простой

11 мин

41K

Блог компании BotHubИскусственный интеллектМашинное обучение*Научно-популярноеКонтент и копирайтинг*

Обзор

2025 год. Как же легко алгоритмы вошли и закрепились в нашей жизни. Они на работе, в учёбе, в творчестве, в быту. Нейросети редактируют тексты, выбирают шрифт, накидывают идеи, помогают с кодом, сочиняют музыку. Честно говоря, единственное, что они пока не умеют — это сварить вам кофе. Хотя… и это, кажется, вопрос времени.

А ведь пару лет назад мы с удивлением наблюдали, как нейросети неуверенно двигают объекты на фото. Кто же тогда мог предсказать, что эпоха Уилла Смита, поедающего спагетти, окажется прологом к такой революции?

Вместе с возможностями пришёл и новый вызов. Как разобраться во всём этом многообразии. Что работает действительно хорошо? Что подойдёт под ваши задачи? Где не нужно платить, регистрироваться и разбираться в интерфейсах?

Мы собрали подборку надёжных и удобных нейросетей, которые уже сейчас можно использовать без лишних заморочек. Всё разложено по категориям: генерация текста, создание изображений, видео, музыка, презентации и многое другое. В каждой расположились три сервиса!

Приятного чтения!

+74

Timeweb_Cloud 23 июл в 12:15

Украдено для вдохновения? Как нейросети превращают чужое творчество в «уникальный» контент

Простой

4 мин

3.7K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение*Контент и копирайтинг*Законодательство в IT

Обзор

Нейросети пишут книги и музыку, создают картины и другие произведения искусства. Этим уже никого не удивишь, но есть нюанс. Основой для искусства от генеративного ИИ служат произведения людей. Как творят нейросети, и что они вытворяют с ранее созданным контентом? Это вообще законно? Разбираемся в статье.

+12

miriteam 23 июл в 11:14

Как мы оживили DPED: собираем датасет для обучения модели

Простой

16 мин

473

Блог компании YADROИскусственный интеллектМашинное обучение*Обработка изображений*Open source*

Привет, Хабр! Сегодня с вами команда регионального научно-образовательного центра «Искусственный интеллект и анализ больших данных» при НГТУ им. Р. Е. Алексеева. Продолжаем рассказывать о нашей работе по возрождению и улучшению DPED (Deep Photo Enhancement Dataset). Это открытый проект исследователей из ETH Zurich, который включает как датасет парных изображений, так и нейросетевую модель для повышения качества мобильных фотографий до уровня DSLR. В нашем случае мы хотим довести снимки сэто планшета YADRO KVADRA_T, снимки с которого мы хотим довести по качеству до качествауровня полупрофессиональной камеры Sony Alpha ILCE 6600.

Отметим, что цель проекта не только исследование и обучение модели, но и последующее внедрение полученных наработок в приложение камеры планшета. Мы рассматриваем варианты локального инференса на самом устройстве, включая оптимизацию модели под мобильные вычислительные платформы с использованием TensorRT или ONNX Runtime. Так улучшать изображения можно прямо на устройстве — либо в момент съемки, либо в фоновом режиме.

+13

ph_piter 22 июл в 13:51

Книга: «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon»

5 мин

2.6K

Блог компании Издательский дом «Питер»Профессиональная литература*Python*Машинное обучение*

Привет, Харборожители! Мы представляем вам новую книгу Дэниса Ротмана — «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecone». Это практическое руководство для тех, кто хочет освоить передовые технологии искусственного интеллекта и научиться создавать эффективные системы на основе Retrieval-Augmented Generation (RAG).

В книге описываются приемы создания эффективных больших языковых моделей, систем компьютерного зрения и генеративного ИИ, показывающих высокую производительность при относительно невысоких затратах. В ней приводится подробное исследование технологии RAG, а также подходов к проектированию мультимодальных пайплайнов ИИ и управлению ими. Связывая вывод с исходными документами, RAG повышает точность и контекстную релевантность результатов, предлагая динамический подход к управлению большими объемами информации.

+13

E_P_H_E_M_E_R_I_S 22 июл в 11:15

Правда ли KAN лучше MLP? Свойство разделения глубины между двумя архитектурами

Сложный

9 мин

2.5K

Искусственный интеллектИсследования и прогнозы в IT*Математика*Машинное обучение*Научно-популярное

Из песочницы

Прошлым летом в свет вышла новая архитектура нейронных сетей под названием Kolmogorov-Arnold Networks (KAN). На момент выхода статьи про KAN эта новость произвела фурор в мире машинного обучение, так как KAN показывала существенный прирост в качестве аппроксимации различных сложных функций. Ошибка новых сетей падает значительно быстрее при увеличении числа параметров. Однако, за все приходится платить, и цена таких маленьких значений функции ошибки - медленное обучение: KAN обучается примерно в 10 раз медленнее, чем старый добрый MLP. Из всего этого возникает вопрос: насколько все же уместно использование новой архитектуры вместо привычных всем MLP?

В данной статье будет найдена функция, которая может быть реализована с помощью двухслойного KAN полиномиальной ширины, но не может быть приближена никакой двухслойной ReLU MLP сетью с полиномиальной шириной

+22

A-n-d-r-e-w-y 22 июл в 10:52

T-one — открытая русскоязычная потоковая модель для телефонии

Сложный

14 мин

9.8K

Блог компании Т-БанкИскусственный интеллектМашинное обучение*Open source*

Кейс

Всем привет! Я Андрей, ML-разработчик из команды распознавания речи в Т-Банке. Мы занимаемся полным циклом разработки: сбором и разметкой данных, проведением экспериментов по обучению моделей, интеграцией в продакшен.

В русскоязычном сегменте давно не хватает открытых моделей распознавания речи, которые можно было бы быстро кастомизировать под реальные задачи. Более того, почти все доступные модели работают офлайн и не адаптированы под специфику телефонии. Поэтому мы решили опубликовать собственную потоковую акустическую модель с кодом для ее инференса и дообучения, а еще выложить 5-граммную языковую модель.

Акустическая модель является по-настоящему потоковой, легковесной, производительной и обгоняет по качеству более крупные открытые офлайн-модели в телефонии.

В статье расскажу, как устроена потоковая модель распознавания, как и на чем ее обучали и как ее можно использовать.

+58

makrushin 22 июл в 10:00

Секретные ингредиенты безопасной разработки: исследуем способы точного и быстрого поиска секретов

10 мин

734

Блог компании Yandex Cloud & Yandex InfrastructureИнформационная безопасность*Управление разработкой*Машинное обучение*Искусственный интеллект

Точно и быстро искать секрет в коде — тривиальная задача, если знаешь конкретный формат секрета и осуществляешь поиск в своём проекте. Задача становится сложнее, если твой скоуп включает несколько проектов или один большой корпоративный монорепозиторий. И эта же задача становится вызовом, если область поиска — платформа для разработчиков, а формат твоего секрета — недетерминирован.

Меня зовут Денис Макрушин, и вместе с Андреем Кулешовым @akuleshov7и Алексеем Тройниковым @atroynikov в этом году мы сделали POC платформы для безопасной разработки в рамках команды SourceCraft. Сегодня поговорим о функциональности поиска секретов. Наша appsec‑платформа состоит из двух групп инструментов: анализаторы, которые требуют точной настройки, и слой управления, который отвечает за обработку результатов и интеграцию с инфраструктурой.

В этом материале пройдём стадию discovery для анализатора секретов: посмотрим на актуальные инструменты поиска секретов, их ограничения и определим направления для повышения трёх ключевых параметров Secret Sсanning: точность, полнота и скорость.

+13

dmitrifriend 21 июл в 16:00

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

Простой

9 мин

14K

Блог компании BotHubИскусственный интеллектМашинное обучение*Программирование*IT-компании

Обзор

В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».

Компания называет Grok 4 флагманской моделью с «непревзойденной производительностью в языке, математике и рассуждениях». По словам Маска, 4-я версия разумнее, чем учёные в степени кандидата наук: «Многие обладатели PhD завалились бы там, где Grok справился».

В этом обзоре — всё об особенностях Grok 4, его характеристики и рекорды в бенчмарках, а также информация, где воспользоваться моделью.

+12

Niketas 20 июл в 11:05

Топовый инвестор OpenAI пал жертвой синдрома Шершавого Кабана

Простой

3 мин

52K

Искусственный интеллектМашинное обучение*Научно-популярноеМозг

Мнение

У основателя венчурного фонда Bedrock Джеффа Льюиса потёк чердак в прямом эфире. Это системная проблема того, как устроены LLM.

Как он до этого дошёл

+38

145

anatolii-potapov 19 июл в 14:00

T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM

Сложный

9 мин

9.1K

Блог компании Т-БанкМашинное обучение*Искусственный интеллект

Кейс

Всем привет! На связи Толя Потапов, MLE в Т-Банке. Мы продолжаем развивать собственную линейку моделей GEN-T и внутренние продукты на основе своих моделей: агенты в саппорте, внутренние копилоты для сотрудников и Вселенную ассистентов.

Мы уже делились большими языковыми моделями T-lite 0.1, T-lite 1.0 и T-pro 1.0. Модели завоевали популярность и скачиваются суммарно более 15к раз в месяц.

Сегодня делимся новой моделью T-pro 2.0, обученной на основе модели Qwen3 32B, но с более плотной токенизацией на русском языке. Модель поддерживает гибридный ризонинг и позволяет сгенерировать рассуждение перед тем как отвечать. Это помогает в сложных задачах, где требуется несколько последовательных выводов, таких как математика.

Мы дообучали модель в несколько этапов, чтобы прокачать общее качество решения задач на русском и улучшить генерацию рассуждений.

Расскажу общие детали процесса обучения модели, основные характеристики и результаты замеров качества. Поделюсь, какие сложности у нас возникали и на чем планируем сосредоточиться.

+41

olegnazarov 19 июл в 11:15

Как я устал тестировать LLM-системы вручную и написал универсальный сканер уязвимостей

Средний

9 мин

16K

Искусственный интеллектИнформационная безопасность*DevOps*Python*Машинное обучение*

Из песочницы

Полгода назад я работал над внедрением RAG-системы в крупной финансовой компании. Задача была типичная: построить корпоративного чат-бота, который мог бы отвечать на вопросы сотрудников по внутренним документам. Казалось бы, что может пойти не так? Берем готовую LLM, подключаем к базе знаний, добавляем немного магии с векторным поиском — и готово.

Но когда я начал тестировать систему перед продакшеном, обнаружил, что наш "умный" ассистент превращается в болтливого предателя при правильно сформулированных вопросах.

+43

alenusch 18 июл в 12:18

MERA Code: всесторонняя оценка генерации кода в прикладных сценариях

Средний

9 мин

Блог компании СберБлог компании Open Data ScienceМашинное обучение*

Кейс

Всем привет! Авторы бенчмарка MERA этим летом не только анонсировали отраслевую ветку — MERA Industrial, но и рады сообщить о расширении проекта на кодовые задачи.

Большие языковые модели (LLM) сегодня умеют не только вести диалог, но и писать код, помогать с документацией и автоматизировать задачи разработчиков. Однако возникает вопрос: «Как мы измеряем качество этих способностей?» Большинство бенчмарков сосредоточены на проверке понимания языка и, частично, на генерации кода. Но насколько такой код применим на практике? Учитываются ли требования, сформулированные на русском? Как модели работают с документацией на других языках, кроме английского? Мультиязычные бенчмарки вроде HumanEval-X, MultiPL-E и mxEval делают шаг в нужную сторону, но по большей части сосредоточены на языках программирования. Связь между кодом и естественным языком, особенно в многоязычном контексте, пока освещена слабо.

Чтобы учесть все эти моменты, мы разработали MERA Code — первый комплексный бенчмарк для оценки больших языковых моделей на реальных прикладных задачах, с которыми сталкивается программист в русскоязычном контексте.

+15

2 3 ...

242 243

Машинное обучение *

Векторный кэш: делаем умные ответы еще быстрее

Новости

DRAGON: динамический бенчмарк для оценки RAG-систем на русском языке

Нейро-дайджест: ключевые события мира AI за 3-ю неделю июля 2025

Никто пока не знает, как работать с ИИ

За неделю от ночных кошмаров до спокойного сна: как я автоматизировал защиту от AI-хакеров

RuModernBERT и USER2: эволюция русскоязычных энкодеров

Как мы разработали гибкий пайплайн для прогноза временных рядов любых метрик

Как приручить AI-пиксель-арт

Топ-24 бесплатных нейросетей и AI-сервисов на все случаи жизни

Украдено для вдохновения? Как нейросети превращают чужое творчество в «уникальный» контент

Как мы оживили DPED: собираем датасет для обучения модели

Книга: «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon»

Правда ли KAN лучше MLP? Свойство разделения глубины между двумя архитектурами

Ближайшие события

T-one — открытая русскоязычная потоковая модель для телефонии

Секретные ингредиенты безопасной разработки: исследуем способы точного и быстрого поиска секретов

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

Топовый инвестор OpenAI пал жертвой синдрома Шершавого Кабана

T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM

Как я устал тестировать LLM-системы вручную и написал универсальный сканер уязвимостей

MERA Code: всесторонняя оценка генерации кода в прикладных сценариях

Вклад авторов