Все потоки
Поиск
Написать публикацию
Обновить
756.32

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Период
Уровень сложности

Ученые научились быстрее находить положение минимума функции, не вычисляя ее значений

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров12K

Российские ученые из МФТИ, Сколтеха и Иннополиса провели теоретическое исследование и компьютерное моделирование новых методов оптимизации, основанных на использовании сравнений значений функции между собой без знания самих значений этой функции и ее производных. Им удалось построить более эффективные алгоритмы, чем традиционные, и открыть обсуждение использования концепции порядковых оракулов в вычислении. Работа опубликована в материалах конференции NeurIPS 2024.

В свежей статье, представленная на конференции NeurIPS 2024, авторы предлагают новые подходы. Они создали оптимизационный алгоритм, который использует порядковый оракул, и предложили способ ускорения этого алгоритма. Исследователи подтвердили теоретическую состоятельность предложенных методов через численные эксперименты, которые продемонстрировали их высокую производительность. 

Читать далее

Полезные задачи на Kaggle ( LLM, Diffusion Models)

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.7K

В мире Data Science и Data Engineering ценится не только теория, но и практический опыт: умение работать с реальными данными, строить модели и доводить решения до результата. Однако получить такой опыт непросто: рабочие проекты часто закрыты NDA, а учебные кейсы не отражают сложность реальных задач.

Именно поэтому платформа Kaggle заняла особое место в индустрии. Это крупнейшее мировое сообщество специалистов по данным:

Читать далее

Как обучение с подкреплением перестраивает мышление LLM

Время на прочтение4 мин
Количество просмотров1.6K

Когда говорят о продвинутых ИИ-моделях, чаще всего обсуждают точность фактов или впечатляющую скорость ответа. Но если копнуть глубже, становится ясно: настоящая магия — в умении рассуждать и строить сложные цепочки мыслей. Недавнее исследование показало, что обычное обучение с подкреплением меняет не только цифры в метриках, но и заставляет модель внутренне перестраиваться. Постепенно появляется четкое разделение — где просто выполняется инструкция, а где возникает настоящий план, со своими “давай попробуем” и “а что если”. Оказывается, важнее всего — это скрытая стратегия, которая позволяет моделям ловить редкие инсайты, делать ошибки на совершенно новом уровне и обыгрывать старые методы по всем фронтам. Как это устроено на практике и почему отдельные группы токенов вдруг становятся стратегами — об этом и пойдет речь.

Читать далее

Репозитории на автопилоте: как ИИ сам поднимает окружение и запускает код

Время на прочтение4 мин
Количество просмотров783

Открытые репозитории — это кладезь готовых моделей, скриптов и датасетов, но работа с ними порой напоминает сборку конструктора без инструкции. Сначала разбираешься, как всё устроено, потом ловишь баги на ровном месте, устанавливаешь зависимости — и только после этого кое-как запускаешь нужную задачу. А как было бы здорово, если бы сами репозитории умели понимать, что от них хотят, настраивать себе среду и ещё договариваться между собой!

Вот тут на сцену выходит EnvX — система, которая превращает обычные проекты в автономных агентов: они читают документацию, поднимают окружение, выполняют нужные функции и… общаются друг с другом. Получается совсем новый взгляд на то, каким может стать open-source.

Читать далее

Перевод датасета для оценки эмпатии на русский язык: подход, проблемы, результаты

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров330

Эмпатия играет важную роль в коммуникации между людьми, и в частности, в сервисах психологической помощи. В онлайн-среде, где такая помощь всё чаще оказывается в текстовом формате, появляется много различных сервисов, которые предоставляют психологическую помощь на основе чатботов. Для них способность отвечать эмпатично становится критически важным навыком. В противном случае хорошо если сеанс окажется просто бесполезным и не усугубит имеющиеся проблемы.

Успех БЯМ побуждает разработчиков использовать их в качестве основы для таких чатботов. Для оценки их способностей разрабатываются различные бенчмарки, в частности для задач с уклоном в психотерапию. Одним из таких является PsyEval.

Однако для автоматической оценки эмпатии в текстах на русском языке размеченных датасетов просто нет. Мы, русскоязычные MLщики, не можем сказать, как сейчас БЯМ справляются с задачами, которые связаны с выявлением эмпатии и генерацией эмпатичных ответов. А ведь эти задачи напрямую влияют на качество инструментов псих-поддержки.

Чтобы это хоть как-то исправить, мы приспособили большие языковые модели к переводу датасета с английского на русский язык. В этом посте я расскажу, как мы в команде Пситехлаб переводили датасет EPITOME с помощью больших языковых моделей.

Читать далее

Как оживить научные статьи: превращаем исследования в интерактивных ИИ-ассистентов

Время на прочтение4 мин
Количество просмотров555

Обычная научная статья ― это десятки страниц текста, сложные графики и ссылка на репозиторий где-то в глубине интернетов. Часто кажется, что в этот мир допускаются только те, кто готов неделями разбираться с чужим кодом и настраивать окружение через танцы с бубном. А что если бы статья могла сама «оживать» и превращаться в настоящего ИИ-ассистента, с которым можно разговаривать на обычном языке и сразу запускать любые её методы?

В свежем исследовании авторы предлагают именно это: новый инструмент, который берет научную работу и делает из неё агента-напарника. Теперь из пассивного PDF получается активный собеседник — он объясняет, считает, строит графики и даже сам проверяет свои результаты. Звучит как будущее, которое только что стало чуть ближе.

Читать далее

Хватит дообучать ИИ — дайте ему контекст

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.7K

Команда AI for Devs подготовила перевод статьи о том, почему Retrieval-Augmented Generation (RAG) чаще всего эффективнее дообучения моделей. Vector, Graph и Agentic RAG помогают ИИ работать точнее, быстрее адаптироваться и учитывать реальный контекст — будь то кодовая база, документация или API. Дообучение же остаётся дорогим и негибким инструментом.

Читать далее

Глубокие исследования без границ: выбираем свою LLM и управляем стратегией поиска

Время на прочтение4 мин
Количество просмотров2.6K

Инструменты для поиска и анализа информации на базе LLM становятся все умнее, но есть один нюанс: почти всегда они работают по заранее заданному сценарию. Вы набрали запрос — а дальше модель сама решит, какие источники ей искать, как проверять данные и что включить в отчет. Но большинство таких сервисов не предлагают никаких особых подходов — например, собственные правила проверки, любимую LLM или уникальную стратегия поиска.

В свежем исследовании Nvidia появилась идея: а что, если сделать так, чтобы вы сами могли выбирать, какая LLM будет искать для вас информацию, и описывать свои собственные алгоритмы исследования простым человеческим языком без программирования. По сути, это попытка дать пользователю то самое управление, которого раньше так не хватало. 

Как это выглядит на практике и зачем вообще отдавать в руки человека стратегию глубокого поиска — разбираемся в деталях.

Читать далее

Как за год вырастить персонализацию на главной: эволюция рекомендаций в fashion ecom

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров824

Привет, Хабр! Меня зовут Данил Комаров, я дата-сайентист в команде персонализации Lamoda Tech. Уже больше года мы меняем подход к рекомендациям на главной странице, делая их персонализированными. Я расскажу, как мы внедряли и масштабировали решение, переводили его из оффлайна в онлайн, и бустили систему на разных слоях.

Читать далее

Литературный обзор на статью: StyleGAN-NADA: CLIP-Guided Domain Adaptation of Image Generators

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров406

StyleGAN-NADA (No Annotation Domain Adaptation) - метод, разработанный специалистами из Tel Aviv University и NVIDIA Research, позволяющий адаптировать генеративную модель (StyleGAN2) к новому домену без единого изображения, использующий только семантическую силу больших моделей, предварительно обученных контрастивным методом на тексте и изображениях (СLIP). На рисунке 1 представлены возможности метода StyleGAN-NADA.

Читать далее

Строим корпоративную GenAI-платформу: от концепции до ROI. Часть 5. Внедрение GenAI и измерение эффекта

Время на прочтение8 мин
Количество просмотров3.7K

Это пятая и финальная статья специалиста по архитектуре ИТ-систем и трансформации ИТ-ландшафта Дениса Прилепского из серии «Строим корпоративную GenAI-платформу: от концепции до ROI». Переход от пилота к масштабируемому GenAI-решению требует не только технической зрелости, но и четкого понимания бизнес-целей. В статье рассматриваются метрики, подходы к масштабированию, обучение пользователей и типовые ошибки, с которыми сталкиваются компании на пути к измеримой ценности от GenAI.

Читать далее

Как построить мультиагентную систему, которая реально работает без магии и костылей

Время на прочтение4 мин
Количество просмотров3.2K

LLM уже умеют рассуждать, но ценность раскрывается, когда они выполняют действия в реальных задачах: ходят в веб, считают, вызывают сервисы. Там начинается хаос интерфейсов и мучение с отладкой. AgentScope 1.0 предлагает цельную систему для практичных агентов: единые сообщения, инструменты и память, параллельное исполнение и продакшн‑рантайм. В статье разбираемся в том, как этот конструктор упорядочивает мультиагентные сценарии и ускоряет путь от идеи к работающему сервису.

Читать далее

Обучаем GigaAM-Emo распознавать ещё больше эмоций

Уровень сложностиСредний
Время на прочтение35 мин
Количество просмотров457

Модель распознавания эмоций в речи GigaAM-Emo умеет классифицировать 4 эмоции: angrysadneutralpositive. Для некоторых задач бывает не достаточно классифицировать эмоции на 4 класса и хочется иметь более полный список эмоций. В статье рассмотрим: существующие корпуса данных для распознавания эмоций, ключевые возможности разработанного пайплайна для дообучения GigaAM с использованием библиотек hydra и Pytorch Lightning, результаты экспериментов с различными архитектурами и функциями потерь. Демо можно попробовать тут

Читать далее

Ближайшие события

Нажал — и мир двинулся: как Matrix-Game 2.0 делает видео интерактивным в реальном времени

Время на прочтение4 мин
Количество просмотров628

Что, если видеомодель не просто генерирует кадры, а откликается на нажатия? Matrix‑Game 2.0 приближает ИИ к «осязанию» мира: авторегрессия в 25 FPS, точный контроль мышью и клавиатурой, длинные сцены без забывания. За кулисами — датасеты из Unreal Engine и GTA 5. Результат — интерактивные видео, подчинённые законам физики, и прочный фундамент для симуляторов, планирования и обучения агентов.

Читать далее

AI-ученые уже здесь: Большой тур по LLM, которые меняют фундаментальную науку

Уровень сложностиПростой
Время на прочтение17 мин
Количество просмотров2.7K

Искусственный интеллект превращается из инструмента в полноценного партнера ученого. В этом большом обзоре мы рассмотрим, как LLM вроде AlphaFold 3, TxGemma и ChemLLM совершают революцию в биологии, медицине, химии и материаловедении, переходя от анализа данных к проектированию будущего.

Читать далее

AI-ассистенты для кодинга: сравнение инструментов

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров15K

AI-редакторы и агенты становятся частью повседневной разработки. Но у каждого свои сильные и слабые стороны: где-то упор на автономность, где-то на глубокое понимание кода, а где-то на гибкость за счёт open source. Ниже — обзор самых заметных решений.

Я протестировал каждый из них и выявил плюсы и минусы каждого из решений.

Читать далее

ML Q & AI. Глава 6. Уменьшение переобучения при помощи настройки моделей

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров867

← Предыдущая глава | Следующая глава →

Допустим, мы обучаем классификатор при помощи обучения с учителем и уже применили к датасету различные методы для уменьшения переобучения. Как можно улучшить модель или цикл обучения, чтобы добиться еще более заметного эффекта?

Наиболее эффективные методы борьбы с переобучением включают в себя различные техники регуляризации, такие как Dropout и сокращение весов. Как правило, модели с большим количеством параметров требуют больше тренировочных данных для успешного обобщения. Поэтому иногда уменьшение размера модели может помочь снизить степень переобучения. Наконец, одним из самых действенных способов борьбы с переобучением является создание ансамблей моделей. Однако этот метод иногда связан с повышенными вычислительными затратами.

В этой главе мы обсудим ключевые идеи и методы, которые помогают снизить переобучение при помощи модификации моделей, и сравним их между собой. В заключение мы обсудим, как выбрать между различными техниками уменьшения переобучения, включая те, о которых мы говорили в предыдущей главе.

Читать далее

Стирая языковые границы для NLP-датасетов

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров1.1K

Всем привет. В этом посте расскажем, как мы тестировали БЯМ для перевода англоязычных датасетов на русский. «Мы» — это ваш покорный слуга и ребята из ФИЦ ИУ РАН. Пост по факту перевод нашей статьи, которая была опубликована еще в апреле, но вот руки до поста дошли только сейчас.

Читать далее

GSPO (Qwen RL Algorithm by Alibaba Cloud)

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.9K

Qwen снова радуют релизом. Но на этот раз это не модель, а новый RL-алгоритм для обучения LLM

Метод называется Group Sequence Policy Optimization (GSPO), и именно он лег в основу последних громких моделей компании: Qwen3 Instruct, Coder и Thinking. Статья вышла пару дней назад, но о ней уже говорят все. Значит, пока разбираться и нам.

Сегодня один из самых популярных RL-алгоритмов для LLM – это GRPO (by DeepSeek). Если вам он не знаком – почитайте разбор вот тут. GRPO работает здорово и довольно стабильно, но на уровне токенов.

То есть в GRPO мы считаем награду для всей последовательности -> считаем важность каждого токена и применяем клиппинг также для каждого токена отдельно -> обновляем политику "на уровне токенов".

А в GSPO все то же самое происходит сразу для всей последовательности: считаем награду -> рассчитываем единый importance weight для всей последовательности и применяем клиппинг для всего ответа целиком с нормализацией по длине -> обновляем политику.

В чем преимущество такого подхода?

1. Не нужно устраивать танцы с бубном, когда работаешь с MoE. У GRPO из-за архитектурных особенностей MoE идет со скрипом, а тут все заводится из коробки.
2. Градиенты получаются менее шумными, потому что снижается дисперсия. Следовательно – еще более стабильное обучение. Следовательно – лучшие метрики при тех же ресурсах.
3. Инженерно реализуется гораздо проще.

Короче, выглядит очень привлекательно и, вероятно, станет следующим словом в RL для LLM (особенно в опенсорсе).

Читать далее

Прозрачное обнаружение предвзятости в ИИ: Новый подход с использованием аргументации

Время на прочтение6 мин
Количество просмотров596

Появилась статья, представляющая новый метод обнаружения предвзятости в алгоритмах искусственного интеллекта. Этот метод не только выявляет потенциальные 偏见 (biases), но и делает это прозрачно, используя структурированные дебаты, основанные на количественных биполярных аргументационных фреймах (QBAF). В мире, где ИИ всё глубже проникает в такие области, как здравоохранение, финансы и юстиция, борьба с предвзятостью становится критически важной задачей. Давайте разберёмся, как работает этот подход, почему он важен и как он превосходит существующие решения.

Читать далее

Вклад авторов