Как стать автором
Поиск
Написать публикацию
Обновить
813.31

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Fast & Furious: оценка ошибок измерений в футбольной аналитике. Часть 2

Время на прочтение9 мин
Количество просмотров1.7K

Привет! В предыдущей статье про аналитику футбольных матчей я рассказал вам о нашем пайплайне в целом и тонкостях сглаживания, а также о нескольких упражнениях для игроков, которые помогают нам моделировать реальные ситуации.

В этой же части, как и обещал ранее, будет рассказ про упражнение «2*2» (проверяем, сможет ли трекинговая система нормально отслеживать игроков в условиях резких перемещениях в ограниченной локации), синтетические тесты и выводы.

Давайте по порядку.

В качестве вступления, несколько основных моментов из первой части: 

Определение скорости возможно только с определенной погрешностью. Точность этой оценки важна как при выявлении превышения скоростного режима на дорогах, так и при анализе спортивных результатов, где даже небольшие ошибки могут повлиять на выводы.

Положение футболиста на поле можно определять различными способами. 

Для этого используются:  

Читать далее

Использование машинного обучения для оптимизации логистических процессов

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.6K

Привет! Сегодня в логистике мы сталкиваемся с множеством вызовов, требующих новых подходов. Глобализация, большие объёмы данных, изменчивость потребительских настроений и стремление к экономии делают традиционные способы управления недостаточно эффективными. Поэтому машинное обучение оказывается как никогда кстати и становится важным инструментом для оптимизации логистических процессов.

Традиционная организация цепочек поставок часто сталкивается с проблемами. Например, прогнозирование и планирование могут быть некорректными из-за отсутствия своевременных и точных данных. Для координации участников цепочек поставок требуются значительные, но не всегда оправданные ресурсы. Непредсказуемые обстоятельства, такие как погодные условия или колебания спроса, тоже могут приводить к сбоям. Работа вручную также повышает вероятность ошибок (человеческий фактор, куда ж без него) и снижает общую эффективность.

Читать далее

Я выяснил, что скрывают алгоритмы ИИ. Спойлер: нас не защитят даже законы Азимова

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров11K

Когда я понял, что ИИ уже принимает решения, которые влияют на мою жизнь, запереживал. Решил понять, почему 3 законы Азимова не спасут нас и как технологии могут выйти из-под контроля.

Бонус — примеры кода для (теоритического) внедрения этических правил в ИИ.

Читать далее

ML Q & AI. Глава 2. Self-Supervised Learning

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров609

← Предыдущая глава | Следующая глава →

Self-supervised обучение - это процедура предварительного обучения, которая позволяет нейронным сетям использовать большие объемы неразмеченных данных в supervised стиле. В этой главе мы сравним self-supervised обучение с трансферным, схожим методом для предварительного обучения моделей, и рассмотрим практические приложения SSL. Также обсудим основные категории self-supervised обучения.

Читать далее

От промтов к агентам: как мы дошли до трансформеров, что LLM умеют уже сейчас и что нас ждёт в 2027 году

Время на прочтение13 мин
Количество просмотров13K

Привет! Меня зовут Александр Фролов, я data scientist отдела машинного обучения в Нетологии. В этой статье я коротко расскажу, откуда взялись LLM, чем они стали сегодня, куда всё идёт и где в этом хаосе найти точку опоры.

Постараюсь обойтись без лишней теории и академического занудства — просто обзор по верхам с точки зрения дата-сайентиста, который строит пайплайны по обработке данных.

Читать дальше →

Яндекс.Полуразврат или при чём тут Crypt?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.5K

Яндекс выпустил новую модель для Шедеврума, которая попыталась прикрыть уязвимости, которые эксплуатировались для создания «небезопасного контента» категории 18+. Тем не менее, не всё так радужно и с «детским» режимом они очень торопятся. Некоторые уязвимости в промпте остались, а некоторые добавились. Но самое интересное – попытка спастись от «небезопасного контента» путём целенаправленной порчи датасета. Обо всём этом подробно в тексте.

Читать далее

MCP: новая игра на рынке искусственного интеллекта

Время на прочтение14 мин
Количество просмотров15K

Всё, что нужно знать о Model Context Protocol (MCP)

«Даже самые продвинутые модели ограничены своей изоляцией от данных — они заперты в информационных силосах и легаси-системах».
Anthropic о важности интеграции контекста

Сегодняшние большие языковые модели (LLM) невероятно умны, но находятся в вакууме. Как только им требуется информация вне их «замороженных» обучающих данных, начинаются проблемы. Чтобы AI-агенты действительно были полезны, им нужно получать актуальный контекст в нужный момент — будь то файлы, базы знаний, инструменты — и даже уметь совершать действия: обновлять документы, отправлять письма, запускать пайплайны.

Так сложилось, что подключение модели ко всем этим внешним источникам данных было хаотичным и нестабильным: разработчикам приходилось писать кастомные интеграции или использовать узкоспециализированные плагины под каждый API или хранилище. Такие «сделанные на коленке» решения были хрупкими и плохо масштабировались.

Чтобы упростить это, Anthropic представила Model Context Protocol (MCP) — открытый стандарт, предназначенный для того, чтобы связать AI-ассистентов с данными и инструментами, подключая любые источники контекста. MCP был анонсирован в ноябре 2024 года. Тогда реакция была сдержанной. Но сегодня MCP — на волне: он уже обогнал LangChain по популярности и, по прогнозам, скоро обойдёт OpenAPI и CrewAI.

Крупные игроки AI-индустрии и open source-сообщества начали активно поддерживать MCP, видя в нем потенциально революционный инструмент для построения агентных систем на базе LLM.

Читать далее

Нейро-дайджест: ключевые события мира AI за 1-ю неделю июля 2025

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2.1K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: HuggingFace выпустили SmolLM 3 — лучшую 3B модель, Apple рассматривает Claude и GPT вместо Siri, а Suno всерьёз зашёл в продакшн и купил DAW. Нейро-GTA теперь можно пощупать, а Дания первой в ЕС вводит авторское право на внешность и голос для борьбы с дипфейками.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

Разбираем на запчасти поисковый сервис в Яндекс Лавке

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров3.7K

Привет! Меня зовут Николай Смирнов, я ML-инженер в команде поиска Яндекс Лавки. В этой статье я расскажу немного о закулисье: 

— Как наша команда шаг за шагом строила поисковый сервис, начиная с алгоритма Ахо — Корасик, SaaS-решений и Маркета, и дошла до собственной архитектуры на C++ с userver и многослойным «бургером» из ML-моделей. 

— Зачем поиску Лавки понадобилось сразу несколько технологий — BM25, DSSM, BERT и CatBoost — и чем полезна каждая из них. 

— Как наш поиск собирает данные о вас и о товарах и почему ML-модели приходится дообучать. 

А ещё вместе «сломаем» прод — посмотрим, что произойдёт, если выключить какую-нибудь из моделей, и почему даже самые продвинутые нейросети не являются серебряной пулей.

В общем, будет немного истории, самое интересное из архитектуры, инженерные находки и живые примеры того, как поиск в Лавке принимает решения. Если интересно, как на самом деле работает поиск, — погнали!

Читать далее

В два раза лучше ChatGPT o3. Представлен Grok 4

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров20K

Компания xAI представила свои новые ИИ‑модели — Grok 4 и Grok 4 Heavy, в котором несколько агентов работают над проблемой параллельно. По утверждениям xAI, это позволило добиться значительного роста в производительности.

Читать далее

Permutation neuron или как решить MNIST на 77% с помощью 3 нейронов

Время на прочтение2 мин
Количество просмотров649

Это одна из попыток решить mnist за минимальное количество операций умножения.

В качестве примера рассмотрим задачу MNIST, где permutation neuron с тремя классических нейронами и есть вся наша сеть.

Permutation neuron — это вычислительный блок, реализующий преобразование входных сигналов на основе перестановки. Нейрон поддерживает набор внутренних векторов, которые переупорядочиваются на основе их взаимодействия с входными данными. Этот процесс переупорядочения отображает входное пространство в дискретный набор выходных шаблонов, где каждый шаблон соответствует определенной перестановке внутренних векторов.

Для классификации 10 цифр датасета MNIST требуется не менее 10 различных состояний нейрона. Поскольку число перестановок определяется факториалом количества нейронов, минимально необходимо 4 нейрона (4! = 24 перестановки), чтобы покрыть 10 классов. Однако, вычитая значение одного нейрона из остальных (нормализация), можно ограничиться вычислением трёх нейронов, задавая четвёртый нейрон равным нулю, без нарушения порядка перестановок. Это позволяет сократить вычислительные затраты, сохраняя 24 уникальных состояния для классификации.

Для задачи классификации 10 цифр датасета MNIST permutation neuron работает следующим образом: три нейрона с линейной функцией активации вычисляют значения на основе входных данных изображения, а четвёртый нейрон фиксируется равным нулю. Эти четыре значения упорядочиваются, формируя одну из 24 возможных перестановок (4!), например, ACZB. С помощью кода Лемера каждая перестановка преобразуется в уникальное число от 0 до 23, которое затем отображается на один из 10 классов MNIST, определяя, например, цифру от 0 до 9.

Читать далее

Готовимся к собесу: positional encodings в 2025 году

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров3.5K

Если вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом.

Позиционное кодирование заметно эволюционировало с момента появления оригинальной статьи о трансформерах. В современных LLM и моделях компьютерного зрения, таких как FLUX, уже давно не используется классическое sin/cos-кодирование.

Читать далее

Midjourney Video: как превратить картинку в видео в 2025 году?

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров6.6K

Казалось бы, только мы отдохнули от разбора второй волны нейросетей для генерации видео, как без объявления войны выходит она. Midjourney, та самая платформа, которая годами оставалась в стороне от видео-движухи, делает свой первый аккуратный, но амбициозный шаг. Встречайте: Midjourney Video V1, первая версия анимации, встроенной прямо в интерфейс.

Сегодня расскажем, как работает новая функция, что там с платформой и ценообразованием, чем отличаются режимы движения, и, конечно, как писать грамотные промпты для этой нейросети.

Приятного чтения!

Читать далее

Ближайшие события

Need for speed: оценка ошибок измерений в футбольной аналитике. Часть 1

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров6K

Привет! Меня зовут Артем, и я занимаюсь разработкой систем компьютерного зрения в сервисе Яндекс Спорттех. Среди основных задач нашей команды — футбольная аналитика и работа со статистическими данными.

Яндекс Спорттех обеспечил интеграцию технологических решений в РПЛ — все стадионы участников чемпионата были оборудованы камерами 6К, для клубов организована передача в режиме онлайн фитнес-данных и продвинутых данных на стыке технико-тактических действий. С помощью современных методов компьютерного зрения мы осуществляем детекцию игроков и мяча, ведём их трекинг, а также вычисляем различные ключевые спортивные метрики — пройденные дистанции, максимальные скорости, спринты и рывки, а также экстренные торможения и другие фитнес-показатели, важные как для аналитиков, так и для тренеров и поклонников игры.

В этих двух статьях мы подробно рассмотрим, почему точное измерение скорости движения и пройденной дистанции игроков критически важно для качественного анализа футбольных матчей. Расскажем, почему любые систематические ошибки и неточности могут весьма существенно исказить выводы и рекомендации для тренерского штаба и аналитиков. 

А ещё поделимся нашим опытом, расскажем о типичных источниках ошибок, возникающих при расчёте скорости и пробега, и опишем подходы, которые позволяют уменьшить их влияние. 

Читать далее

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

Время на прочтение10 мин
Количество просмотров689

Массовые фото из детского сада в родительских чатах редко бывают персональными: на десятках снимков сложно найти именно своего ребенка. Выпускники онлайн-магистратуры «Науки о данных» Центра «Пуск» МФТИ предложили решение — платформу KidFolio, которая с помощью технологий компьютерного зрения и мультимодальных моделей автоматически формирует и отправляет родителям персонализированные фото- и видеоотчеты.

В статье — подробности разработки: от сбора датасета детских лиц до создания собственного бенчмарка и дообучения моделей для генерации текстов.

Читать далее

Как мы улучшили режим ночной съемки в планшетах KVADRA_T

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.8K

Привет, Хабр! На связи Полина Лукичева, инженер команды AI ML Kit в компании YADRO. В первой статье я рассказала о проблемах режима ночной съемки и методах их решения. Сегодня перехожу к практике — проведу предметное сравнение алгоритмов, выберу наиболее подходящие и покажу, как они работают в реальных условиях на планшетах KVADRA_T.

Для наших заказчиков качественные снимки в условиях низкой освещенности — рабочая необходимость. Планшет поможет снять показания со счетчика в темном подвале или сфотографировать паспорт клиента в коридоре с минимальными шумами и максимальной четкостью.

Читать далее

Эмпатичный ИИ: как трансформеры учатся распознавать эмоции в разговорах

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров944

В эпоху чат-ботов и голосовых помощников ИИ всё чаще становится собеседником человека. Но чтобы стать по-настоящему полезным в коммуникации, он должен не только понимать слова — но и улавливать эмоции, интонации, паузы и даже жесты. Именно это и пытается решить задача Emotion Recognition in Conversations (ERC).

В недавней работе »A Transformer‑Based Model With Self‑Distillation for Multimodal Emotion Recognition in Conversations» исследователи предложили архитектуру, которая объединяет мультимодальные сигналы (текст, аудио, видео) в единую модель, способную «читать между строк» в прямом смысле. Рассказываем, как это устроено и почему это важно.

Читать далее

На пути к эмоциональному искусственному интеллекту

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2K

Привет, Хабр. Меня зовут Андрей Савченко, я научный директор Sber AI Lab. Когда речь заходит про эмоциональность и принятие решений у ИИ, нужно задать себе вопрос: «А как это устроено у людей?» Наверняка почти каждый из вас ответил бы, что он принимает решение рационально, а остальные, зачастую, иррационально. 

Нейропсихологи проводили исследования и выяснили, что большинство решений люди принимают эмоционально. С одной стороны, это экономит ресурсы мозга, а с другой — позволяет быстрее принимать решения. И поэтому очень важно учитывать нашу эмоциональность при взаимодействии с другими и при создании имитации людей или сообществ с помощью современных генеративных моделей. Условно это можно назвать эмоциональным искусственным интеллектом.

Читать далее

Как машины учат мир по-человечески: Разбираем крутое исследование про выпуклость

Время на прочтение4 мин
Количество просмотров3K

Мы наткнулись на потрясающее исследование, которое объясняет, как искусственный интеллект начинает думать почти как человек. Учёные решили заглянуть внутрь нейронных сетей и проверить, как они организуют свои «мысли». Вдохновились они идеей шведского учёного, который сказал, что в нашем мозгу понятия вроде «кот» или «яблоко» - это не просто точки, а целые области, причём выпуклые. Мы перевели и упростили это исследование для вас, чтобы показать, как машины учатся обобщать и становиться ближе к нам. Погнали разбираться!

Читать далее

LIME for ECG Time Series Dataset Example

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров946

LIME (Local Interpretable Model-Agnostic Explanations) — популярный модет в решении задачи интерпретации. Он основан на простой идее — приблизить прогнозы сложного оценщика (например, нейронной сети) простым — обычно линейной/логистической регрессией.

Применить LIME можно из коробки при помощи одноименной библиотеки [lime]. Однако, при применении LIME к, в частности, к временным рядам возникают особенности. Поэтому в чистом виде lime для TimeSeries не всегда легко применить. И в этом туториале мы сделаем приближенение метода самостотельно! :)

Читать далее

Вклад авторов