Обновить
712.8

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Почему молчит умный счетчик? Побеждаем коллизии в сетях NB-IoT

Время на прочтение9 мин
Количество просмотров1.4K

IoT-сети проектировали для миллионов устройств, но они захлебываются уже от тысяч. Когда в нашем районе на секунду моргнул свет, 10 000 умных счетчиков одновременно потеряли связь и начали переподключаться. Три четверти так и не смогли выйти в эфир. Проблема в RACH — канале случайного доступа. При массовых подключениях он превращается в узкое горлышко, куда каждый пытается прорваться первым.

Меня зовут Максим Князев, старший системный инженер К2 Кибербезопасность, и я натренировал пять ИИ-агентов для управления этим хаосом. Один прогнозирует пики нагрузки, другой распределяет временные слоты, третий управляет мощностью передачи, четвертый распределяет устройства по типам и пятый оптимизирует расход батарей. В итоге количество коллизий упало с 26% до 7%, энергопотребление на 35%, а успешность подключений выросла до 96% по сравнению с использованием статического метода без агентов. Под катом рассказываю, как это работает.

Читать далее

Без тренировки, но с обучением: имплицитная динамика in-context learning

Время на прочтение15 мин
Количество просмотров356

Одной из наиболее примечательных особенностей Large Language Models (LLM) является их способность к in-context learning — обучению в контексте. В частности, на этапе инференса LLM может усваивать новые паттерны без какого-либо дополнительного обновления весов, если эти паттерны представлены в виде примеров в промпте, даже если эти паттерны не встречались во время обучения. Механизмы, за счёт которых это возможно, всё ещё во многом остаются неизвестными.

В данной работе мы показываем, что комбинация слоя self-attention с MLP позволяет трансформер-блоку неявно модифицировать веса MLP-слоя в зависимости от контекста. Мы утверждаем на основе теоретического анализа и экспериментов, что этот простой механизм может объяснять, почему LLM способны обучаться в контексте, а не только во время тренировки модели. В частности, мы демонстрируем, что при ряде упрощающих допущений трансформер-блок неявно преобразует контекст в low-rank обновление весов MLP-слоя.

Читать далее

Алгоритм поиска аномалий Isolation Forest

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров3.2K

Привет, Хабр!

Меня зовут Михаил Васильев, я старший специалист по машинному обучению в компании Makves (входит в группу компаний «Гарда»). Эта статья — вторая в цикле, посвященном поиску аномалий. В первой статье мы поговорили о том, что такое аномалии и почему их сложно искать, а также по шагам разобрали алгоритмы HBOS и ECOD.

Сегодня мы разберем еще один интересный алгоритм: Isolation Forest, а также немного углубимся в проблематику задачи.

Читать далее

Ваш грейд, стек и немного боли: опрос для data-специалистов

Время на прочтение1 мин
Количество просмотров184K

Приветствуем всех коллег по цеху!

Мы в X5 Tech запускаем опрос, чтобы лучше понять, как живёт сообщество специалистов по работе с данными: какие инструменты используете, какие вызовы встречаете в работе и о чём мечтаете в свободное время.

Если ваша работа связана с данными, помогите нам узнать вас и ваших коллег лучше — пройдите наш опрос. А мы, в свою очередь, проанализируем ваши ответы и поделимся интересными инсайтами о data-специалистах на отдельном лендинге и расскажем об интересных кейсах по управлению данными из жизни data-сообщества X5.

Пройти опрос

Нейро-дайджест: ключевые события мира AI за 4-ю неделю сентября 2025

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.7K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: xAI выкатила дешёвый и быстрый Grok 4 Fast, новые релизы от Alibaba и Luma. Figma и Google Chrome теперь с нейросетями, Meta* представила очки с ИИ-фильтром, а хакеры в Корее вовсю используют ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

Лучшие фреймворки для машинного обучения в 2025 году

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров4.4K

Сегодня ни один крупный проект в области машинного обучения (ML) не обходится без фреймворков — готовых наборов библиотек, в которых базовые алгоритмы уже оптимизированы для различных архитектур. Выбор правильного фреймворка не только упрощает разработку, но и определяет успех проектов по внедрению искусственного интеллекта.

В этой статье эксперты лаборатории искусственного интеллекта российской ИТ-компании «Криптонит» рассматривают самые актуальные фреймворки для машинного обучения, анализируют причины их популярности, ключевые области применения и тенденции развития. Аналитика строится как на собственном опыте, так и на данных специализированных источников, таких как GeeksforGeeks, Upgrad, Octal Software и других, чтобы предоставить аргументированный и непредвзятый обзор.

Мы разделили обзор на две части. В первой рассматриваются фреймворки для глубокого обучения. Они ориентированы на построение и обучение нейронных сетей, в том числе сложных архитектур, таких как свёрточные модели и трансформеры. Вторая часть посвящена фреймворкам для классического машинного обучения. Они используются для работы с моделями, основанными на регрессии, решающих деревьях, методах ансамблирования (например, бустинг) и других алгоритмах без использования глубоких нейросетей.

Читать далее

Эволюция процессов: от классической автоматизации до самооптимизирующихся ИИ-агентов

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1.9K

Привет, Хабр! Я Игорь Морозов, архитектор в Platformeco. Мы более семи лет развиваем методологию композитных предприятий (Composable Enterprise), изначально разработанную с Google и Gartner, а также делаем продукты iPaaS, API-management и Workflow automation. На True Tech Arch #7, конференции для IT-архитекторов я рассказывал, как ИИ меняет интеграцию и автоматизацию. В этом материале по мотивам моего доклада я покажу, при каких обстоятельствах создание ИТ-продуктов уйдет доменным экспертам, появится возможность автоматизации недоступных ранее процессов и с какими вызовами это столкнется.

Читать далее

Почему ИИ в программировании спотыкается в реальной работе: новый бенчмарк показал всю правду

Время на прочтение4 мин
Количество просмотров5.1K

Казалось бы, ИИ в программировании уже уверенно прописался в наших кодовых репозиториях: он чинит баги, предлагает патчи и с легкостью проходит тесты на привычных бенчмарках. Отсюда и растет ощущение, что полноценные ИИ-программисты — вот‑вот станут реальностью. Но как только дело доходит до задач из настоящей индустрии, вся сияющая картинка начинает трещать по швам. Новый бенчмарк SWE-Bench Pro устроил моделям суровый экзамен и показал, насколько велика пропасть между вежливым автокомплитом и работой инженерного уровня. Что именно не так — и почему даже самые продвинутые системы вдруг оказываются не у дел, если попросить их разобраться в большом и сложном проекте? Статья про честную проверку возможностей ИИ в мире реальных задач.

Читать далее

Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров21K

Команда AI for Devs перевела статью, в которой автор делится прогнозами о будущем ИИ-агентов в 2025 году. Его выводы: несмотря на шумиху, «автономные агенты» столкнутся с экономическими и техническими барьерами. Почему текущий подход к архитектуре агентов не сработает и какие методы действительно приносят результат — читайте в статье.

Читать далее

Топ-5 нейросетей для создания аватаров

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.4K

Представьте: вы просыпаетесь, волосы торчат в разные стороны, голос напоминает смесь дрели и чайника, а коллеги требуют записать корпоративное видеообращение. Если раньше с этим связывали панику, десять дублей и нервный тик, то сегодня — пара кликов, и ваш сияющий цифровой двойник уже говорит, улыбается и выглядит будто только что сошёл с обложки журнала.

Видео-аватары не устают, не спорят и не требуют премии к Новому году. Хотите стендап? Сделает. Нужно обратиться к подписчикам с важной новостью? Пожалуйста. Даже поздравить тёщу с днём рождения. А самое главное — за всё это не нужно платить, по крайней мере в начале.

Поэтому, если вы давно мечтали стать говорящей головой без мучений перед камерой, добро пожаловать! Дальше вас ждет обзор 5-ти лучших бесплатных сервисов для создания видео-аватаров.

Приятного чтения!

Читать далее

Могут ли кодинг-агенты самосовершенствоваться?

Время на прочтение12 мин
Количество просмотров3.4K

Представьте программиста, который мастерски собирает для себя вспомогательные утилиты, а потом равнодушно отмахивается: «Честно? Мне они не нужны». 

Именно так повела себя GPT-5 в ходе теста на умение выстраивать собственный набор инструментов для продуктивности. Модель выдала целый арсенал CLI-утилит в духе Unix, но… отказалась ими пользоваться.

Почему так случилось и что это говорит о будущем кодинг-агентов — разбираем в статье.

Читать далее

AEO и GEO: Как не потерять трафик в эпоху нейросетей, которые крадут клики прямо из поиска

Время на прочтение4 мин
Количество просмотров875

Привет, хаброжители! Представьте: вы часами полируете мета‑теги, подбираете ключевые слова и анализируете конкурентов, а в это время ваш органический трафик тает на глазах. Почему? Потому что поисковые системы эволюционируют быстрее, чем мы успеваем адаптироваться. Нейросети в Google, Яндексе и даже в Bing теперь не просто выдают ссылки, они генерируют готовые ответы прямо в выдаче, без переходов на ваш сайт. Клиенты получают информацию на месте, а вы — минус в статистике.

Это реальность 2025 года. Классическое SEO уходит в прошлое, уступая место AEO (Answer Engine Optimization) и GEO (Generative Engine Optimization). В этой статье мы разберем, что это такое, почему ваш трафик падает на 30–60%, и как адаптировать контент, чтобы нейросети «любили» ваш сайт.

Читать далее

От небольшой мастерской к ML-фабрике: как мы Yandex AI Studio пересобирали

Время на прочтение11 мин
Количество просмотров4K

Сегодня на Yandex Neuro Scale 2025 наша ML‑команда представила обновлённую AI Studio — платформу с большим набором инструментов для разработки ИИ‑агентов в единой end‑to‑end‑среде. Среди новинок — визуальный конструктор агентов, поддержка популярных API и реализация протокола MСP, механизмы AI search.

Агентские платформы уже какое‑то время находятся на пике популярности. Поэтому с одной стороны нашей задачей было учесть уже сформированные лидерами отрасли лучшие практики. А с другой — обобщить собственный опыт разработки и внедрения агентов, использующих большие языковые модели, и избавить разработчиков от проблем при инференсе.

Вместе с коллегами из команды разработки Анастасией Каримовой и Дмитрием Рыбалко покажем, как это устроено под капотом:

— какие особенности эксплуатации нам нужно было учесть, чтобы найти баланс между производительностью и качеством;

— как мы сталкивались с особенностями опенсорс‑инструментов для ML и учились справляться с этим разными способами;

— как мы упростили создание голосовых агентов и заодно уменьшили latency запросов.

Читать далее

Ближайшие события

Dell PowerEdge R7715

Время на прочтение3 мин
Количество просмотров2.4K

Серверный рынок постоянно развивается, и Dell не отстаёт от трендов. Недавно компания представила PowerEdge R7715 — 2U-сервер на базе процессоров AMD EPYC 9005, который сразу привлёк внимание специалистов по инфраструктуре. В этой статье мы расскажем, почему этот сервер может стать отличным решением для вашего дата-центра.

Читать далее

Обратная сторона ИИ: подводные камни передачи процессов нейросетям

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3K

Искусственный интеллект потихоньку делает жизнь проще, но он же становится источником рисков, особенно когда речь идет о нейросетях как о новом подрядчике. Когда компании их интегрируют, не всегда получается досконально продумать то, чем это может быть чревато. 

Сегодня я пытаюсь понять реальные риски внедрения нейросетей в рабочие процессы. Надеюсь на твои комментарии, наблюдения и страхи, Хабр!

Читать

Два пути из Тирании Квадрата: Сравнительный разбор MoE и SSM как наследников Трансформера

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров869

Архитектура Трансформеров уперлась в стену квадратичной сложности O(n²), или «Тиранию Квадрата». В статье мы разбираем два пути решения этой проблемы: Mixture-of-Experts (MoE), масштабирующий знания, и State Space Models (SSM), масштабирующий контекст. Это сравнительный анализ архитектур, которые определяют будущее AI.

Читать далее

SteosMorphy: опенсорс замена давно умершему PyMorphy2

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.5K

PyMorphy2 — самая популярная библиотека для обработки слов в русском языке. Однако последний коммит в репозиторий этой библиотеки был сделан более 5 лет назад, а её установка на Python версии 3.11+ вызывает трудности, что делает использование данной библиотеки в нынешнее время максимально затруднительным.

Предлагаю рассмотреть новую Open Source библиотеку SteosMorphy, которая является аналогом PyMorphy, но делает всё быстрее и круче!

Ознакомиться

Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников

Время на прочтение20 мин
Количество просмотров4.6K

Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest в Новосибирске,  по которому и написана данная статья. В ней я расскажу о нашем опыте построения сервиса text2sql — интеллектуального помощника, который позволяет получать доступ к данным из баз по запросу на естественном языке. Такой сервис особенно актуален для крупных компаний с развитой аналитической культурой и большим объемом данных: он позволяет менеджерам и аналитикам запрашивать нужную информацию в виде таблицы, графика или конкретного ответа, не прибегая к помощи специалистов по SQL.

Читать далее

Российские ученые создали оптимальный алгоритм децентрализованной оптимизации для динамических сетей

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров802

Группа российских ученых из МФТИ, Сколтеха и Научно-исследовательского центра искусственного интеллекта Университета Иннополис разработала революционный алгоритм для решения сложной задачи децентрализованной оптимизации. Результаты исследования опубликованы в материалах конференции NeurIPS 2024.

До сих пор в научной литературе отсутствовали оптимальные алгоритмы, а также теоретические оценки минимального количества коммуникаций и вычислений, необходимых для решения задачи децентрализованной оптимизации для негладких функций в динамических сетях.

Читать далее

MARKER: Собираем свой русскоязычный мультимодальный датасет для оценки VLM

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров1K

Привет, Хабр! Меня зовут Игорь Рябков. В этой статье расскажу, как мы собрали датасет для оценки Visual Language Models на русском языке и с учетом нашего культурного контекста. Этот проект появился в рамках исследовательской работы в Инженерно-математической школе НИУ ВШЭ и VK под руководством Александра Рогачева (AI VK). Опыт показал — собрать подобный датасет под свои задачи можно и без огромных ресурсов, если подойти к делу системно.

Современные Visual Language Models — мультимодальные братья больших языковых моделей, способные одновременно читать тексты и анализировать изображения. Казалось бы, такие модели открывают множество новых возможностей и для российских пользователей. Однако большинство известных датасетов для VLM — MMBench, MMMU, MME — ориентированы на английский язык и западную аудиторию. Локальные решения вроде K-Viscuit (Корея) и MERA (Россия) только начинают появляться, но их пока недостаточно. Поэтому мы решили собрать датасет, который бы учитывал специфику русского языка и мог покрыть актуальные задачи для пользователей.

Встречайте MARKER: Multimodal Assessment of Russian Knowledge in Educational Realms.

Читать далее

Вклад авторов