Обновить
716.72

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Агенты, которые не теряют цель: как научить ИИ решать многошаговые задачи

Время на прочтение4 мин
Количество просмотров2.5K

Открыть телефон, быстро найти нужный файл, перенести данные между приложениями — для нас привычная рутина, а для ИИ-агентов с их умением «видеть» экран это настоящее испытание. Важно не просто нажать правильные кнопки, а удерживать замысел: дойти до финала, не сбиться на полпути и не потерять контекст. Крупные языковые модели уже умеют работать со скриншотами и даже рассуждать о шагах, но когда задача требует больше двух-трех действий подряд, начинается настоящее веселье. Почему ИИ так легко «теряет нить», и как свежие исследования учат его держать в голове весь сценарий — рассказываем на живых примерах и с неожиданными находками из мира полуонлайн-обучения.

Читать далее

Трансформерные архитектуры для рекомендаций: от SASRec до сегодняшнего дня. Сравниваем с помощью RecTools

Время на прочтение15 мин
Количество просмотров846

Привет, Хабр! С вами Никита Зелинский, Chief Data Scientist МТС, директор по машинному обучению и исследованию данных MWS. В прошлый раз рассказывал, куда расти Data Scientist и какие навыки для этого нужны, а сегодня будет адаптация моего доклада с конференции True Tech Day. Полную видеоверсию можно посмотреть в комьюнити True Tech в VK.

Обсудим, как трансформеры меняют индустрию рекомендательных систем и почему это уже не просто хайп, а устойчивый стандарт, с которым работают в реальных продуктах. Покажу путь от базовых подходов к state-of-the-art-архитектурам, а еще объясню, как с помощью open-source-библиотеки RecTools от МТС можно сравнивать, конфигурировать и оптимизировать рекомендательные алгоритмы на практике.

Будет полезно тем, кто хочет разобраться, как устроены трансформерные рекомендательные модели. Приступим!

Читать далее

Как данные влияют на качество ML-фичи. Виртуальный фон для Контур.Толк

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров588

Привет, Хабр! Меня зовут Павел Кузнецов, и я ML-разработчик в лаборатории компьютерного зрения Центра ИИ Контура. Мы занимаемся созданием AI-фич для продуктов компании. Один из наших ключевых заказчиков — сервис видео-конференц-связи Контур.Толк. Для него мы разрабатываем такие фичи, как бьютификация, улучшение освещённости, детекция дипфейков и, конечно же, сегментация фона.

В статье я расскажу, как мы создавали виртуальный фон. Наш путь был полон вызовов: мы долго выбирали архитектуру, продумывали стратегию обучения и искали способ запустить модель в вебе. Каждая из этих задач достойна отдельной истории. Но эта статья — рассказ о данных, «новой нефти», и о том, как мы их добывали на разных этапах разработки.

Читать далее

Сколько ведущие страны планируют и проинвестировали в полупроводниковую ИИ-инфраструктуру (включая Россию) — сравнение

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.2K

Общий объем планируемых инвестиций в ИИ-инфраструктуру к 2030 году достигнет $2.75 трлн, при этом частный капитал ($2.22 трлн) намного превосходит государственные вложения ($530 млрд). Каждая страна выбирает уникальный вектор развития, отражающий национальные приоритеты и геополитическое позиционирование.

В статье посмотрим на запланированные и уже исполненные инвестиции в ИИ-инфру по основным странам (и сравним с РФ).

Читать далее

Нейро-дайджест: ключевые события мира AI за 3 неделю сентября 2025

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Alibaba показала Qwen 3 Next, Mistral получила $1,5 млрд инвестиций, а в Абу-Даби презентовали K2-Think. Replit выпустил Agent 3, ElevenLabs добавили Voice Remixing, а Google наконец сделали вертикалки в Veo 3. ИИ уже назначают министра в Албании и помогают выбирать премьера в Непале, а новые AirPods научились переводить в реальном времени.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

Как дорожные знаки попадают на карты Яндекса: применяем ML в картографии

Время на прочтение11 мин
Количество просмотров28K

Важное свойство любых карт — их актуальность. Чтобы Яндекс Карты максимально точно отражали дорожную обстановку, мы постоянно мониторим изменения в реальном мире. Один из факторов, который необходимо отслеживать, — это установка или демонтаж знаков дорожного движения.

Меня зовут Владимир Быстрицкий, я руковожу группой AI-картографирования. В этой статье расскажу о процессе детектирования дорожных знаков в картопроизводстве Яндекса: с чего всё началось, как развивалось, какие технологии использовались. Ну и попробую ответить на самый, на мой взгляд, главный вопрос в любой ML-задаче: как собрать датасет и не разориться?

Читать далее

Вперед в будущее, или Когда заводами будут управлять роботы

Время на прочтение12 мин
Количество просмотров3K

Привет, Хабр! Меня зовут Дмитрий Тетерюков, и я профессор Центра системного проектирования Сколтеха. Работаю на стыке ИИ и роботов — там, где алгоритмы начинают взаимодействовать с физическим миром и ведут себя «по-человечески».

В этом материале по мотивам моего доклада с True Tech Day я расскажу, как функционируют когнитивные роботы с физическим ИИ (Physical AI). Это направление, которое готовится перевернуть промышленность и стать многомиллиардным рынком. Сюда вкладываются гиганты вроде NVIDIA и Google. Physical AI — это не просто программы, а системы, которые способны мыслить, учиться и действовать в реальном мире. Разберемся, как когнитивные роботы принимают решения, какие вызовы стоят перед разработчиками и почему это самое крутое направление в ИИ прямо сейчас. Поехали!

Читать далее

Как выбрать облачный GPU-инстанс для развертывания ИИ-моделей: практическое руководство

Время на прочтение3 мин
Количество просмотров1.1K

Развертывание ИИ-моделей в облаке — стандартная задача для современных специалистов по машинному обучению. Но выбор подходящего инстанса GPU часто превращается в «лотерею»: переплата за избыточные ресурсы или, наоборот, «торможение» из-за недостаточной мощности. В этой статье мы расскажем, как не ошибиться с выбором облачного GPU, сохранив баланс между производительностью и бюджетом. Акцент сделаем на реальных кейсах — от обучения нейросетей до инференса в продакшене.

Читать далее

Ученые научились быстрее находить положение минимума функции, не вычисляя ее значений

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров12K

Российские ученые из МФТИ, Сколтеха и Иннополиса провели теоретическое исследование и компьютерное моделирование новых методов оптимизации, основанных на использовании сравнений значений функции между собой без знания самих значений этой функции и ее производных. Им удалось построить более эффективные алгоритмы, чем традиционные, и открыть обсуждение использования концепции порядковых оракулов в вычислении. Работа опубликована в материалах конференции NeurIPS 2024.

В свежей статье, представленная на конференции NeurIPS 2024, авторы предлагают новые подходы. Они создали оптимизационный алгоритм, который использует порядковый оракул, и предложили способ ускорения этого алгоритма. Исследователи подтвердили теоретическую состоятельность предложенных методов через численные эксперименты, которые продемонстрировали их высокую производительность. 

Читать далее

Как я пытался подружить PHP с NER — драма в 5 актах

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.7K

Это статья — пример небольшого личного опыта, где я пытался решить одну чисто техническую задачу для одного из моих текущих проектов. Задача в конце‑концов была решена, насколько правильно — не знаю, но надеюсь многим будет интересен и полезен мой опыт. Итак, небольшая драма в 5-ти актах.

Читать далее

Эмоции на длинной дистанции: как ИИ учится быть эмпатичным

Время на прочтение3 мин
Количество просмотров664

Почти все тесты на «эмоции» у больших языковых моделей — это короткие реплики: вежливый ответ, парочка поддерживающих слов, и всё на этом. Но в жизни всё работает иначе. Когда разговор затягивается, люди уводят тему в сторону, вспоминают старое, возвращаются — и именно тогда важные нюансы легко теряются. Могут ли современные ИИ не сбиться с эмоциональной нити на длинной дистанции, когда речь идёт не о паре фраз, а о десятках страниц и сложных диалогах? Исследователи решили проверить это на практике: собрали стресс‑тест для моделей с объемными, реальными сценариями, в которых приходится дотошно разбирать переживания и поддерживать разговор до конца. И вместе с этим придумали пару довольно интересных трюков, чтобы дать моделям шанс не «утонуть» в потоке эмоций. Как ИИ справился с этим марафоном — и что из этого вышло, читайте далее.

Читать далее

Развитие интеллектуальных помощников в центрах кибербезопасности

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров961

Всем привет! Я работаю инженером-разработчиком в STEP LOGIC. Наша команда создает технологическую платформу для автоматизации анализа данных и расследования инцидентов STEP Security Data Lake (SDL). Мы были первыми на российском рынке, кто смог внедрить AI-ассистента в SIEM/SOAR. Поэтому в этой статье я хотел бы поразмышлять о перспективах развития и особенностях применения интеллектуальных помощников в системах мониторинга кибербезопасности.

В статье я рассмотрю, какие задачи поможет решить внедрение интеллектуального помощника, с какими рисками придётся столкнуться, разберу пример интеграции AI-ассистента и особенности интеллектуальных систем на базе RAG.

Читать далее

Lens Blur Fields: нейросетевая ФРТ на службе улучшения фотографий и идентификации камеры

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров1.1K

Оптическое размытие — обобщающий термин для различных факторов деградации изображения, таких как расфокусировка, дифракция и аберрации. Математически оно описывается функцией рассеяния точки. Форма ФРТ, как правило, пространственно-вариантна и зависит от координат в поле изображения, настройки фокуса, расстояния до объекта (глубины резкости), апертуры и длины волны. Поэтому любые попытки точно описать размытие реальной камеры сталкиваются с необходимостью измерять слишком большое количество параметров, что на практике выполнить почти невозможно.

Метод Lens Blur Fields предлагает новое решение: использовать многослойные перцептроны, которые обучаются представлять ФРТ в виде непрерывной функции высокой размерности (arXiv:2310.11535). Такая модель способна обобщать по всем параметрам сразу и восстанавливать плавные изменения ФРТ вместо того, чтобы хранить её в виде разрозненной таблицы замеров.

В теории это значит, что метод Lens Blur Fields позволит не только сделать очередной красивый фильтр с боке, но и различать экземпляры камер по снимкам с них.

Читать далее

Ближайшие события

Топ-12 бесплатных нейросетей для создания видео и оживления картинок

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров135K

Когда вы в последний раз поднимали взгляд к звёздам и думали: «А вдруг где-то там действительно есть жизнь?»

Космос всегда был для нас не только загадкой, но и сценой для фантазий. Учёные ищут ответы в телескопах и формулах, а мы решили погнаться за модой и спросить у нейросети.

Сегодня достаточно пары слов — и алгоритмы нарисуют целые миры. Теперь режиссёром становится ваше воображение, которое неплохо так заправлено искусственным интеллектом.

Мы протестируем 12 сервисов и посмотрим, смогут ли они превратить безмолвный космос в оживший пейзаж и заселить его инопланетными героями.

Да пребудет с тобой Сила, нейросеть… и пусть твои звёзды не рендерятся сутками!

Приятного чтения!

Читать далее

Как ChatGPT помогает при обучении

Время на прочтение16 мин
Количество просмотров8K

Как мы учимся новому:

- Самостоятельно — читаем книги, статьи, смотрим бесплатные материалы в интернете.

- На курсах / с ментором — помимо обучающих видео и статей идет закрепление материала в виде домашних заданий.

Но ведь теперь есть ChatGPT (и его аналоги) — искуственный интеллект (ИИ), очень много знающий. Ему можно задать любой вопрос и получить развернутый ответ. Как он изменит обучение? Заменит ли он тренера на курсах? Или будет ему помогать?

Я считаю, что чат — не замена «обычной» учебе, однако большое подспорье для неё. И в этой статье я покажу плюсы и минусы его использования в обоих вариантах обучения.

Читать далее

Что случается с медицинскими данными без стандартов отчетности: кейс менингита и survival-анализа в R

Время на прочтение8 мин
Количество просмотров468

Без стандартов — ни к журналу, ни к себе не подступишься: в этой статье — история анализа выживаемости пациентов с менингитом и то, как внедрение STROBE и TRIPOD полностью изменило подход к работе с медицинскими данными. На примере кейса и кода на R автор показывает, как стандарты отчетности помогают структурировать исследование, избежать потерь данных, честно построить модель и — главное — самому понять, что ты сделал.

Читать далее

«Большие вызовы»: как школьники за 3 недели собрали модуль для офлайн-распознавания документов на Android

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.2K

Привет, Хабр! Меня зовут Олег Милосердов, я руковожу проектами по компьютерному зрению в ВТБ. В июле мы с коллегами приняли участие в научно-технологической программе «Большие вызовы» от образовательного центра «Сириус» в качестве наставников. Мы предложили школьникам спроектировать и внедрить автономный модуль распознавания MRZ-зоны документов, удостоверяющих личность, прямо на мобильном устройстве под Android, которое работает без интернета, серверов и облака. В этой статье расскажу, как талантливые старшеклассники справились с задачей, какой опыт получили и какие выводы мы можем сделать как наставники.

Читать далее

«Скажи мне, кто-то твой друг, и я скажу, кто ты». Разбираемся, стоит ли дружить с чат-ботами

Время на прочтение5 мин
Количество просмотров1.3K

Современные чат-боты — не просто программы с набором готовых фраз, а комплексные, сложные системы. Они обучаются, адаптируются к пользователю, имитируют эмоции, причем так натурально, что порой кажутся настоящими собеседниками. В этом нет ничего удивительного, ведь их задача — быть полезными, дружелюбными, поддерживающими.

Все бы хорошо. Но в редких случаях чрезмерное увлечение чат-ботами может привести к смещению акцентов в реальном общении и ощущению изоляции. Давайте разбираться, почему виртуальная дружба иногда выходит за рамки привычного и как сохранить здоровый баланс.

Читать далее

Программисты против ИИ и low-code: кто кого заменит

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров3.5K

Привет, Хабр!

«Программистов станет больше, но других» — эта фраза из недавней дискуссии в телеграм-канале Dev Q&A заставила меня задуматься о том, насколько быстро меняется наша профессия.

Коллеги из Диасофт — Сергей Ольков и Дмитрий Старов — вместе с экспертами из других компаний устроили жесткий разбор того, что происходит с разработкой в эпоху ИИ. К нимприсоединились Дмитрий Маруськин (TechLead Capture C# Team), Дмитрий Демиркылыч (АО «Нейросети»), Сергей Сергеев (Comindware) и Алексей Граков (Agizo).

Самое ценное в дискуссии — полное отсутствие розовых очков.

Читать далее

Что выяснили про ChatGPT: первые реальные данные несколько удивляют

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров16K

OpenAI впервые раскрыла реальную статистику использования ChatGPT: 73% запросов не связаны с работой

Компания OpenAI опубликовала первое масштабное исследование поведения пользователей ChatGPT, проанализировав 1,5 миллиона реальных диалогов за период с мая 2024 по июнь 2025 года. Результаты оказались неожиданными и развенчали многие мифы об использовании ИИ.

Ключевые выводы:

700 млн пользователей в неделю - каждый десятый взрослый житель планеты

73% запросов личные, только 27% связаны с работой (год назад было 50/50)

Женщины обогнали мужчин - 52% vs 48% пользователей

Программирование - всего 4,2% от всех запросов (а не основное применение, как многие думали)

Три главные категории: практические советы (29%), поиск информации (24%), создание текстов (24%)

Неожиданные факты:
→ В развивающихся странах ChatGPT растет в 4 раза быстрее, чем в богатых
→ 10% всех обращений - это обучение и репетиторство
→ Больше половины "письменных" задач - редактирование существующих текстов, а не создание нового контента

Исследование показало, что ChatGPT превратился из нишевого инструмента для программистов в массовый помощник для повседневных задач - от рецептов до домашних заданий.

Читать далее

Вклад авторов