Обновить
683.65

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

BoatVision — как ИИ поможет спасти лодочный мотор

Время на прочтение9 мин
Количество просмотров5.8K

Управление маломерным судном, будь это ПВХ-лодка или каютный катер, отличается от вождения автомобиля. Дорог нет, и к местоположению маломерного судна на открытой воде можно отнестись вольготнее. Двигаясь по водным просторам, судоводитель позволяет себе отвлечься на картплоттер или местные красоты — ведь даже при движении с высокой скоростью окружающая картина вокруг меняется относительно медленно.

Но не все так радужно. Даже легкой ПВХ-лодке нужна какая-никакая глубина, чтобы винт мотора приводил ее в движение. И в этом приповерхностном слое может встретиться все что угодно — притопленные бревна, отмели и даже люди, которым захотелось поплавать вне привычных мест купания. Усугубляет проблему ветер и даже легкая волна, делающие подобные объекты на воде трудноразличимыми.

В этой статье хотим рассказать про BoatVision — систему технического зрения, которая используется для постоянного наблюдения, обнаружения и распознавания малоразмерных объектов на воде.

Читать далее

HeroBench: проверяем, как LLM справляются со сложным планированием в виртуальных RPG-мирах

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.7K

Привет! Меня зовут Петр Анохин, я руковожу группой «Нейрокогнитивные архитектуры» в Институте AIRI. Недавно мы выложили в открытый доступ новый бенчмарк для долгосрочного планирования LLM под названием HeroBench. Основанный на MMORPG‑песочнице для программистов, HeroBench проверяет способность современных моделей обрабатывать комплексный контекст, выполнять декомпозицию задач и формировать детализированные многошаговые планы достижения целей.

Мы прогнали через него 25 открытых и проприетарных LLM и выявили существенные различия в производительности, редко наблюдаемые в традиционных бенчмарках для анализа логических рассуждений. Другая особенность нашей работы в том, что новый бенчмарк вырос из небольшого студенческого проекта на летней школе AIRI. 

Подробнее об этом и технических деталях — читайте в нашей статье.

Читать далее

Топ-10 нейросетей для бизнеса в 2025 году: от обработки данных до создания контента

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров6.5K

Бизнес без цифровых помощников — всё равно что гонка без машины. Чтобы не отставать, предпринимателям нужно знать и использовать современные инструменты. Мы составили подборку из 10 нейросетей, способных стать вашими незаменимыми союзниками в деле повышения продаж и оптимизации процессов. Итак, приступим.

Читать далее

От экспериментов с ИИ до AI-Native: уровни зрелости и архитектура. Часть 1

Время на прочтение10 мин
Количество просмотров805

Привет!

С вами Юрий Сергеев, основатель и генеральный партнер в Swordfish Security. Мы строим DevSecOps и развиваем безопасный искусственный интеллект.

В этой статье я расскажу, как компании переходят от базового применения ИИ к концепции AI-Native, какие уровни зрелости существуют, как классифицируются приложения и модальности, а также с какими рисками сталкиваются организации при внедрении ИИ.

Читать далее

Ловим ошибки в диалогах поддержки с помощью LLM: опыт команды Yandex Crowd

Время на прочтение10 мин
Количество просмотров2.7K

Ежемесячно клиентская поддержка продуктов Яндекса обрабатывает миллионы обращений. Мы регулярно проверяем диалоги вручную. Это помогает бороться, например, с опечатками и другими ошибками операторов. Но проверить все диалоги в таком режиме невозможно — их слишком много. Поэтому мы решили посмотреть в сторону LLM-решений.

Привет! Меня зовут Дарья Шатько, я руководитель ML-группы в Yandex Crowd. В этой статье я расскажу, как мы с моим коллегой Антоном Удаловым внедряли большие языковые модели в контроль качества клиентской поддержки. А именно — почему регулярки и BERT не взлетели, как мы собрали репрезентативный golden‑датасет, как победили лимит контекста, снизили ложные срабатывания через многоступенчатый LLM‑flow и в итоге покрыли проверками абсолютно все диалоги поддержки.

Читать далее

Прорыв в обучении бинарных нейронных сетей: новый метод квантования обеспечивает их стабильность и высокое качество

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров4.9K

Группа российских ученых из компании Smart Engines и МФТИ предложила новый способ квантования бинарных нейронных сетей. Им удалось добиться лучших результатов для обучения таких сетей. Работа опубликована в журнале Computer Optics 2024.

Ученые из МФТИ с коллегами совершили прорыв, разработав новый метод квантования на неопределенной базе, который решает эту проблему, обеспечивая стабильное обучение и высокое качество бинарных нейронных сетей даже при ограниченном количестве параметров. 

Читать далее

Как научить робота выходить из лабиринта домино только «глазами»: Jetson Nano + Arduino

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров2.4K

Побег Робота из лабиринта. Технологи: Jetson + Arduino + CV. Робот находит выход из лабиринта только с помощью компьютерного зрения.

Посмотреть видео и код.

Увидел-указал-полетел: как управлять автономными дронами без обучения с нуля

Время на прочтение4 мин
Количество просмотров2.3K

Когда дроны только появились, ими можно было управлять разве что с пульта или через текстовые команды — «поверни налево», «лети прямо», «вверх на два метра». Всё это выглядело немного старомодно и, прямо скажем, неудобно: попробуй опиши словами маршрут, если дрон видит перед собой живую картинку, а тебе надо всё переводить в текст. И вот появился довольно неожиданный подход — вместо текстовых инструкций просто показывать дрону, куда лететь, буквально указывая нужную точку в кадре. 

Теперь команда для беспилотника — это не набор слов, а пиксель на изображении, а значит, связь между вашим замыслом и настоящим полетом стала куда более непосредственной. Модель сама определяет, как лететь к этой точке, одновременно замечает препятствия и быстро реагирует, если что-то изменится. Что получилось из этой попытки «разговаривать» с дроном языком зрения — и c какими проблемами исследователи столкнулись на практике? Всё оказалось интереснее, чем кажется на первый взгляд.

Читать далее

Обучение скрытых слоёв S–A–R перцептрона без вычисления градиентов

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров2.2K

C. Яковлев mg.sc.comp e-mail: tac1402@gmail.com

Disclaimer.  Это анонс, я еще работаю над научной статьей, но пока не могу найти ментора для возможности публикации в arxiv.org. Но пока хочу поделится с вами некоторыми сырыми результатами.

Аннотация. Классический перцептрон Розенблатта с архитектурой S–A–R исторически не имел устойчивого алгоритма обучения многослойных структур. В результате в современном машинном обучении доминирует метод обратного распространения ошибки (backpropagation), основанный на градиентном спуске. Несмотря на успехи, этот подход имеет фундаментальные ограничения: необходимость вычисления производных нелинейных функций и высокая вычислительная сложность. В данной работе показано, что при интерпретации работы нейросети через алгоритм ID3 (Rule Extraction) скрытый слой автоматически формирует чистые окрестности в смысле кластерного анализа — признаки группируются по классам ещё до завершения обучения. На основе этого наблюдения автором предложен новый стохастический алгоритм обучения, восходящий к идеям Розенблатта, но принципиально расширяющий их: он позволяет обучать скрытые слои перцептрона без вычисления градиентов. Таким образом, впервые решается классическая проблема обучения архитектуры S–A–R без градиентных методов. Это открывает путь к созданию принципиально новых алгоритмов обучения нейросетей с более простой и интерпретируемой динамикой.

Читать далее

Адаптивные ИИ-интерфейсы: от персонализации контента к персонализации когнитивных процессов

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров431

Research Vision — приглашение к дискуссии о следующем поколении человеко‑машинного взаимодействия

Уверен в том, что Вас когда‑нибудь раздражало, что ИИ объясняет «слишком подробно», когда нужен один ёмкий абзац?

Или наоборот: вы ждёте системного обзора, а получаете банальный сниппет кода. Эти ситуации знакомы каждому, кто работает с ИИ. Но проблема не в контенте — проблема в несовпадении мышления (как минимум).

Читать далее

GPT-5 и API Responses: зачем нужен ещё один стандарт?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.8K

Команда AI for Devs подготовила перевод статьи о новом API /v1/responses от OpenAI, который объединяет простоту Chat Completions и мощь Assistants, и при этом сохраняет состояние рассуждений, мультимодальность и встроенные инструменты. Это шаг к агентам будущего — и, похоже, к новому стандарту работы с моделями OpenAI.

Читать далее

Как с помощью локальной LLM автоматизировать рутину и облегчить жизнь себе и коллегам

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров45K

Привет, на связи Алексей Дубинец, Павел Беспалов и Глеб Гладков — BI-аналитики Авито. В тексте делимся идеями и промптами для использования локальной LLM в своих повседневных задачах, а ещё расскажем, как настроить инхаус модель в LM-Studio. Статья будет полезна аналитикам разных грейдов, которые сталкиваются с задачами, где нужно собрать, классифицировать и систематизировать большие объёмы информации.

Читать далее

Читаем вместе. ИИ в AppSec: могут ли LLM работать с уязвимым кодом

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.1K

Привет, Хабр!

На связи Максим Митрофанов, ML-лид команды Application Security в  Positive Technologies. Мы занимаемся прикладными вопросами машинного обучения по направлению безопасной разработки, регулярно изучаем новые технические репорты и доменные статьи, разбором одной из которых я и хотел бы поделиться с вами.

Исследуя подходы к оценке больших языковых моделей в разрезе безопасной разработки, мы наткнулись на статью »LLMs Cannot Reliably Identify and Reason About Security Vulnerabilities (Yet?): A Comprehensive Evaluation, Framework, and Benchmarks», которая посвящена анализу применения LLM в задаче обнаружения уязвимостей в исходном коде. 

Перевод фрагментов статьи, представленных в обзоре, не является дословным. Разбор содержит личные комментарии и размышления, возникшие в процессе чтения, и, на мой взгляд, будет особенно интересен специалистам по информационной безопасности и ML-инженерам, внедряющим ИИ в R&D-процессы компаний.

Читать далее

Ближайшие события

DeepSeek обучила LLM за 294 тыс. долларов. Как это удалось и чем этот путь отличается от OpenAI

Время на прочтение5 мин
Количество просмотров5K

Разработка больших языковых моделей обычно ассоциируется с астрономическими затратами. Но пример китайской компании DeepSeek показывает, что эта логика не всегда работает: их модель R1 была дообучена всего за 294 тыс. долларов США (на базовую версию ушло около 6 млн). Для сравнения, создание ChatGPT обошлось OpenAI в суммы на порядки выше.

Если информация китайских разработчиков верна, создавать LLM смогут не только корпорации уровня OpenAI, но и относительно небольшие компании. Правда, данные от DeepSeek вызывают сомнения у специалистов: не исключено, что часть расходов осталась «за кадром». Сегодня посмотрим, какие методы применяла DeepSeek, чем их стратегия отличается от подхода OpenAI и почему ИИ-сообщество оказалось разделено на оптимистов и скептиков.

Читать далее

Компьютерное зрение + ARKit = AR-навигация внутри зданий

Время на прочтение11 мин
Количество просмотров4.4K

Навигация внутри зданий — задача куда более сложная, чем на улице. GPS либо полностью не работает, либо даёт большую погрешность. Карта и инфостойки помогают, но не решают проблему полностью — они статичны, поэтому не всегда понятно, где посетитель находится прямо сейчас (вплоть до этажа) и в какую сторону он смотрит.

Мы решили сделать навигацию нагляднее — с помощью AR прямо через камеру смартфона. Сейчас технология доступна в столичных торговых центрах «Авиапарк», «Афимолл», «Европейский» и в «Галерее» в Петербурге.

В этой статье расскажем, как мы подошли к задаче с точки зрения компьютерного зрения, какие грабли собрали, как ускоряли локализацию и как боролись с погрешностями ARKit.

Следовать за синей стрелкой...

Что будет, если заставить ИИ-агента работать с тысячами API

Время на прочтение4 мин
Количество просмотров1.6K

Вы когда-нибудь задумывались, как ИИ-агента научить сразу работать с тысячами разных API? В обычной жизни всё просто — приложение вызывает одну-две привычные функции, а тут задача куда масштабнее: собрать из разрозненных инструментов настоящий швейцарский нож, который не теряется в сложных цепочках вызовов и правильно управляет аргументами, даже если сценарии усложняются. Команда ByteDance решила попробовать — «а что если научить ИИ действовать в среде, где инструментов не просто много, а очень много, и всё это в единой логике?» Получился AgentScaler: агент, который тренируется сразу в тысячах мини-миров, учится планировать, исправлять ошибки на ходу и удивительно бодро справляется даже с нестандартными задачами. 

О том, как устроена эта вселенная для ИИ, как там моделируют работу инструментов и почему такой подход кардинально меняет обучение агентов — в новом разборе.

Читать далее

AI-компаньон для профориентации на хакатоне

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров850

«AI-компаньон для профориентации» — как команда на AI Product Hack 2025 решала кейс от GIGASCHOOL и создавала персонализированного бот-ассистента для выбора будущей профессии. Рассказываем, как прошёл хакатон: какой стек использовали разработчики, как архитектура Telegram-бота помогает школьникам, студентам и взрослым найти подходящую специальность и образовательный маршрут, какие трудности ребята прошли на пути к MVP. Интеграция ML-ядра, векторные базы и гибкие диалоги — всё, чтобы сделать выбор профессии проще и прозрачнее.

Читать далее

Нейросеть на службе бизнеса: от отзыва до инсайтов

Время на прочтение6 мин
Количество просмотров1.6K

В эпоху цифровизации каждый клиентский отзыв — это больше, чем просто слова. Это ценный актив, содержащий информацию о настроениях, скрытых проблемах и возможностях для роста. Однако, как бизнесу эффективно обрабатывать тысячи таких сообщений? Решение лежит в области искусственного интеллекта. Сегодня мы разберёмся, как нейросеть трансформирует эмоциональный комментарий в структурированные данные, которые можно интегрировать в бизнес-процессы для принятия решений.

Читать далее

Оптимизация ремонта грузовых вагонов: от мирового опыта к российской практике

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.2K

Привет, Хабр! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В своей статье расскажу, как мы разработали систему оптимизации распределения вагонов на ремонт для одного из крупнейших железнодорожных операторов России Первой грузовой компании (ПГК). Внедрили методологию оценки экономического эффекта через сравнение с «идеальным сценарием». За два с половиной года работы система обработала рекомендации для более чем 50,000 вагонов.

Читать далее

Кейс: разработать квест-мастера на нейронке

Уровень сложностиСредний
Время на прочтение47 мин
Количество просмотров939

Инженерия подсказок, как и все, что связано с нейросетями, для непогруженного человека может показаться чем‑то раздутым и незначительным. Нет, ну серьезно. Что трудного попросить ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ сочинить стишок или рассказать популярно что такое «Эпистемологический анархизм». Но на деле все действительно оказывается слишком, слишком, слишком нетривиально. Расскажу на примере пустяковой задачки: «Разработать ИИ‑агента квест‑мастера, который генерит загадки и отслеживает ее угадываемость».

Доп.цель:
добиться исполнения логики именно на стороне нейросети, используя только ее базовые параметры, используя только бесплатные или самые дешевые модели, с задействованием минимально необходимого бекенда.

Читать далее

Вклад авторов