Все потоки
Поиск
Написать публикацию
Обновить
749.36

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Прорыв в обучении бинарных нейронных сетей: новый метод квантования обеспечивает их стабильность и высокое качество

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров299

Группа российских ученых из компании Smart Engines и МФТИ предложила новый способ квантования бинарных нейронных сетей. Им удалось добиться лучших результатов для обучения таких сетей. Работа опубликована в журнале Computer Optics 2024.

Ученые из МФТИ с коллегами совершили прорыв, разработав новый метод квантования на неопределенной базе, который решает эту проблему, обеспечивая стабильное обучение и высокое качество бинарных нейронных сетей даже при ограниченном количестве параметров. 

Читать далее

Новости

Как научить робота выходить из лабиринта домино только «глазами»: Jetson Nano + Arduino

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров319

Побег Робота из лабиринта. Технологи: Jetson + Arduino + CV. Робот находит выход из лабиринта только с помощью компьютерного зрения.

Посмотреть видео и код.

Увидел-указал-полетел: как управлять автономными дронами без обучения с нуля

Время на прочтение4 мин
Количество просмотров861

Когда дроны только появились, ими можно было управлять разве что с пульта или через текстовые команды — «поверни налево», «лети прямо», «вверх на два метра». Всё это выглядело немного старомодно и, прямо скажем, неудобно: попробуй опиши словами маршрут, если дрон видит перед собой живую картинку, а тебе надо всё переводить в текст. И вот появился довольно неожиданный подход — вместо текстовых инструкций просто показывать дрону, куда лететь, буквально указывая нужную точку в кадре. 

Теперь команда для беспилотника — это не набор слов, а пиксель на изображении, а значит, связь между вашим замыслом и настоящим полетом стала куда более непосредственной. Модель сама определяет, как лететь к этой точке, одновременно замечает препятствия и быстро реагирует, если что-то изменится. Что получилось из этой попытки «разговаривать» с дроном языком зрения — и c какими проблемами исследователи столкнулись на практике? Всё оказалось интереснее, чем кажется на первый взгляд.

Читать далее

Обучение скрытых слоёв S–A–R перцептрона без вычисления градиентов

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров646

C. Яковлев mg.sc.comp e-mail: tac1402@gmail.com

Disclaimer.  Это анонс, я еще работаю над научной статьей, но пока не могу найти ментора для возможности публикации в arxiv.org. Но пока хочу поделится с вами некоторыми сырыми результатами.

Аннотация. Классический перцептрон Розенблатта с архитектурой S–A–R исторически не имел устойчивого алгоритма обучения многослойных структур. В результате в современном машинном обучении доминирует метод обратного распространения ошибки (backpropagation), основанный на градиентном спуске. Несмотря на успехи, этот подход имеет фундаментальные ограничения: необходимость вычисления производных нелинейных функций и высокая вычислительная сложность. В данной работе показано, что при интерпретации работы нейросети через алгоритм ID3 (Rule Extraction) скрытый слой автоматически формирует чистые окрестности в смысле кластерного анализа — признаки группируются по классам ещё до завершения обучения. На основе этого наблюдения автором предложен новый стохастический алгоритм обучения, восходящий к идеям Розенблатта, но принципиально расширяющий их: он позволяет обучать скрытые слои перцептрона без вычисления градиентов. Таким образом, впервые решается классическая проблема обучения архитектуры S–A–R без градиентных методов. Это открывает путь к созданию принципиально новых алгоритмов обучения нейросетей с более простой и интерпретируемой динамикой.

Читать далее

Адаптивные ИИ-интерфейсы: от персонализации контента к персонализации когнитивных процессов

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров191

Research Vision — приглашение к дискуссии о следующем поколении человеко-машинного взаимодействия

Уверен в том, что Вас когда-нибудь раздражало, что ИИ объясняет "слишком подробно", когда нужен один ёмкий абзац?
Или наоборот: вы ждёте системного обзора, а получаете банальный сниппет кода. Эти ситуации знакомы каждому, кто работает с ИИ. Но проблема не в контенте — проблема в несовпадении мышления (как минимум).

Читать далее

GPT-5 и API Responses: зачем нужен ещё один стандарт?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров561

Команда AI for Devs подготовила перевод статьи о новом API /v1/responses от OpenAI, который объединяет простоту Chat Completions и мощь Assistants, и при этом сохраняет состояние рассуждений, мультимодальность и встроенные инструменты. Это шаг к агентам будущего — и, похоже, к новому стандарту работы с моделями OpenAI.

Читать далее

Как с помощью локальной LLM автоматизировать рутину и облегчить жизнь себе и коллегам

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров9.3K

Привет, на связи Алексей Дубинец, Павел Беспалов и Глеб Гладков — BI-аналитики Авито. В тексте делимся идеями и промптами для использования локальной LLM в своих повседневных задачах, а ещё расскажем, как настроить инхаус модель в LM-Studio. Статья будет полезна аналитикам разных грейдов, которые сталкиваются с задачами, где нужно собрать, классифицировать и систематизировать большие объёмы информации.

Читать далее

Читаем вместе. ИИ в AppSec: могут ли LLM работать с уязвимым кодом

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров344

Привет, Хабр!

На связи Максим Митрофанов, ML-лид команды Application Security в  Positive Technologies. Мы занимаемся прикладными вопросами машинного обучения по направлению безопасной разработки, регулярно изучаем новые технические репорты и доменные статьи, разбором одной из которых я и хотел бы поделиться с вами.

Исследуя подходы к оценке больших языковых моделей в разрезе безопасной разработки, мы наткнулись на статью »LLMs Cannot Reliably Identify and Reason About Security Vulnerabilities (Yet?): A Comprehensive Evaluation, Framework, and Benchmarks», которая посвящена анализу применения LLM в задаче обнаружения уязвимостей в исходном коде. 

Перевод фрагментов статьи, представленных в обзоре, не является дословным. Разбор содержит личные комментарии и размышления, возникшие в процессе чтения, и, на мой взгляд, будет особенно интересен специалистам по информационной безопасности и ML-инженерам, внедряющим ИИ в R&D-процессы компаний.

Читать далее

DeepSeek обучила LLM за 294 тыс. долларов. Как это удалось и чем этот путь отличается от OpenAI

Время на прочтение5 мин
Количество просмотров2.3K

Разработка больших языковых моделей обычно ассоциируется с астрономическими затратами. Но пример китайской компании DeepSeek показывает, что эта логика не всегда работает: их модель R1 была дообучена всего за 294 тыс. долларов США (на базовую версию ушло около 6 млн). Для сравнения, создание ChatGPT обошлось OpenAI в суммы на порядки выше.

Если информация китайских разработчиков верна, создавать LLM смогут не только корпорации уровня OpenAI, но и относительно небольшие компании. Правда, данные от DeepSeek вызывают сомнения у специалистов: не исключено, что часть расходов осталась «за кадром». Сегодня посмотрим, какие методы применяла DeepSeek, чем их стратегия отличается от подхода OpenAI и почему ИИ-сообщество оказалось разделено на оптимистов и скептиков.

Читать далее

Компьютерное зрение + ARKit = AR-навигация внутри зданий

Время на прочтение11 мин
Количество просмотров1.6K

Навигация внутри зданий — задача куда более сложная, чем на улице. GPS либо полностью не работает, либо даёт большую погрешность. Карта и инфостойки помогают, но не решают проблему полностью — они статичны, поэтому не всегда понятно, где посетитель находится прямо сейчас (вплоть до этажа) и в какую сторону он смотрит.

Мы решили сделать навигацию нагляднее — с помощью AR прямо через камеру смартфона. Сейчас технология доступна в столичных торговых центрах «Авиапарк», «Афимолл», «Европейский» и в «Галерее» в Петербурге.

В этой статье расскажем, как мы подошли к задаче с точки зрения компьютерного зрения, какие грабли собрали, как ускоряли локализацию и как боролись с погрешностями ARKit.

Следовать за синей стрелкой...

Что будет, если заставить ИИ-агента работать с тысячами API

Время на прочтение4 мин
Количество просмотров941

Вы когда-нибудь задумывались, как ИИ-агента научить сразу работать с тысячами разных API? В обычной жизни всё просто — приложение вызывает одну-две привычные функции, а тут задача куда масштабнее: собрать из разрозненных инструментов настоящий швейцарский нож, который не теряется в сложных цепочках вызовов и правильно управляет аргументами, даже если сценарии усложняются. Команда ByteDance решила попробовать — «а что если научить ИИ действовать в среде, где инструментов не просто много, а очень много, и всё это в единой логике?» Получился AgentScaler: агент, который тренируется сразу в тысячах мини-миров, учится планировать, исправлять ошибки на ходу и удивительно бодро справляется даже с нестандартными задачами. 

О том, как устроена эта вселенная для ИИ, как там моделируют работу инструментов и почему такой подход кардинально меняет обучение агентов — в новом разборе.

Читать далее

AI-компаньон для профориентации на хакатоне

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров290

Кейс «AI-компаньон для профориентации» — как команда на AI Product Hack 2025 создавала персонализированного бот-ассистента для выбора будущей профессии. Рассказываем, как прошёл хакатон: какой стек использовали разработчики, как архитектура Telegram-бота помогает школьникам, студентам и взрослым найти подходящую специальность и образовательный маршрут, какие трудности ребята прошли на пути к MVP. Интеграция ML-ядра, векторные базы и гибкие диалоги — всё, чтобы сделать выбор профессии проще и прозрачнее.

Читать далее

Нейросеть на службе бизнеса: от отзыва до инсайтов

Время на прочтение6 мин
Количество просмотров594

эпоху цифровизации каждый клиентский отзыв — это больше, чем просто слова. Это ценный актив, содержащий информацию о настроениях, скрытых проблемах и возможностях для роста. Однако, как бизнесу эффективно обрабатывать тысячи таких сообщений? Решение лежит в области искусственного интеллекта. Сегодня мы разберёмся, как нейросеть трансформирует эмоциональный комментарий в структурированные данные, которые можно интегрировать в бизнес-процессы для принятия решений.


От текста к числам: язык, понятный машине


Прежде чем нейросеть сможет «понять» отзыв, его нужно перевести на её язык. Этот процесс называется токенизацией и векторизацией. Люди читают слова, а машины работают с числами.


Наш первый шаг — это предобработка данных. Представьте, что вы очищаете сырой алмаз от лишней породы, чтобы увидеть его истинный блеск. В мире NLP (обработки естественного языка) это означает:


Приведение к нижнему регистру: «Очень» и «очень» — это одно и то же слово для нашей модели.

Удаление «шума»: Местоимения, предлоги, союзы (и, в, на) — так называемые стоп-слова — часто не несут эмоциональной окраски. Их удаление помогает модели сфокусироваться на действительно значимых словах-маркерах.

Удаление пунктуации и спецсимволов: Запятые, восклицательные знаки и смайлики важны для человека, но для базового анализа могут быть избыточными.


После очистки мы преобразуем слова в числовой формат. Один из самых популярных методов — TF-IDF (Term Frequency–Inverse Document Frequency). Этот алгоритм не просто подсчитывает, сколько раз слово встречается в отзыве (TF), но и оценивает его важность (IDF). Слово, которое часто встречается в одном отзыве, но редко в тысячах других (например, «медленная» в негативном комментарии о доставке), получает высокий вес. Это позволяет выделить уникальные и значимые характеристики каждого отзыва.

Читать далее

Ближайшие события

Оптимизация ремонта грузовых вагонов: от мирового опыта к российской практике

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.4K

Привет, Хабр! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В своей статье расскажу, как мы разработали систему оптимизации распределения вагонов на ремонт для одного из крупнейших железнодорожных операторов России Первой грузовой компании (ПГК). Внедрили методологию оценки экономического эффекта через сравнение с «идеальным сценарием». За два с половиной года работы система обработала рекомендации для более чем 50,000 вагонов.

Читать далее

Кейс: разработать квест-мастера на нейронке

Уровень сложностиСредний
Время на прочтение47 мин
Количество просмотров411

Инженерия подсказок, как и все, что связано с нейросетями, для непогруженного человека может показаться чем-то раздутым и незначительным. Нет, ну серьезно. Что трудного попросить ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ сочинить стишок или рассказать популярно что такое "Эпистемологический анархизм". Но на деле все действительно оказывается слишком, слишком, слишком нетривиально. Расскажу на примере пустяковой задачки: "Разработать ИИ-агента квест-мастера, который генерит загадки и отслеживает ее угадываемость".

Доп.цель:
добиться исполнения логики именно на стороне нейросети, используя только ее базовые параметры, используя только бесплатные или самые дешевые модели, с задействованием минимально необходимого бекенда.

Оглавление:
X1. Прототипирование. Достижение задуманного 65%. Отсутствие стабильности.
X2. Теория. Основные принципы предсказуемости.
X3. Прототип 2.0. Применение теории использования примеров и структурирования промта на практике и влияение на результат.
X4. Применение и теории, и практики для стабильного результата.

Читать далее

Как Google оценивает контент: скрытые метрики поискового доверия

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров288

Всем привет! Меня зовут Андрей Попов, я SEO-специалист в AGIMA. В 2025 году работа с поисковыми системами кардинально изменилась: Google и ИИ-ассистенты вроде Алисы, Gemini или Chat GPT всё чаще не просто ищут страницы по ключам, а сами «понимают» смысл контента и выдают пользователю готовый ответ.

И вот что самое интересное: решения о том, какой контент попадает в эту выдачу, принимаются не только по релевантности или ссылкам. Всё чаще Google опирается на скрытые метрики доверия — внутренние сигналы, которые оценивают не просто текст, а репутацию источника, авторитет автора, надежность бренда и даже «пограничность» самой темы.

Для SEO-специалиста это меняет правила игры. Недостаточно просто писать статьи и оптимизировать метатеги — нужно работать с невидимым слоем: формировать доверие, закреплять сущности и регулярно подтверждать экспертность.

Читать далее

No-code разработка: telegram-бот для анализа эмоций без программирования

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.5K

Когда вокруг постоянно говорят про искусственный интеллект, трудно остаться в стороне. Куда ни посмотри — везде нейросети: от фильтров в соцсетях до сложных аналитических систем. Мне как начинающему специалисту эта тема особенно близка — не просто наблюдаю за трендами, а пробую их на практике.

Недавно я решил создать небольшой, но полезный проект — Telegram-бота, который умеет определять эмоциональный окрас сообщений. Не суперсложное приложение, а скорее практика: проверить, как можно быстро собрать рабочее AI-решение, не погружаясь в тонны серверных настроек и не тратя недели на разработку.

До этого я уже сталкивался с задачами по работе с облачными сервисами, но именно этот эксперимент стал для меня наглядным примером, как много сегодня можно сделать «из коробки». Нужно было лишь придумать задачу (в моем случае — анализ эмоций в тексте), выбрать инструменты и собрать все в единый рабочий процесс.

Я остановился на трех основных вещах: Container Apps для развертывания, n8n в роли конструктора логики и Evolution Foundation Models как источник интеллекта. Плюс удобный Artifact Registry, чтобы хранить образы контейнеров.

Дальше началось самое интересное — подготовка среды, развертывание и настройка бота. Ниже расскажу, как именно это происходило.

Узнать подробности

Kandinsky 5.0 Video Lite — лучший open-source генератор видео высокого качества в классе лёгких моделей

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров5.2K

Мы выпускаем Kandinsky 5.0 Video Lite — первую модель новой линейки Kandinsky 5. Модель работает в разрешении 768×512 и, при небольшом размере всего в 2 млрд параметров, демонстрирует качество, превосходящее предыдущие версии Kandinsky и большую часть актуальных открытых state-of-the-art решений.

Ключевой акцент сделан на эффективности: модель компактна, требует меньше ресурсов и генерирует быстрее. Такой результат стал возможен благодаря комплексной работе — от сбора и подготовки данных до предобучения и тонкой настройки. Мы исследовали современные методы оптимизации архитектур и применили собственные наработки для балансировки качества и скорости.

В этом посте мы подробно разберём устройство Kandinsky 5.0 Video Lite и её возможности.

Читать далее

Как мы (не) смогли посчитать вакантность жилья в Москве

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров2.6K

Летом прошлого года я в команде из шести человек поучаствовал в конкурсе «Исследуй город». Мы три месяца пытались оценить вакантность жилья в Москве, заняли предпоследнее место, а потом ещё год пробовали уже вне конкурса, на чистом энтузиазме, улучшить сделанное. Получилось все равно не очень, но отрицательный результат — тоже результат, поэтому делимся им: быть может, кто-то прочитает, вдохновится и сможет нас превзойти.

Читать далее

FuriosaAI NXT RNGD: как корейский стартап бросает вызов NVIDIA в сегменте ИИ-инференса

Время на прочтение3 мин
Количество просмотров610

Корейский стартап FuriosaAI представил сервер NXT RNGD для ИИ-инференса. 4 петафлопса вычислений при потреблении 3 кВт вместо 10+ кВт у GPU-решений. Анализ архитектуры, преимуществ и перспектив альтернативы NVIDIA.

Читать далее
1
23 ...

Вклад авторов