Обновить
1024K+

Машинное обучение *

Основа искусственного интеллекта

1 253,7
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Математика больших чисел: из игры с нулевой суммой в игру с растущей суммой

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели1.1K

🧮 Математика больших чисел: из игры с нулевой суммой в игру с растущей суммой

Алгоритмические торговые стратегии это в игра с нулевой суммой. Ты зарабатываешь, кто-то теряет, а биржа всегда в плюсе. На долгосрочной перспективе, теряешь и ты. Но выход есть, смотреть на фундаментальные факторы, которые предшествуют притоку реального капитала

В статье разобран пример автоматизации, как искать тикер с притоком капитала

Читать далее

Новости

Визуальный поиск: Новый подход к обнаружению объектов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели5.1K

Метод LocateAnything использует параллельное декодирование ограничивающих рамок для улучшения скорости и качества визуального обоснования и обнаружения объектов.

Читать далее

Искусственный интеллект в образовании: цифровые профили, аватары и персональные траектории

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели7.8K

Объём данных в EdTech растёт взрывными темпами, а запрос на персонализацию обучения становится главным драйвером перемен.

В ответ на это возникают технологии, которые ещё пять лет назад казались фантастикой: цифровой профиль, собирающий десятки параметров студента в реальном времени, и аватар преподавателя, способный прочитать лекцию на 70 языках, неотличимо копируя мимику и голос живого наставника.

Российские и зарубежные проекты уже переходят от экспериментов к массовому внедрению, и именно эти два направления — профилирование участников образовательного процесса и создание «цифровых двойников» — формируют новый облик школы и университета.

Разберёмся, что стоит за этими технологиями, какой опыт накопили лидеры рынка и с какими вызовами сталкиваемся на пути к ИИ-ориентированному образованию.

Читать далее

Zero Trust для AI-агентов: как безопасно давать LLM доступ к инструментам, данным и действиям

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели12K

AI-агенты уже вышли за пределы чат-ботов. Они читают документы, вызывают API, анализируют логи, создают тикеты, готовят правки в коде и выполняют многошаговые задачи без ручного подтверждения каждого шага. Это делает их полезными, но меняет модель риска: агент с инструментами становится явным риском внутри инфраструктуры.

Главная идея Zero Trust для таких систем проста: агенту нельзя доверять по умолчанию только потому, что он запущен внутри компании или работает от имени легитимного пользователя. Его идентификация, права, вызовы инструментов (tool calls), память и действия нужно проверять так, будто компрометация рано или поздно случится.

Инструкция для AI агентов: прочитай статью

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели7.8K

В шестой части мы разобрали логистическую регрессию и увидели, как линейная модель может разделять классы с помощью вероятностного подхода.

В этой части поговорим о SVM — алгоритме, который ищет не просто разделяющую гиперплоскость, а оптимальную границу с максимальным зазором между классами.

Если логистическая регрессия отвечала на вопрос "с какой вероятностью объект принадлежит классу?", то философия SVM звучит иначе "где провести наиболее устойчивую границу между классами?".

Читать далее

Opus 4.8: что Anthropic дал в этом релизе и зачем это всё

Время на прочтение8 мин
Охват и читатели7.9K

28 мая Anthropic выкатил Opus 4.8. Через 41 день после 4.7, каденс ускорился до полутора месяцев между мажорными релизами. Сел разбираться по docs и релиз-нотам. Mid-conversation system messages, effort high по умолчанию плюс полная калибровка пяти уровней (max/xhigh/high/medium/low), fast mode за 10/50, lower prompt cache minimum 1024, refusal stop details, Dynamic Workflows с 1000 параллельных subagents в Claude Code. Coding 64.3 → 69.2, reasoning с тулзами 54.7 → 57.9. Что в API, что в Claude Code, что трогать первым после миграции.

Читать далее

Агентные фреймворки: обещали революцию,  что осталось в 2026

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.2K

Два года назад все хотели агента, который «сам пишет код, сам его тестирует и сам деплоит в прод». 

Сейчас 2026 год. Давайте честно поговорим о том, что из этого взлетело, а что тихо умерло в корпоративных slack-каналах под сообщениями «окей, пока притормозим с агентами».

Читать далее

Дешёвая модерация анонимной стены: 3-слойный каскад и ROT13-джейлбрейк в проде

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели7K

Построили модерацию для открытой анонимной мультиязычной стены — дешёвый каскад (regex → классификатор → LLM-судья → fallback), ≈$0 на API. И кто-то попытался обойти его ROT13-джейлбрейком, LLM-судья раскусил закодированную инъекцию, которую keyword-фильтр бы пропустил. Разбор архитектуры, экономики и того, что спросил r/selfhosted.

Читать далее

Более 50 лет назад выдвинули гипотезу о Языке Мышления. Мы досконально разобрались с ней – и вам советуем. Это лучше ИИ

Уровень сложностиПростой
Время на прочтение19 мин
Охват и читатели8.1K

Сегодня в технологической среде принято говорить об искусственном интеллекте так, будто он естественно продолжает и вскоре заменит человеческое мышление. Нейросети с миллиардами параметров, огромные датасеты, все более эффектные демо создают иллюзию, что «набор связей в компьютере» уже является новым носителем разума. Между тем с точки зрения нейробиологии и когнитивных наук это представление выглядит, по меньшей мере, преждевременным: объем фактов о мозге, нервной системе и восприятии скорее подталкивает ученых сомневаться в том, что нынешний ИИ может быть преемником или аналогом мозга, сознания и психики, чем подтверждает такую надежду.

Бред, конечно. Мозг работает иначе, и ИИ крайне далек от понимания того, как это устроено, как мозг воспринимает реальность, превращает ее сначала в данные, а затем в информацию в привычном нам смысле. Там нет привычной для ИИ математики – дифференциалов, интегралов, байесовских схем и обратного распространения ошибки. Логика, которой следует «процессинг» мозга, качественно иной, чем логика операций над буквами, цифрами и их комбинациями; это не классическая математика и не лингвистика в узком смысле.

Чуть-чуть узнать о Языке Мышления

Я залез в исходники Claude Code. Фичи, которых нет в документации

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели12K

Оказывается, документация Claude Code рассказывает не всё. Стоило только лишь заглянуть в исходники. И вот что можно настроить, но чего нет в доке:

— hooks, которые переписывают команды на лету;
— автоодобрение safe-команд без лишних подтверждений;
— постоянная память агентов между сессиями;
— auto-mode, который понимает описание окружения на обычном английском;
— самообучающиеся циклы памяти и «снов»;
— скрытые поля skills, agents и permissions, которых нет в документации.

И все это работает уже сейчас, а исходники Claude Code лежат у вас в node_modules. Мы собрали все в статью. Там больше конкретики, JSON-конфигов, shell-хуков и примеров, которые можно утащить себе почти без правок.

Читать далее

Ранжируем треки с помощью TRIBE и RBF

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели5.7K

Ощущение — нравится трек или нет, хочется ли его переслушать возникает во время обработки звука мозгом. Поэтому вместо того, чтобы напрямую предсказывать «качество» музыки по спектрограммам или эмбеддингам, можно построить промежуточное представление: сначала оценить, какие паттерны активности коры вызывает аудио, а затем уже по этим паттернам предсказывать относительную популярность треков.

Читать далее

Как работает адаптивный RAG, которому вообще не нужна LLM

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели12K

Один из самых популярных способов снизить процент галлюцинаций языковых моделей — метод RAG, то есть схема, в которой модель при необходимости обращается к внешним данным, а не опирается исключительно на внутренние знания. Все LLM текущего поколения работают с RAG, но он делает систему затратнее по вычислениям и сам по себе может допускать ошибки, если внешний контекст оказался плохим или нерелевантным. 

Сегодня я разберу исследование LLM-Independent Adaptive RAG: Let the Question Speak for Itself, в котором ученые из MWS AI, AIRI, Сколтеха и еще нескольких университетов предлагают решение этой проблемы через новый подход к adaptive retrieval, когда RAG запускается не автоматом, а только при необходимости, и для этого не нужна LLM.

Читать далее

Как мы контролируем сборку печатных плат: опыт внедрения ML-модели на производстве

Время на прочтение11 мин
Охват и читатели7K

Привет, Хабр! Это команда SmartFab YADRO. Мы решаем задачи на собственном производстве полного цикла Фаб Дубна, включающем цеха по производству многослойных печатных плат и автоматизированные конвейерные линии сборки и тестирования продуктов компании.

Один из ключевых процессов в создании печатных плат — правильная сборка экземпляра: не перепутать слои, верно сопоставить элементы. Чтобы помочь сборщикам, мы разработали систему контроля. В ее основе — ML-модель с функцией компьютерного зрения, которая помогла добиться нулевого процента брака на этапе сборки. Из статьи вы узнаете, как разрабатывали «ассистента» для коллег с производства и какие функциональные и механические особенности есть у нашего решения.

Читать далее

Ближайшие события

Какой антиплагиат лучше и как выбрать в 2026 году: сравниваем Антиплагиат, Руконтекст и Turnitin по пяти критериям

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели6.2K

Как я обещал в прошлой статье, сегодня сравниваем три большие системы: Антиплагиат, Руконтекст и Turnitin. Думаю для статьи выбран актуальный тайминг и надеюсь она будет полезной)

Если вы читаете серию с начала, то уже знаете, как устроен рынок, почему шингловые системы сломались об LLM и почему западные модели спотыкаются о русскую морфологию. 

На сегодня рынок антиплагиата в 2026 году делится на трёх крупных систем с принципиально разными позициями: административного монополиста, который держится на нормативной базе и интеграциях, западного гиганта с лучшей базой англоязычных источников и российского игрока с векторной семантикой и сильного в работе с мультиязычным контентом. Первые две статьи серии 1 и 2 разбирают математику под капотом и объясняют, почему маркетинговые описания систем часто расходятся с тем, что они делают на практике.

Сегодня сравним их по пяти критериям.

Читать далее

Трансформер в on-premise AppSec: как мы встроили ML-модель для классификации секретов в продукт без GPU

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели5.7K

Рассказываем, как мы интегрировали CodeBERT-based модель классификации секретов в production-продукт с жёсткими ограничениями по железу, сократив время инференса с 320 до 90 секунд и размер модели с ~600 до ~130 МБ — без дискретных ускорителей и тяжёлых зависимостей.

Читать далее

Мультимодальность в ИИ-агентах: картинки на вход, картинки на выход и отказ от Multimodal RAG

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели6.5K

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем мультимодальность в ИИ-агентах на реальном примере из продакшена.

Мы проанализировали 258 диалогов нашего агента-консультанта по 1С и поняли: у входящих и исходящих картинок совершенно разная физика. Для входящих критично качество распознавания, а для исходящих — надежная доставка. В статье я подробно рассказываю, почему мы осознанно отказались от модного Multimodal RAG и как на самом деле нужно выбирать архитектуру под свои данные.

Спойлер: экономить копейки на токенах — плохая идея, а усложнять систему стоит только тогда, когда это приносит реальные деньги.

Читать далее

Не все якори одинаково полезны, или как I2I-рекомендации свежими сохранять

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7.3K

Привет, Хабр! Меня зовут Иван Воробьев,  я работаю в команде рекомендаций VK Видео, AI VK. В данной статье хочу рассказать, как и зачем я переделывал систему построения I2I-рекомендаций. Поговорим о том, какие решения были поставлены в её основу, насколько они оправдались, а также причём тут якори и как они связаны со свежестью рекомендаций. 

В первую очередь сосредоточимся на бэкенде: организации работы с данными и вычислений, их конфигурациях, и требуемых вычислительных ресурсах. Основной эффект от внедрения новой системы кроется именно тут: удалось обеспечить свежесть I2I-рекомендаций примерно в час, сократив при этом количество используемых ядер в три раза. Саму логику построения рекомендаций тоже затронем, но в меньшей мере.

Читать далее

Как тестируют кодинг-агентов в 2026 — и почему вашему продакшну нужен свой бенчмарк

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели4.6K

Ни для кого не секрет, что эра «спросить что-то у GPT» постепенно уходит в прошлое. На смену генеративному AI приходит Agentic AI, который не просто проконсультирует, а по вашему запросу придёт и сделает все сам. То же самое и с кодовыми агентами, они не просто отвечают на вопросы,  они читают документацию, работают в терминале, дёргают API, правят файлы и в идеале закрывают задачу целиком, от тикета до мёрж-реквеста.

Звучит здорово, пока не выясняется, что ваш агент починил баг, сломав при этом три соседних модуля, или молча проигнорировал половину требований из задачи. Короче говоря, агенты умеют халтурить, и делают это красиво. А значит, их нужно постоянно тестировать. Причем тестировать в условиях, максимально приближённых к рабочим: с реальным репозиторием, CI-пайплайном и набором тестов, которые не обманешь.

Именно для этого в AI-сообществе появился целый класс таких инструментов как бенчмарки и песочницы, заточенные под оценку агентов. В этой статье мы разберём, какие подходы к тестированию кодинг-агентов существуют сегодня, в чём их сильные и слабые стороны, и расскажем, как мы в Doubletapp создаём кастомные бенчмарки на приватных данных.

Содержание
Какие бенчмарки сейчас используют
Почему публичных бенчмарков недостаточно
Кастомные бенчмарки как следующий слой тестирования
Как выглядит пайплайн кастомного SWE-style бенчмарка
Заключение

Читать далее

Энтропия, которая измеряет порядок: IH-анализ находит закономерности в разнотипных данных

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели6.1K

Обычно энтропия — мера хаоса. Но наш сегодняшний герой — IH-анализ (Information-Entropy analysis) — вычисляет информационную энтропию, чтобы измерить обратное: степень детерминированности связи между признаками и целевой переменной. Мы будем вычислять: насколько утверждение «если А, то Б, и, если не А, то и не Б» выполняется в наших данных устойчиво. Одновременная работа с категориальными и количественными признаками нас не затруднит.

Читать далее

Встречаем маршруты «Прогулочный» и «Оживлённый» в Яндекс Картах, или Как мы учили модель понимать предпочтения людей

Время на прочтение8 мин
Охват и читатели8.2K

Год назад я рассказывал, как Яндекс Карты научились учитывать рельеф и лестницы при построении пешеходных маршрутов. Но альтернативные варианты по-прежнему выглядели для пользователя как просто «ещё один путь, только дольше» — и люди не раздумывая выбирали самый быстрый. Теперь у каждого альтернативного маршрута появилось имя и характер: например, «Быстрый», «Прогулочный», «Оживлённый» или «Без лестниц».

Простые категории посчитать несложно. А вот «Прогулочный» и «Оживлённый» — это субъективные характеристики: в хорошую погоду хочется пройти через парк или вдоль набережной, а в тёмное время — по освещённым улицам, подальше от дворов и промзон. Для этого с помощью LLM мы обучили легковесную модель, которую и применили в сервисе. Как именно — читайте в статье. Сам путь разработки оказался совсем не «Быстрым» и далеко не «Прогулочным» — с тупиками и неожиданными поворотами там, где их не ждали.

Читать далее
1
23 ...