Машинное обучение *

Основа искусственного интеллекта

1 220,55

Рейтинг

СтатьиПостыНовостиАвторыКомпании

ankro 13 часов назад

Я попробовал считать нейросетевой слой в конечном поле Галуа GF(137): 4x по памяти, ARM NEON и честные ограничения

Средний

6 мин

4.5K

C++ * Машинное обучение * Алгоритмы * Open source * Математика *

Кейс

Из песочницы

Я проверил маленький нейросетевой слой в арифметике GF(137): не через квантизацию готовой float32-модели, а сразу в байтовом конечнополевом представлении. В лучшем замере получилось около 4x по памяти и до 4.86x по времени относительно моей NumPy float32-реализации. Внутри — код нативного ядра, ARM NEON, таблица запусков и честный разбор, где результат не сработал.

Bright_Translate 15 часов назад

Как я установил в свой игровой ПК серверный GPU за £200

Средний

10 мин

9.3K

Блог компании RUVDS.comИскусственный интеллектМашинное обучение * Компьютерное железоВидеокарты

Туториал

Перевод

У меня уже была установлена RTX 4080 с 16 ГБ VRAM. Её вполне достаточно для гейминга, но не для моделей, которые я хотел запускать локально. Так что следующим шагом было либо приобретение дорогущей карточки с большим объёмом памяти, либо поиск другого способа.

И я этот способ нашёл.

Я купил видеокарту для датацентра, у которой даже нет нормального коннектора PCIe, и подключил её к ПК через адаптер. Теперь у меня в системе 32 ГБ VRAM от двух GPU, на которых работает модель с 27 миллиардами параметров, выдавая по 32 токена в секунду. И обошлось мне это всего в £200.

+27

niktomimo 15 часов назад

Самый старый кирпич трансформера наконец переизобрели. DeepSeek взял матрицу из 1967 года

Сложный

5 мин

6.9K

Машинное обучение * Искусственный интеллектNatural Language Processing * Алгоритмы * Математика *

Аналитика

За attention-механизм с 2017 года брались сотни раз: sparse attention, linear attention, MoE, MLA, скользящие окна, что только не. А вот residual connection, остаточная связь, та самая x + F(x) из ResNet 2016 года, простояла почти десять лет нетронутой. Её просто унаследовали из résnet'ов, воткнули в трансформер и забыли.

31 декабря 2025-го DeepSeek выложил на arXiv препринт, где взялся именно за этот кирпич. И что показательно, загрузил его на arXiv лично основатель компании Liang Wenfeng, он же в соавторах. Когда основатель сам публикует статью, это обычно значит, что она ляжет в следующую флагманскую модель. Так и вышло: mHC поехал в DeepSeek V4, который выкатили 24 апреля 2026-го.

Разберём, что они сделали, почему это работает и при чём тут матрица из шестидесятых.

python_leader 18 часов назад

Самосовершенствующийся ИИ: что происходит внутри Anthropic

Простой

20 мин

6.9K

Искусственный интеллектМашинное обучение * Будущее здесьПрограммирование *

Аналитика

Перевод

На протяжении большей части истории ИИ каждый шаг в его разработке делали люди. Но в Anthropic мы всё больше делегируем часть этой работы самим ИИ-системам — и это ускоряет наш прогресс.

Если тенденция продолжится и ресурсов вычислений будет достаточно, она ведёт к системе, способной полностью автономно проектировать и разрабатывать собственного преемника. Это называется рекурсивным самосовершенствованием. Мы ещё не там, и оно не неизбежно. Но оно может наступить раньше, чем большинство институтов успеет подготовиться.

Опираясь на публичные бенчмарки и ранее не публиковавшиеся внутренние данные Anthropic, The Anthropic Institute показывает: ИИ уже ускоряет разработку ИИ-систем. Один из примеров: сегодня инженеры Anthropic в среднем коммитят в 8 раз больше кода в квартал, чем в 2021–2025 годах.

Технические тенденции, описанные в этой статье, говорят о том, что ИИ-системы в ближайшие годы станут значительно мощнее. Последствия огромны. ИИ, способный строить себя сам, — это крупнейшее событие в истории технологий, которое может принести колоссальную пользу в науке, медицине и других областях. Но полноценное рекурсивное самосовершенствование может и усилить риски потери людьми контроля над ИИ-системами. Если системы смогут полностью строить собственных преемников, вопросы их защиты, мониторинга и управления поведением становятся несравнимо важнее.

Sber 21 час назад

Агентная экономика

Простой

9 мин

5.8K

Блог компании СберМашинное обучение * Искусственный интеллект

Кейс

Ежедневная деятельность любого бизнеса сопровождается постоянным заключением договоров. Значительную часть этого потока составляют закупки и поставки. Поскольку закупки занимают существенную долю расходов компании, прозрачность и управляемость этого процесса всегда находятся в фокусе внимания руководства.

Значительная часть закупочной работы — это рутина: найти релевантных поставщиков, разослать однотипные запросы, собрать и сравнить предложения, оформить заказ, проконтролировать оплату и поставку.

Масштаб рутины (то есть задач, которые, используя современные технологии, можно было бы автоматизировать) подтверждают опросы. По данным совместного исследования ITFB Group и hh.ru (более 2 тыс. респондентов), 39% сотрудников считают, что рутина отнимает два рабочих часа из восьми, ещё 37% — до четырёх часов, а 14% — до шести. Самыми рутинными называют задачи, связанные с бюрократией (55%) и отчётностью (36%). Логичное желание сотрудников — передать эту часть работы машине (Коммерсантъ).

Рутина и недостаток автоматизации неизбежно влекут ошибки. Опрос (Gartner) показывает, что треть финансовых специалистов еженедельно несколько раз ошибаются в ходе выполнения рутинных операций. Это удлиняет закупочный цикл и приводит к финансовым потерям для компании.

В связи с этим бизнес возлагает большие надежды на внедрение ИИ‑решений в этой сфере. В докладе «Поставки и закупки» Gartner приводит результаты опроса, согласно которому компании ожидают, что внедрение GenAI в закупочную деятельность увеличит производительность на 21%, рост экономии затрат на 12% и увеличение выручки на 11%.

Lordneo 22 часа назад

Как устроены LLM‑агенты: архитектура, планирование и инструменты

Средний

8 мин

6.8K

Искусственный интеллектМашинное обучение * Natural Language Processing *

Туториал

Если вы хоть раз просили ChatGPT выполнить какую‑то задачу и получали в ответ инструкцию «как это сделать» вместо того чтобы он взял и сделал сам — вы столкнулись с ограничением обычной языковой модели. Она умеет объяснять и советовать, но сама ничего не делает: не лезет в интернет, не запускает код, не сохраняет файлы. Просто отвечает.

LLM‑агент — это другая история. Это система, которая получает задачу и начинает её решать: ищет информацию, пишет и запускает код, вызывает API, сохраняет результаты. Она не просто говорит «вот как это можно сделать» — она берёт и делает.

В этой статье разберём, как такие системы устроены изнутри: из каких компонентов состоят, как принимают решения, какие инструменты используют и где обычно ломаются.

Imperius14 вчера в 00:30

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

Простой

30 мин

22K

Машинное обучение * Искусственный интеллект

Кейс

Всем доброго времени суток. Здесь будет описана история происхождения архитектуры мета-трансформеров, которая описана вот здесь.

Как я в августе 2025 года, скучая на выходных, дал двум ChatGPT-4o свободно общаться между собой, как из этого родился крайне сырой концепт "рефлексивного ядра", и как значительно позднее, в феврале-марте 2026 это косвеннным образом привело к открытию крайне интересной находки, которую я назвал механизмом мета-внимания.

Запустить Цикл 02

+44

ArthurEx 4 июн в 21:53

Человек, который занимался нейросетевой математикой в Красноярске — и которого цитируют до сих пор

4 мин

20K

Искусственный интеллектИстория ITНаучно-популярноеМашинное обучение *

Да, есть определенная хронология у развития нейросетей. Знаковые, скажем так, места. Стэнфорд, Торонто, DeepMind. Хинтон, ЛеКун, Бенжио. И много еще дат с разнообразными событиями. А вот в Красноярске в 1996-м вышла книга "Нейронные сети на персональном компьютере". Её автора звали Александр Горбань.

Привет, дорогой Хабр. Давайте сегодня все вместе вспомним этого выдающегося человека.

+53

Enorth 4 июн в 19:30

Как конечные автоматы помогают сделать агента надежнее и при чем тут pydantic-graph?

Средний

6 мин

12K

Python * Open source * Искусственный интеллектМашинное обучение *

Кейс

Когда пишешь библиотеку, рано или поздно упираешься в движок. Не в красивый внешний интерфейс и не в обёртки, а в ту часть внутри, которая гоняет процесс по состояниям: что-то сгенерировал, проверил, решил, что делать дальше, повторил. Пара флагов, цикл while, большой if посередине, и через месяц вы уже сами не помните, какие переходы там вообще возможны и почему одна из веток недостижима.

Недавно я собирал ровно такой движок и наткнулся на библиотеку, которая делает эту работу заметно аккуратнее. Называется pydantic-graph. Про неё почти не пишут, хотя на ней стоит весь pydantic-ai, агентский фреймворк от авторов Pydantic. Дальше я расскажу про неё на конкретном примере, харнессе надёжности для слабых языковых моделей.

Сразу оговорюсь про термин, потому что он сейчас на слуху. Харнесс это не только MCP, скиллы и память. Это ещё и робастность, в том числе у совсем небольших моделей. Вот эту вторую часть я и беру за пример. Но статья не столько про модели, сколько про сам подход. Основная мысль простая: это удобный способ собрать движок для чего угодно, где есть состояния и переходы, и при этом не утонуть в собственном цикле.

Andrey_Biryukov 4 июн в 18:50

Pipeline в машинном обучении: как создавать сложные модели без боли и утечек данных

Средний

8 мин

11K

Блог компании OTUSМашинное обучение * Python *

Туториал

В ML‑проектах проблемы часто начинаются не с выбора алгоритма, а с предобработки: один трансформер забыли применить к тестовой выборке, другой обучили до кросс‑валидации, третий сломался при передаче проекта коллеге.

В статье разберём, как Pipeline в sklearn помогает собрать обработку данных и модель в единый воспроизводимый конвейер, снизить риск data leakage и упростить работу со сложными ML‑сценариями.

Читать гайд

Artem7898 4 июн в 18:27

FlakyDetector 2.0: Один комментарий, который перевернул моё представление о нестабильных тестах

Средний

4 мин

10K

Тестирование IT-систем * Python * Машинное обучение * Качество кода *

Recovery Mode

Полгода назад я написал статью про FlakyDetector — инструмент, который ищет нестабильные тесты по одному лишь исходному коду, Потом была статья FlakyDetector 2.0 . AST + CatBoost, 37 признаков, вроде бы всё круто.

Но один комментарий меня добил.

Пользователь Ariless рассказал реальный кейс: в их проекте тест падал с SLOT_OVERLAP — не потому, что в коде теста было что-то плохое, а потому что фикстура была общая на несколько тестов (shared scope). Предыдущий тест не успел почистить слот — следующий упал.

irbix7 4 июн в 16:45

Одна строка — много объектов: как агрегировать эмбеддинги для ML-моделей

Средний

10 мин

9.5K

Машинное обучение * Искусственный интеллект

Туториал

Из песочницы

Иногда одна строка датасета соответствует не одному объекту, а целому набору связанных объектов: новостям, комментариям, изображениям или событиям. Каждый из них можно превратить в эмбеддинг, но модель обычно ждет фиксированный набор признаков. В статье разбираю, как с этим работать на практике: от простых агрегатов и pooling до MIL, LLM‑разметки и гибридных подходов.

maximslav 4 июн в 14:04

Линейная регрессия на стероидах: Double Machine Learning для устранения смещений в данных

Средний

18 мин

8.9K

Big Data * Машинное обучение * Python * Статистика в ITАналитика мобильных приложений *

Туториал

Из песочницы

Любой аналитик знает, что самым надёжным способом проверки гипотез являются рандомизированные контролируемые эксперименты (RCT), или, как их называют в народе — A/B-тесты. На практике часто возникают ситуации, когда провести A/B-тест невозможно — в основном это происходит по этическим или техническим причинам. Однако бывают кейсы, когда рандомизация невозможна потому, что treatment-ом является определённое действие пользователя. Например, treatment-ом может быть оформление платной подписки или отмена бронирования на сервисе. Давайте назовём такой вид воздействия добровольным.

В русскоязычном пространстве, и в частности на Хабре, достаточно много статей, посвящённых таким методам Causal Inference, как DiD, PSM и Causal Impact. Тем не менее, к моему удивлению, практически нет статей, посвящённых методам на основе ортогонализации и regression adjustment, хотя, на мой взгляд, именно эти методы являются самыми удобными для оценки эффекта от добровольного treatment-а. Пришло время исправить это недоразумение и разобрать метод Double/Debiased Machine Learning (DML) и Partial Linear Regression для задач Causal Inference!

+12

pavelputintsev 4 июн в 12:06

Альпина GPT: 9 000 пользователей, −1 977 часов и главный барьер корпоративного ИИ

Средний

10 мин

8.5K

Блог компании Alpina DigitalИнформационная безопасность * Машинное обучение * Облачные сервисы * Управление продуктом *

Кейс

Архитектура агрегатора из 42 моделей, разбор воронки первого касания и измеренная экономия часов на маркетинге книгоиздания.

Павел Путинцев, продакт-менеджер Альпина GPT (Alpina Digital), ex-куратор курса “ИИ в действии: как эффективно решать бизнес-задачи с помощью нейросетей. Физфак МГУ + KAUST (магистратура по компьютерным наукам). Канал в Telegram: «Дело в промпте» .

pavelzotikov 4 июн в 11:01

Системный промпт или галлюцинация: как я проверял AI-ассистентов и что ответили bug bounty-команды

Средний

10 мин

8.8K

Искусственный интеллектИнформационная безопасность * Bug hunters * Natural Language Processing * Машинное обучение *

Кейс

В марте я проверял, можно ли уговорить AI-ассистентов выдать что-то похожее на системный промпт. Ответы выглядели убедительно: внутренние правила, технические “дампы”, отчёты, почти готовые кейсы для bug bounty. Но ответы команд безопасности приземлили эксперимент: часть результатов оказалась галлюцинациями, часть — обходами ограничений, а не подтверждёнными уязвимостями.

Читать разбор

ai-talent 4 июн в 10:07

Агент против агента: опыт участия в агентских соревнованиях BitGN PAC1 и AgentBeats

Средний

8 мин

6.4K

Искусственный интеллектМашинное обучение * Карьера в IT-индустрии

Мнение

Меня зовут Егор Спирин, я руковожу лабораторией прикладных агентов (ЛаПА) в магистратуре AI Talent Hub при ИТМО. Мне всегда были интересны соревнования в IT — сначала ICPC, где важны алгоритмы и скорость, потом Kaggle, где всё сводится к одной метрике на фиксированном датасете. В обоих случаях понятно, что именно оценивается и как улучшить результат. Агентные соревнования устроены иначе: здесь оценивается не ответ, а поведение системы в процессе. Это ставит новый вопрос — как вообще провести такое соревнование?

В этой статье расскажу о сути агентских соревнований, чем они отличаются от классических, и об опыте участия в BitGN PAC1 и AgentBeats.

IAlexOps 4 июн в 08:00

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Средний

17 мин

12K

Блог компании SelectelИскусственный интеллектМашинное обучение * Тестирование IT-систем * Open source *

Обзор

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству параметров: 7B, 8B, 32B. Она же создает иллюзию, что модели одной весовой категории обладают сопоставимыми аналитическими, генеративными и логическими характеристиками, что в корне противоречит современным эмпирическим наблюдениям.

Но действительно ли «вес» модели все еще определяет ее качество в 2026 году? Или компактная архитектура способна конкурировать с гигантами, требующими H100 и сотни гигабайт VRAM? В этой статье мы не будем рассуждать об этом абстрактно: возьмем реальные модели из каталога FMC и посмотрим на практике, как размер влияет на качество reasoning, генерации и прикладную эффективность — и влияет ли вообще.

+38

snakers4 4 июн в 07:58

Наш синтез для экранных читалок (SAPI5) для 20 языков России стал лучше

Простой

3 мин

6.6K

Машинное обучение * Open source * Natural Language Processing * Голосовые интерфейсы * Искусственный интеллект

Обзор

Мы не так давно опубликовали SAPI5-обёртку для нашего синтеза на 20 языков России и СНГ. В этот раз опять немного сошлись звёзды и мы уже публикуем улучшение наших читалок. Чтобы не растекаться мыслью по древу и не повторяться, вот краткий список улучшений (полную подводку можно прочитать в прошлой статье):

Покажите список улучшений

+13

vsevolod-nv 4 июн в 07:05

Как шахматный подход помог разобраться с фотолентой Яндекс Диска

Средний

9 мин

8.2K

Блог компании ЯндексМашинное обучение * Алгоритмы * Визуализация данных * Обработка изображений *

Кейс

Когда вы загружаете фотографии на Яндекс Диск, они не просто лежат в облаке: ML‑модели анализируют снимки, группируют их в альбомы и выбирают хайлайты для фотоленты в Яндекс Диске. Но чтобы улучшать такую систему, нужно уметь измерять качество её работы. И здесь начинается проблема: модель выбирает «красивые» и «удачные» кадры, а эстетика — вещь субъективная. Одному важны насыщенные цвета, другому — композиция, третьему — эмоции и лица в кадре. Если попросить асессоров ставить оценки от 1 до 10, мы быстро получим не объективную шкалу, а смесь личных вкусов, разной строгости и шума.

Поэтому мы подошли к задаче не как к обычной разметке, а как к исследованию. Вместо абсолютных оценок использовали шахматный подход. Каждая фотография стала «игроком», который соревнуется с другими по 16 признакам эстетики — цветам, фокусу, геометрии, эмоциональности и другим параметрам. Это позволило получить не просто рейтинг кадров, а инструмент для анализа того, какие визуальные признаки учитывают ML‑модели Диска.

Всем привет! Я Всеволод Мещеряков из службы разметки Yandex Crowd Solutions. Мы собираем и размечаем фото, видео, тексты — в общем, готовим данные, на которых учатся ML‑модели. В этой статье расскажу, как подход из мира шахмат помог нам связать субъективное восприятие фотографий с математическими оценками и сделать фотоленту Яндекс Диска ещё красивее.

+21

lovets18 4 июн в 06:40

Как и зачем мы сделали собственный OCR-бенчмарк

Средний

10 мин

6.2K

Блог компании Cloud.ruNatural Language Processing * Облачные сервисы * Машинное обучение * Искусственный интеллект

Кейс

Однажды нам понадобилось выбрать OCR-модель для RAG-пайплайна. Казалось бы, задача простая: смотришь на лидерборды, берешь лучшую, PROFIT. Но быстро выяснилось, что, во-первых, то, что прекрасно срабатывает на каких-нибудь английских юридических документах, может не потянуть такие штуки как научные формулы, паспортные данные и таблицы на русском языке. А во-вторых, даже если крутой по всем параметрам бенчмарк для оценки качества распознавания говорит, «всё прочитали правильно, я проверил», точность ответов пользователю, который совершает запрос к чат-боту с RAG под капотом, может страдать.

Почему так происходит, зачем мы потратили время на сборку собственного OCR-бенчмарка и пожалели ли мы об этом, рассказываю дальше.

2 3 ...

552 553