Обновить
1024K+

Машинное обучение *

Основа искусственного интеллекта

1 031,96
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

ASI-критерий: технотропный AI

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели346

Предлагается критерий оценки AI-моделей на основе метрики самовосстановления системы из минимального информационного “семени”

Ну и?..

Новости

Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine

Уровень сложностиСредний
Время на прочтение25 мин
Охват и читатели4.2K

Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему embedding-пространство может неожиданно начать отражать будущую ценность пользователей

Читать далее

Кэширование и трекинг. Как YOLO экономит время и нервы

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.7K

Случалось мне работать с CV: запускаешь сорокаминутное видео, YOLO честно находит людей, машины, собак. На двадцатой минуте падает сеть или, что хуже, камера наблюдения выходит из строя. Перезапускаешь. Модель снова смотрит те же кадры, снова инференс, трекинг ID, пошла пахота GPU…

Так продолжаться не может — подключаю кеширование.

Сегодня разбираемся, как совместить YOLO и кэширование Redis с трекингом объектов так, чтобы каждый кадр считался ровно один раз и чтобы информация не терялась. В конце будут готовые сниппеты, которые можно сразу скопировать и запустить.

Читать далее

Тысяча конфликтов и одна LLM: как мы автоматизировали переход на новые версии Chromium

Время на прочтение17 мин
Охват и читатели5.3K

Каждые четыре недели Яндекс Браузер переезжает на новую версию Chromium. Обычный пользователь этого не замечает, но для команды разработки каждый такой переход — это более тысячи конфликтов кода и, как правило, несколько тысяч ошибок компиляции.

В одном обновлении сходятся около 10 000 коммитов апстрима и примерно 1500 наших изменений. В процесс вовлекаются десятки разработчиков, а суммарные трудозатраты команды на один цикл составляют несколько человеко‑месяцев.

Мы хотели сократить объём этой рутинной работы и освободить время команды для развития браузера. Для этого автоматизировали две самые трудоёмкие части процесса: разрешение конфликтов и починку компиляции.

Речь не про сценарий «вставить одну ошибку в чат и получить фикс». Здесь мы имеем дело с регулярным обновлением большого форка: тысячи проблем нужно разбирать пакетно, с учётом контекста апстрима и наших изменений.

В этой статье расскажем, как встроили LLM‑агента в процесс перехода на новые версии Chromium и что из этого получилось.

Читать далее

Чему именно учится word2vec?

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4K

Чему именно учится модель word2vec? Как она это делает? Ответы на эти вопросы мы поищем, анализируя то, как модель изучает представления данных при рассмотрении минималистичной, но достаточно актуальной задачи языкового моделирования. Модель word2vec — это широко известная предшественница современных языковых моделей. Но, несмотря на это, на протяжении долгих лет в распоряжении исследователей не было количественной прогностической теории, описывающей процесс обучения модели. В нашей новой публикации мы, наконец, представили общественности такую теорию. Мы доказали то, что существуют реалистичные, применимые на практике режимы, в которых задача обучения модели сводится к невзвешенной факторизации матриц с использованием метода наименьших квадратов. Мы занимаемся аналитическим моделированием градиентного потока. Представления данных, которые в итоге изучает модель, выводятся с помощью обычного метода главных компонент.

Читать далее

ClearML Agent: обучение модели в Google Colab

Время на прочтение8 мин
Охват и читатели3.9K

ClearML — это целый космос, так что мы продолжаем разбирать его компоненты. В прошлой статье мы рассматривали ClearML Session и настраивали удаленную среду разработки с Jupyter Lab и VSCode. В этот раз поговорим о ClearML Agent и разберем, как с его помощью запустить обучение на удаленном сервере, в частности, Google Colab.

Итак, поехали!

Читать далее

Строим первую линию техподдержки на n8n за 250$ в месяц. Часть 1

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.9K

Привет! Если ты, как и я, держишь инфраструктуру небольшой команды, наверняка знаком с ситуацией: разработчиков становится больше, а DevOps-отдел при этом не растёт. С приходом vibe-coding'а эта диспропорция стала особенно заметной — у нас в студии команда разработки выросла раза в полтора буквально за пару месяцев, потому что каждый продакт-менеджер захотел свой мини-аппликейшен. Параллельно подкинули головной боли участившиеся проблемы с доступностью приложения из ряда регионов.

В результате поток обращений в канал поддержки в Mattermost вырос настолько, что значительная часть рабочего дня инженера стала уходить на их разбор. И самое неприятное — далеко не каждое обращение по итогу оказывалось в зоне ответственности DevOps, но каждое требовало хотя бы поверхностной диагностики, чтобы это понять.

В этой статье расскажу, как мы строили свою линию тех поддержки на n8n.

Читать далее

Рисуем с помощью закона Кулона. Как сделать генеративную модель на основе электростатики

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели4.4K

Привет, Хабр! Меня зовут Александр Колесов, я исследователь группы «Основы генеративного ИИ» AIRI. У себя в команде мы активно исследуем то, как устроена работа генеративных моделей, ищем новые методы, экспериментируем. Недавно мы обратили внимание на то, что те пути, которые проходят представления данных в диффузионных моделях, очень похожи на пучки силовых линий электрического поля. 

Это не только красивая метафора — мы предложили метод Electrostatic Field Matching (EFM), который позволять извлечь из такой аналогии пользу. Статью с подробным описанием мы недавно свозили на ICLR 2026, там все подробности, теоремы и эксперименты. Здесь же хотелось кратко пересказать основную идею и показать её реализацию на простых примерах.

Читать далее

Стартапер-неудачник, конкурент TikTok и 20 бутылок пива: кто сделал Kling. Досье SpeShu.AI

Время на прочтение6 мин
Охват и читатели4.5K

В июне 2024 года вышел видеогенератор, который делал то, что Sora от OpenAI только обещал: видео по 120 секунд в 1080p, без очереди и бесплатно для первых пользователей. Речь о Kling от китайской компании Kuaishou.

Это рубрика досье SpeShu.AI. Здесь мы составляем психологические портреты людей, которые ведут всех нас в будущее искусственного интеллекта и прямо сейчас меняют мир, как в своё время изменили Лейбниц, Эйнштейн и Курчатов.

Читать далее

Шесть техник промптинга, которые работают в 2026 году

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7.1K

Жемал Хамидун · Head of AI Alpina Digital, CPO AlpinaGPT

Корпоративное обучение меняется: сотрудники ждут персонализации, гибкости и практической пользы. Почему digital-форматы, ИИ-инструменты и новые подходы к развитию делают корпоративные библиотеки снова актуальными — и как бизнес использует это для удержания и роста команд.

Читать далее

Перевёл 16 курсов Anthropic Academy на русский и собрал платформу за выходные

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели6.3K

Перевёл 16 курсов Anthropic Academy на русский за неделю. 448 уроков, субтитры, Telegram-авторизация, пейволл и т.п. на shared-хостинге за $2/мес. Рассказываю, как устроен пайплайн и что пошло не так.

Читать далее

Вам не нужен OpenClaw

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели16K

Привет, Хабр! Меня зовут Никита Пастухов — автор FastStream, Principal Engineer и мейнтейнер AG2 (фреймворк для разработки агентов). Я уже 8 лет в разработке, последний год - по уши в агентах.

И я хочу доказать вам, что написать своего агента не сложнее, чем написать CRUD

Почему это вообще нужно доказывать? Потому что есть заметный разрыв между тем, что происходит с AI в мире, и тем, что происходит в среднестатистической российской компании. В мире — в каждой компании подписка на OpenAI, миллиард стартапов с AI-продуктами, агенты глубоко интегрированы в бэкофис. В России — «опасно, хостим свои модели», «непонятно» и чат-боты поддержки. В мире инженеры уже умеют разрабатывать агентов. В России — «что это вообще такое?»

Поэтому давайте разберём устройство агентов на примере OpenClaw — самого хайпового “личного AI-агента” прямо сейчас. Он живёт в вашем мессенджере, разбирает почту, ведёт соцсети, пишет код, деплоит сервисы. Его популярность — свидетельство того, насколько мало люди пока используют агентов в быту. Для тех, кто в теме, OpenClaw не привнёс ничего нового.

Давайте разбираться

AI для PHP-разработчиков. Часть 6: Bag of Words и TF–IDF – как компьютер превращает текст в математику

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели10K

Когда мы говорим, что нейросети "понимают текст", легко забыть: компьютер изначально вообще не понимает слова. Для него текст – это набор чисел, статистики и векторов.

В этой статье разберём Bag of Words и TF–IDF – фундаментальные подходы, с которых начинались NLP, поисковые системы и анализ текста. А заодно реализуем поиск похожих документов на чистом PHP без библиотек.

Читать далее

Ближайшие события

Личный агент за вечер: разведка Claude Managed Agents глазами не‑разработчика

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели10K

Анатомия одного вечера: создал агента для своего дайджеста за $1.70, прошёл через провал Quickstart и нашёл скрытые места Console. Что узнал — и где личное использование AI-агентов сейчас на самом деле.

Читать далее

Как я выращивал цифрового гомункула и стал нейро-панком

Уровень сложностиСредний
Время на прочтение26 мин
Охват и читатели12K

Или сказ о том, как я LLM обучал русской классике, и превращал в чат-бота, а так же случайно его превратил в сумасшедшего философа.

Читать далее

Анимация персонажей в реальном времени с помощью машинного обучения: обзор PFNN, MANN и LMM

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели8.9K

Еще совсем недавно в анимации персонажей за стандарт были приняты такие системы, как, например, анимация на основе ключевых кадров (keyframe) или процедурная анимация, подразумевающая под собой целое семейство совершенно различных подходов — на основе обратной кинематики, ragdoll, или более комплексных разработок (GTA IV — Euphoria). Однако, несмотря на широкое применение, они не лишены существенных недостатков — нереалистичность, дороговизна, ограниченная выразительность, потребность в ручном труде, сложность с выдерживанием единого художественного стиля. Затем пришел motion matching, обеспечивающий совершенно иной уровень качества анимации, но и позволить себе такие системы могут только разработчики проектов ААА уровня. К тому же такая система чрезвычайно требовательна к оперативной памяти ввиду необходимости хранить в ней всю библиотеку анимаций.

Некоторые из перечисленных недостатков естественным образом решаются посредством применения машинного обучения благодаря низкому потреблению памяти, масштабируемости в контексте данных и способности к обобщению. Сегодня можно наблюдать новый сдвиг: все больше задач, связанных с движением, мимикой и поведением персонажей, передаётся моделям машинного обучения. Причина проста — игры, VR/AR‑системы, виртуальные актёры, интерактивные симуляции — требуют не просто красивой анимации, а реалистичного поведения в реальном времени, адаптирующегося к окружению и действиям пользователя, чего традиционные системы не могут обеспечить.

Нейросети способны учиться на больших наборах данных захвата движения, предсказывать движение для следующих кадров, синтезировать переходы между позами, управлять походкой, балансом, реакциями на препятствия и даже мимикой, синхронизированной с голосом. В результате мы получаем анимацию, которая выглядит естественно, но при этом генерируется на лету — без заранее подготовленных клипов. Тем не менее вместе с новыми возможностями приходят и новые вызовы: производительность, стабильность, контроль над результатом, требования к качеству данных и интеграция в существующие пайплайны.

Читать далее

Подсчёт долей фракций руды на конвейере: SAM2 для разметки, YOLO и проблемы с перекрытием

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели7.7K

На производственной площадке стоит камера над лентой конвейера, она снимает поток , а система считает доли трёх цветовых фракций — серо-белой, оранжевой, розовой — и пишет результат в JSON для следующего этапа обработки. Цвет фракции используется как косвенный признак химического состава — технолог по нему оценивает качество партии.

Заказчику нужна всего одна цифра — доля оранжевой фракции. Для предприятия эта фракция самая интересная по составу, остальные классы имеют второстепенное значения. Эту цифру нужно предоставлять в режиме 24/7, без расхождений между сменами.

Камера стоит в закрытом помещении внутри здания. Освещение искусственное, прожектора фиксированные. Естественного света нет, влажность стабильна, поэтому большинство стандартных проблем компьютерного зрения на улице — блики на мокрых камнях, изменение цвета по времени суток, тени от солнца — в нашем случае не возникают и в статье обсуждаться не будут.

Читать далее

Шайтан-коробочка: Как карманная игра из 90-х научилась читать мысли людей

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели11K

90-е были подлинным ренессансом ИИ. И в эту эпоху особенно выделялся один странный алгоритм, который долгое время оставался загадкой для непосвященных. А все потому что он умел делать одну простую вещь: читать чужие мысли.

Читать далее

Как работают системы антиплагиата в 2026 году: шинглы, векторы и ИИ-детекция

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели7.4K

В прошлой статье я обещал, что залезу под капот систем антиплагиата и расскажу, как они работают. Этим сегодня и займёмся.

В предисловии разочарованно скажу одну вещь. Инновации сделали из многих старых систем для вузов дорогостоящий генератор красивых, но бесполезных отчётов. Для этого хватило простого GPT-4o и его аналогов. Старые системы просто не видят нейросетевой текст, не распознают его.

Для этой статьи я проанализировал архитектуру нескольких ключевых систем и поговорил с разработчиком-архитектором, который строил их изнутри.

Читать далее

Ваш копирайтер — динозавр, если он еще вписывает ключи. Добро пожаловать в эру AEO

Время на прочтение6 мин
Охват и читатели8K

Бизнес продолжает вливать бюджеты в тексты для сайтов, хотя они больше не приносят ни одного клиента. В 2026 году поисковики перестали делиться трафиком: теперь умные роботы сами читают статьи и выдают людям готовую выжимку прямо на стартовой странице. Но попасть в эту бесплатную выдачу случайно невозможно. Нейросеть забракует даже самый полезный и дорогой материал, если при его написании нарушен один неочевидный структурный закон.

Этот закон полностью ломает привычные школьные правила написания статей. Машины не понимают красивых вступлений и ищут на странице только «съедобные» куски: прямые ответы в первых строках, жесткие списки и точные цифры. Если не перестроить свои тексты под такой строгий машинный стандарт, ваш сайт превратится в невидимую свалку слов. Робот просто не сможет прочитать вашу статью и молча отдаст всех покупателей конкурентам.

Читать далее
1
23 ...