Обновить
1024K+

Машинное обучение *

Основа искусственного интеллекта

1 337,31
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

От REST к MCP: как LLM меняют принципы проектирования API и архитектуры систем. Часть 1

Уровень сложностиСредний
Время на прочтение1 мин
Охват и читатели910

Привет, Хабр! Говорит Avito Tech. Меня зовут Дмитрий Бондарев, я backend-разработчик, в Авито занимаюсь проектами на стыке разработки и машинного обучения. 

Из каждого утюга поют о том, как ИИ скоро нас всех заменит. Однако в этой статье я хочу зайти в эту тему с более технической стороны и поговорить о существующих методах интеграции и якобы неизбежном использовании ИИ-агентов в бизнесе и повседневных задачах.

Читать далее

Новости

Почему мощных видеокарт недостаточно для ИИ

Время на прочтение10 мин
Охват и читатели1.1K

Привет! Меня зовут Дмитрий Шиченко, я руководитель отдела разработки встроенных систем в Selectel. Сегодня компании активно находят способы применения ИИ, чтобы повышать эффективность бизнес-процессов. Но в погоне за быстрым результатом они часто упускают ключевые детали внедрения, которые в итоге и определяют успех или провал проекта. 

В результате процесс внедрения ИИ в бизнес выглядит для них следующим образом: компания хочет увеличить эффективность за счет ИИ, поэтому покупает сервер с мощными видеокартами, развертывает модель и PyTorch — и думает, что на этом все готово. Однако на практике все сложнее: без тщательной подготовки эффективность от GPU-сервера будет минимальной. Это все равно, что ехать на болиде Формулы-1 по гравию — мощность есть, но результата нет. 

В статье разберем, как построить сбалансированную ИИ-инфраструктуру для инференса и какие принципы мы заложили в собственный AI-сервер Selectel. 

Читать далее

Создание кластер-осведомлённого ИИ-агента с Kubernetes, Argo CD и GitOps

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели2.3K

Команда VK Cloud перевела разбор запуска self-hosted (размещаемого на собственных мощностях), read-only ИИ-агента внутри кластера Kubernetes, где всю цепочку CI/CD обслуживают GitHub Actions и Argo CD Image Updater. Никакие данные не покидают кластер, облачные ИИ-провайдеры не задействованы.

Читать далее

Почему дорогая LLM дороже: экономика инференса, которую видно в твоём 5-часовом лимите

Уровень сложностиСредний
Время на прочтение26 мин
Охват и читатели9K

Каждый из вас, кто работал с Claude или с ChatGPT, смотрел на свои лимиты
Или задавался вопросом «Да как один запрос съел 10% от лимита»

Я потратил неделю на то, чтобы разобраться в том, а что вообще отображают эти лимиты

И на свет появилась третья статья из моей серии «А как вообще работают современные LLM»

После этой статьи ты разберёшься, что скрыто за 5-часовым лимитом Claude и других LLM и как на этом можно экономить. А еще — из каких примитивов состоят лимиты и какая физика вычислений за этим стоит

Ну а если работаешь с моделями по API, то вообще пушка бомба

Осторожно: после прочтения вы не сможете смотреть на полоску лимитов как прежде 🥵

Че там Че там 👀

Окупаемость ИИ: сколько малый бизнес теряет на рутине

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели7.6K

Первая ошибка в разговоре про нейросети – считать только расход. Подписка стоит столько-то, значит, это статья затрат. Но у любой рутины уже есть цена, просто она спрятана в зарплатах, в упущенных заявках и в вечерах, которые вы досиживаете с отчётами вместо семьи.

Посчитайте грубо. Если на ручную обработку заявок, переписку, счета и отчёты у вас и сотрудников уходит полтора часа в день, за месяц это больше тридцати часов. По отраслевым данным малый бизнес теряет на одной только финансовой рутине порядка двадцати четырёх рабочих дней в год – фактически вы работаете тринадцать месяцев, а платите за двенадцать. Это и есть та сумма, против которой считается окупаемость ИИ.

И вот что важно понять сразу: внедрившие нейросети возвращают по отраслевым данным двадцать и больше часов в месяц. Federal Reserve в своём исследовании оценил экономию от генеративного ИИ примерно в два часа рабочего времени в неделю на сотрудника – почти полный рабочий день каждый месяц, который раньше уходил в никуда.

Читать далее

Создаем собственные окружения в Reinforcement Learning

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели8K

Готовые RL‑окружения удобны для старта, но в реальных задачах редко хватает чужих правил и бенчмарков. В статье разбираем, как создать собственную среду для обучения с подкреплением: задать действия и наблюдения, продумать функцию награды и не сломать обучение на базовых ошибках.

Читать далее

Сжатие декодерных эмбеддеров: как ужать 8B до продакшена без потери recall

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели9.7K

Декодерный эмбеддер 7–8B дает качество, но платит за него памятью, latency и деньгами.

Разбираем все оси сжатия - int8, int4, binary + rescoring, PQ, MRL-усечение - на реальных замерах recall@10: где деградация мягкая, а где обрыв. С воспроизводимым кодом и Colab-ноутбуком под Qwen3

Читать далее

Декодирование в LLM как эволюция стратегий

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели7.8K

В этой статье мы проведем технический анализ эволюции стратегий декодирования, рассмотрим их внутреннюю механику и предложим критерии выбора оптимального подхода для различных задач.

Читать далее

Большое обновление Meta-Spider. Ручка неуверенности, сторож и фабрика обвязок, а так же новый модификатор поведения

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели7.6K

Это статья-продолжение про фреймворк Meta-Spider, который был описан здесь.

В этом выпуске мы рассмотрим, насколько мета-внимание бьет (и бьет ли вообще) простой текстовый промт, который приказываем модели изменить поведение, а так же рассмотрим работу новых компонентов, таких как ручка неуверенности, сторож и фабрика обвязок. А так же начнем разбирать новый модификатор поведения, который защищает от дрейфа цели.

Читать далее

Может ли нейросеть заболеть деменцией — и зачем это нейробиологам

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели9.8K

Начну с главного: в отличие от нашего серого вещества, у кремниевой нейросети нет белка, который слипается в бляшки, нет нейрофибриллярных клубков из тау-белка и много чего еще нет. И хотя к концу контекстного окна модель начинает соображать хуже, списать ее сбои на нейросетевой аналог деменции не выйдет, механизм тут совсем другой. Так что ждать, что сеть сама собой, к концу диалога, доберется до чего-то похожего на настоящую болезнь, не приходится.

Читать далее

Достижима ли неинвазивная гармония человека и машины

Уровень сложностиСредний
Время на прочтение19 мин
Охват и читатели7.9K

Когда речь заходит о том, чтобы человек управлял своей бионической конечностью-протезом с помощью мозга, перед инженерами, врачами и пациентами встает сложный выбор. Имплантировать чип, получающий сигналы от мозга, непосредственно в голову пациента или наладить управление конечностью неинвазивно? В каждом из этих способов есть свои плюсы и минусы. При вживлении электродов в зону коры головного мозга, отвечающую за моторику, получается более мощный сигнал. Запись разрядов нейронов происходит напрямую, сигнал четкий, многоканальный. Он встречает меньше помех в виде костных тканей, мимики лица.

А при неинвазивном управлении уходят риски кровотечений, инфекций и отторжения. Устройство можно надеть и снять за минуту. Оно отлично подходит для реабилитации или когда операция противопоказана. Но при таком методе главным критерием становится четкость восприятия бионическим протезом сигнала от мозга. Все дело в шуме. Сигнал проходит через кости черепа и кожу, теряя силу. Датчики улавливают многочисленные помехи (моргание, напряжение мышц шеи). Есть потеря в скорости и точности: протез работает с небольшой задержкой, поэтому трудно выполнить задачу со сложной моторикой, например завязать шнурки.

Но есть хорошие новости для сторонников щадящего метода. Разберемся в них на примере одного из проектов, который усиливает сигнал с помощью интеграции в управляющую систему модуля компьютерного зрения, а также технологии дополненной реальности (AR).

Читать далее

Упс, они сделали это снова? Почему ваш ИИ тупеет ровно перед выходом новой модели

Уровень сложностиПростой
Время на прочтение20 мин
Охват и читатели8K

Доброго времени суток, друзья! Второго июля у меня сломался рабочий день. Сижу, раздаю задачи своему Claude Opus 4.8 - те же самые, что и вчера, и позавчера, и последние несколько недель. Рутина, отработаная до автоматизма: модель их щёлкала без вопросов. А тут - не щёлкает. Забывает, о чём мы говорили два сообщения назад. Лезет не в те файлы. Выдаёт результат, который приходится переделывать по три раза. Я сначала грешил на себя - может, устал, может, промпт кривой написал. Перечитал промпты. Нормальные промпты. Те же, что неделю назад работали.

И тут я вспомнил, какая на дворе неделя.

30 июня Anthropic выпустила Sonnet 5 - новую модель, которая «почти догнала флагманский Opus», стоит в два с половиной раза дешевле и уже назначена моделью по умолчанию для всех. 1 июля из-под правительственной блокировки вернули Fable 5 - самую мощную модель компании, которую сначала дали, потом отобрали, теперь снова дали. Два громких релиза за два дня. И аккурат между ними мой Opus вдруг разучился...

Читать далее

GFusion: как мы обучали диффузионную LLM в GigaChat

Уровень сложностиСложный
Время на прочтение10 мин
Охват и читатели11K

Салют, Хабр!

Хочу поделиться проектом, которым я занимался во время стажировки в команде GigaChat Pretrain. В течение нескольких месяцев мы исследовали диффузионные языковые модели (dLLM) — относительно новое направление в LLM, в котором многие идеи только начинают проверяться на практике.

Главной целью было не тратить огромное количество ресурсов на обучение с нуля, а взять базовую авторегрессионную модель GigaChat3-10B-A1.8B-base и перевести её в диффузионный режим. Так появились наши экспериментальные GFusion-10B-A1.8B-base и GFusion-10B-A1.8B!

Читать далее

Ближайшие события

AI как новая поверхность атаки: реальные инциденты, мошенничество и уязвимости агентной эпохи

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели7.2K

AI-агенты становятся полезными ровно в тот момент, когда получают доступ к данным, инструментам, браузеру, репозиториям, почте и рабочему контексту. Но именно там AI превращается в новую поверхность атаки.

В этой статье я разбираю не абстрактный “AI-хайп”, а реальные кейсы: дипфейк-кражу $25 млн у Arup, открытую ClickHouse-базу DeepSeek, отзыв токенов Hugging Face Spaces, фишинг через легитимные AI-workspace invites, сбой Replit-агента и исследования вроде EchoLeak и BioShocking.

Главный вопрос не в том, “может ли модель взломать компанию”, а в том, какие права мы уже выдали AI-инструментам и что произойдёт, если недоверенный контент станет инструкцией для агента.

Читать далее

От 0 до 10 миллионов ИИ-проверок в месяц: как мы продуктивизировали CV в Пятёрочке за 8 месяцев

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели6.8K

Статья про то, как CV-сервис вырос с MVP до 10 миллионов проверок фото в месяц и не развалился в проде.

🔧 Это не про «у нас классные модели» и не про «просто прикрутили YOLO», а про честную инженерную продуктивизацию. Про то как универсальный классификатор путал фарш с грязью, почему часть анкет всё равно лучше отдавать человеку, зачем отдельно мониторить качество моделей и что приходится чинить, когда реальный мир меняется быстрее обучающей выборки.

Внутри: компьютерное зрение, 26 моделей, 62 проверки, CNN, VLM, Triton, vLLM, Kafka, Human-in-the-loop, мониторинг качества, сезонность, баги под нагрузкой и немного «веган-версии ИИ».

Заходите, читайте и делитесь своим опытом продакшена ML-сервисов ❤️

Читать далее

Бан Claude Fable 5, первый чип от OpenAI, Siri подружилась с Gemini: главные события июня в ИИ

Время на прочтение32 мин
Охват и читатели6.9K

В этом месяце власти США заставили ведущие ИИ-лаборатории знатно понервничать. Fable 5 пришлось экстренно отключать спустя три дня после релиза, а GPT-5.6 и вовсе не дошла до рук простых пользователей. И всё это на фоне выхода OpenAI и Anthropic на IPO. Но, к счастью, у техногигантов есть и другие козыри в рукаве.

OpenAI внезапно занялись производством чипов, Midjourney — медицинским оборудованием, а Apple и Google — переделом рынка персональных ассистентов. Ну и куда без традиционной подборки свежих исследований и инструментов? 

Заваривайте кофе: впереди хроника еще одного безумного месяца в ИИ.

Читать далее

ИИ не захватит мир, но даст вредные советы: обзор кейсов внедрения

Время на прочтение8 мин
Охват и читатели9.6K

Привет! Меня зовут Лев, я системный администратор технической поддержки в Selectel. Мы живем в мире, где достаточно пары запросов в чатах с ИИ, чтобы создать, например, видео с драматическим сюжетом про банан и клубнику. Искусственный интеллект стремительно развивается, и крупные компании активно внедряют его в свои процессы. 

В этой статье я предлагаю рассмотреть несколько практических фейл кейсов использования ИИ в бизнесе.

Читать далее

Полез в исходники vLLM, чтобы понять, почему один символ убивает prompt caching

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели5.4K

В первой части я вывел одно правило и предложил жить по нему: стабильное в начало, изменчивое в хвост, один символ в системном промпте обнуляет весь кэш. Правило рабочее, я сам собираю агента вокруг него. Но жить по закону, которого не понимаешь, неуютно.

vLLM и paged attention я руками не писал, зато исходники открыты, и я полез в них за байтовой причиной. Что физически лежит на GPU в момент попадания в кэш, как движок управляет этой памятью и почему хватает одного символа, чтобы всё посыпалось.

Читать далее

Применение методов детектирования объектов в задаче долгосрочного прогнозирования событий

Уровень сложностиСложный
Время на прочтение19 мин
Охват и читатели6.4K

Привет, Хабр. Мы — Савченко Андрей — директор по науке, и Иван Карпухин — senior researcher в в Sber AI Lab — Центре практического искусственного интеллекта Сбера, расскажем о нашем исследовании, представленном на конференции AAAI 2026.

В сфере искусственного интеллекта за последние десять лет многие самые успешные идеи родились не в какой-то одной предметной области, а на стыке нескольких направлений. Так произошло с трансформерами, которые сначала появились в обработке естественного языка, затем практически полностью изменили компьютерное зрение, а сегодня их используют почти во всех задачах машинного обучения. Похожая ситуация и с долгосрочным прогнозированием последовательностей событий. Неожиданно оказалось, что многие идеи, давно ставшие стандартом в задачах детектирования объектов на изображениях, позволяют принципиально иначе взглянуть на прогнозирование будущих событий.

На первый взгляд эти две области никак не связаны между собой. В одном случае модель ищет автомобили, людей и дорожные знаки на фотографии, а в другом — пытается предсказать будущие покупки клиента банка, последовательность медицинских процедур или активность пользователя в социальной сети. Но если отбросить подробности реализации и посмотреть на задачу более абстрактно, то мы обнаружим сходство. В компьютерном зрении необходимо ответить всего на два вопроса: что находится на изображении и где именно расположен объект. В прогнозировании событий задача выглядит почти так же: какое событие произойдёт и когда именно это случится. Двумерное пространство изображения превращают в одномерную временную ось. Эта аналогия впоследствии позволила перенести целый класс методов из object detection в моделирование последовательностей событий.

Читать далее

Треть новых релизов на Яндекс Музыке – ИИ. Теперь точно

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели16K

Прошло полтора месяца с публикации моей статьи «Я выяснил, что Яндекс Музыка на треть состоит из нейрослопа». Всё это время я продолжал исследовать тему определения ИИ в музыке. Итогом изысканий стал алгоритм, позволяющий определять сгенерированные треки с точностью, близкой к 100%.

Кроме того, я проанализировал релизы в Яндекс Музыке за первое полугодие 2026 года и выяснил, что 37% всех новых релизов имеют признаки ИИ-музыки. А если учитывать только релизы с лайками, то количество нейромузыки достигает 50%.

В этой статье я подробно расскажу, как работает алгоритм детекта ИИ-музыки, почему для него не требуется GPU, а также покажу аналитику по Яндекс Музыке.

Читать далее
1
23 ...