Обновить
1024K+

Машинное обучение *

Основа искусственного интеллекта

1 057,24
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Месяц утечек у Anthropic, деградация Claude Code, двойное покушение на Альтмана: главные события апреля в ИИ

Время на прочтение32 мин
Охват и читатели12K

Апрель в ИИ выглядел как попытка индустрии нажать на кнопку «ускориться еще раз». OpenAI выкатили специализированные модели под биохимию, кибербез, генерацию изображений и агентную работу. Anthropic показали пугающе сильный Claude Mythos и более «приземленный» Opus 4.7. Google, Meta, Microsoft, NVIDIA и DeepSeek синхронно докручивали скорость, контекст и автономность.

Правда, умнеют пока исключительно модели, но не процессы вокруг них. В OpenAI накапливаются управленческие конфликты (дошло уже до вооруженных нападений на Альтмана). Anthropic твердит про безопасность ИИ, но допускает несколько масштабных утечек за месяц. А исследователи тем временем показали, что стопроцентный результат на большинстве бенчмарков можно получить обманом, не решая задачи.

Разбираем главные релизы, исследования и корпоративные драмы месяца. Бонусом — традиционная подборка инструментов для работы.

Читать далее

Как я торговлю автоматизировал

Уровень сложностиСредний
Время на прочтение28 мин
Охват и читатели8.4K

Речь пойдёт о разработке системы алгоритмической торговли с использованием обучения с подкреплением. Пройдём путь от идеи до работающей системы с разумной детализацией. Расскажу про свои ошибки: радовался single-seed успехам, верил Claude Code на слово, считал лучшую модель годной для production, в то время как на самом деле это был верхний квартиль сид-шума. Внутри Mixture-of-Experts по рыночным режимам, shadow-routing на rolling Sharpe, hybrid expert-swap, методология валидации, а также небольшой список всего того, что не сработало. Подойдёт в качестве инструкция для ai-агента, чтобы повторить опыт и понять почему работает.

Читать далее

ИИ для работы с документами: как меняются PDF-редакторы и куда все это движется

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели5K

Привет, Хабр! Меня зовут Алена Ивличева, я менеджер продукта в Content AI. Мы делаем ContentReader PDF — редактор PDF, в который теперь встроен ИИ-ассистент. 

Сегодня я хочу поговорить о том, куда движутся технологии, как искусственный интеллект меняет наше привычное взаимодействие с документами и что все это значит для наших продуктов.

На рынке сейчас огромное количество трендов, но я выделю те, что реально меняют правила игры. 

Читать далее

Как закешировать интеллект: LLM Cache в поиске Яндекс Лавки

Время на прочтение11 мин
Охват и читатели6.8K

Меня зовут Алексей Щекалёв, я работаю в команде машинного обучения Яндекс Лавки. Как думаете, что общего между пакетом молока, айфоном, дрелью и лабубу? Похоже на начало анекдота, но для нас это серьёзный технический вопрос. Ответ на него определяет, найдут ли пользователи то, что ищут, или разочарованно закроют приложение.

Мы столкнулись с этим вопросом в 2025 году, когда наш отлаженный поиск по продуктовому каталогу сломался о новую модель продаж. Тяжёлые модели понимали новые товары, но работали слишком медленно для рантайма, а быстрые не справлялись. Переобучать весь стек на каждый новый ассортимент было бы слишком дорого и долго. Казалось, что компромисс «качество vs скорость» неразрешим, но мы нашли третий путь.

Читать далее

Flow Matching, 276M параметров и моделирование хаоса: как мы научили генеративную модель Marchuk предсказывать погоду

Уровень сложностиСложный
Время на прочтение19 мин
Охват и читатели6.9K

Привет, Хабр! Мы команда «Генеративный ИИ для видео» лаборатории FusionBrain AIRI — группа исследователей в области Generative AI. Наш основной профиль — модели генерации изображений и видео: пиксели, временная когерентность, латентные пространства, трансформеры и diffusion/flow‑подходы.

Мы — не метеорологи. Но совсем недавно мы задались вопросом: можно ли взять SOTA‑идеи из алгоритмов генерации видео и применить их к задаче предсказания глобальной погодной карты, не превращая ML‑модель в усложненный пайплайн на базе специфических метеорологических знаний?

Оказалось, что да, и весьма неплохо. В этой статье мы расскажем про нашу новую модель прогноза погоды на основе алгоритма Flow Matching под названием Marchuk, которая выгодно выделяется на фоне конкурентных подходов своей компактностью и производительностью. Она даже смогла предсказать морозы в январе 2026 года!

Читать далее

Список слов русского языка из Wiktionary и сравнение с pymorphy3 на примере Пушкина и Noize MC *

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели8.8K

В задачах обработки естественного языка (NLP) часто требуется список слов русского языка. Такой список может использоваться как базовый фильтр для выявления неизвестных и потенциально некорректных слов.

Одним из распространённых инструментов для работы с русским текстом является библиотека pymorphy (pymorphy2 / pymorphy3), основанная на корпусе русского языка OpenCorpora. Она предназначена для морфологического анализа текстов и, в том числе, позволяет проверять, известно ли слово встроенному словарю библиотеки.

Однако словарь pymorphy ориентирован на нормативную лексику и морфологию. В нём отсутствует значительная часть имён собственных, топонимов, заимствований, разговорной и современной лексики. Поэтому при использовании pymorphy для фильтрации текста возникают ложные срабатывания, много редких и нестандартных слов определяются как неизвестные (что мы увидим ниже в разделе сравнения словарей).

Для повышения полноты выявления неизвестных слов я решил собрать свой максимально широкий список слов русского языка для задач NLP.

Такой список слов можно получить на основе данных сайта Wiktionary (Викисловарь). Wiktionary — это открытый многоязычный словарь, в котором каждая словарная единица представлена в виде отдельной статьи. Викисловарь содержит информацию о словах различных языков, включая русский, а также сведения об их морфологических и синтаксических свойствах.

* Признан минюстом РФ иностранным агентом.

Читать далее

Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели13K

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции.

В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене.

К рискам RAG

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели11K

16 апреля Anthropic выкатила Claude Opus 4.7. На бенчмарках 12 побед из 14, цена та же. Через 24 часа Reddit называл его legendarily bad. И вот в чём фокус: месяц назад я сам ныл, что Claude слишком поддакивает. Anthropic исправила. Получилась спор-машина. Беру свои слова назад.

Читать далее

OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели11K

System Prompt учит модель что говорить, Skills — как проверить сказанное, MCP Tools — как сделать это в реальном мире. Разбираем трёхуровневую архитектуру на примере бота техподдержки с валидацией ссылок.

Читать далее

Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели8.5K

Я предлагаю смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Манифест и whitepaper исследовательского направления.

Уже три года публичный разговор об ИИ крутится вокруг оси способности: насколько умна модель, сколько токенов, сколько бенчмарков. Я предлагаю смотреть на другую ось — устойчивость во времени.

Сегодняшние LLM феноменально способны и онтологически пусты. Каждый разговор начинается с нуля. Каждая сессия заканчивается забвением. Модель, которая помогла вам утром, — не та же модель, что помогает вам вечером, потому что между ними ничего не было.

Я полтора года тихо разрабатываю прототип — кодовое имя Aurora — который пытается это исправить. Не как продукт. Как исследовательский субъект. Этот пост — приглашение к дискуссии.

Читать далее

Хакатон RWB х НИЯУ МИФИ: от идеи к реальным инструментам

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.2K

Привет, Хабр! С вами команда Russtech — разработчики IT-решений ведущего российского оператора рекламы вне дома Russ. 13-14 марта 2026 года компания RWB (Объединенная компания Wildberries & Russ) совместно с Национальным исследовательским ядерным университетом «МИФИ» провела командный хакатон на территории университета. Студенты решали бизнес‑задачи из сферы рекламы вне дома, создавали прототипы цифровых инструментов и представляли свои наработки экспертному жюри. Рассказываем, как это было.

Читать далее

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели7.7K

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего.

Всем привет! Меня зовут Дмитрий Фырнин, я управляющий партнёр и технический директор в SENSE, и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения.

В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления».

А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

Читать далее

От NLU-бота к ИИ-агенту: как мы пробили потолок автоматизации в поддержке крупного банка

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели6.9K

Привет, Хабр! На связи команда Just AI.

Когда NLU-сценарий вырастает до нескольких сотен веток, а процент автоматизации все равно не двигается — это не проблема настройки, это потолок технологии. Рассказываем, как мы помогли крупному банку его пробить: перевели поддержку по кешбэку на LLM-агентов, добавили агента-судью против галлюцинаций и улучшили понимание семантики и контекста пользовательских запросов.

Читать далее

Ближайшие события

Пишем прототип ИИ-агента для EdTech-саппорта без векторных баз и фреймворков: чистый Python, Gemini и JSON

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели7.3K

У любого EdTech продукта есть проблема поддержки студентов. Я и сам столкнулся с ней в мою бытность автором курсов на степик. Студенты сталкиваются с трудностями и пишут в чат / на форум в надежде, что им помогут (особенно, если они заплатили за обучение свои кровные).

Традиционный способ решения данной проблемы - куратор. Это человек, достаточно хорошо разбирающийся в предмете и структуре курса, задача которого отвечать на такие вопросы студентов. К сожалению, такой способ решения обладает радом недостатков, обусловленными человеческим фактором.

Однако, в эпоху развития технологий искусственного интеллекта появился новый способ решения проблемы поддержки студентов. Прототип такого решения я недавно собрал и хочу вам об этом рассказать.

Читать далее

Кто автор романа «Двенадцать стульев» с точки зрения математики

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.3K

Существуют различные мнения по поводу того, кому принадлежит авторство "Двенадцать стульев". Эти обсуждения начались сразу же по выходу романа в печать. Два неизвестных до этого автора, с их слов, совместно написали произведение, которое сразу же завоевало огромную популярность, было переведено на множество языков, экранизировано, постановки в театрах. На авторов свалился успех и слава.

Как нам подают эту историю - Валентин Катаев нанял для написания литературного произведения литературных негров - своего младшего брата и друга, оформил с ними официальный договор и поставил задачу написать роман с обрисованными им персонажами и сюжетом. Литературные негры справились настолько успешно, что дальше Катаев Валентин отказался от договора и получил от романа только одну строчку "Посвящается Валентину Петровичу Катаеву".

Есть литературные разборы по авторству, их немало, с противоположными выводами. Есть разборы с затрагиванием более широкого круга доказательств - черновики, биографы, мемуары современников выхода романа, литературных архивов - тоже выводы довольно сильно разнятся. Почему исследования могут приводить к различным итогам? - и мемуары и оставшиеся доказательства немного отличаются, а главное добавляется элемент конспирологии.

В чём заключается конспирология - только - только образовалась другая страна, с другими границами, с другой властью. Гражданская война на тот момент не везде закончилась, политическая верхушка страны пыталась вывести страну из изоляции всеми способами - создавался привлекательный образ для страны как извне так и изнутри. Силовые ведомства контролировали искусство путём жёсткой цензуры, созданием как препятствий в работе, так и создавали условия благоприятствующие карьере. Силовые ведомства могли переписать историю, это было им под силу.

Читать далее

Как цифровой клон покупателя помогает ретейлу делать умные офферы

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.8K

Привет, Хабр! Меня зовут Катя, я продакт-менеджер в Lenta Tech («Группа Лента»). Сегодня хочу рассказать о том, как цифровой клон покупателя помогает сделать персональные офферы с конверсией в лиды.

В статье расскажу о новом витке развития персонализации с использованием больших языковых моделей, а именно — как можно построить «цифровой клон» клиента на основе его чеков и поведенческих данных и использовать его для создания узконаправленных офферов. Разберем архитектуру решения, проблемы, с которыми мы столкнулись, и результаты, которые принесли рост продаж и охватов среди нашей аудитории.

Читать далее

Почему не всегда Pandas — лучший выбор (и когда стоит попробовать Polars)

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели6.8K

Привет, Хабр! Меня зовут Данила Ляпин, я Senior Data Scientist в Яндексе и автор курса «Специалист по Data Science» в Яндекс Практикуме.

В современном мире анализа данных пользу библиотеки Pandas трудно переоценить — она используется везде экспертами любого уровня: от стажёров до техлидов, а последние годы это де-факто стандарт в аналитике.

У Pandas есть огромная экосистема с большой базой знаний и интеграциями в различные библиотеки (тут и встроенная визуализация от matplotlib, и переход к данным в numpy формате, и много чего ещё). Практически каждый разведывательный анализ данных начинается с таких слов, как: read_csv, describe, head, isna().sum(). 

Но объём данных растёт ежегодно, память дорожает, а пайплайны усложняются. Чтобы загрузить локально большой датасет и обработать его, приходится не один раз словить "kernel crashed". И вот на этом моменте самое время поговорить про Polars, потому что там с этим как раз всё в порядке (и не только с этим :-)

Читать далее

8 из 10 людей пишут промпты неправильно. Гайд от учёных, чтобы выжить в 2026 году

Время на прочтение5 мин
Охват и читатели11K

66% руководителей в США заявляют, что не наняли бы кандидата без навыков работы с ИИ, а 71% отдадут предпочтение менее опытному кандидату с навыками ИИ, чем более опытному без них. Такие выводы появились в отчётах Microsoft и LinkedIn ещё в 2024 году.

В то же время «большинство пользователей использует инструмент плохо», заявила OpenAI в исследовании «How people use ChatGPT». А 73% всех запросов сформулированы бытовым языком, который нейросеть понимает буквально и ведёт себя как глупая жестянка.

Мы проанализировали исследования учёных в сфере машинного обучения и составили инструкцию, как писать промпты правильно и легко получать работу, несмотря на конкуренцию с ИИ.

Проверить себя на ошибки

Как мы научили нейросеть экономить газ в нашем сталепрокатном цехе

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели11K

На станах горячего проката металлургического комбината ЕВРАЗ НТМК прокатывают заготовки разных марок стали. В начале цикла их разогревают в печах до температуры, позволяющей придать нужный профиль. Печей несколько, они различаются конструкцией, состоянием, горелками и износом футеровки — это теплоизолирующий материал. Путь заготовки до первой клети стана тоже разный. Ещё на процесс влияют особенности серий заготовок, сортамента сталей, температуры перед посадом, текущее состояние агрегатов, время перевалки, плановые и внеплановые остановы.

Раньше операторы регулировали температуру, время нагрева, расход газа вручную, полагаясь на общую инструкцию, свой опыт и состояние печи (износ футеровки, работу горелок). В разных сменах был разный расход газа: где-то тратили меньше, где-то больше. А при смене сортамента (у нас 80+ видов заготовок) перерасход был почти гарантирован из-за затянутых переходных режимов. Мы стали смотреть, есть ли тут потенциал для экономии топлива.

Меня зовут Андрей Зотов, я начальник департамента инноваций ЕВРАЗа. В этой статье расскажу, как решили эту задачу с помощью обученной на наших данных рекомендательной системы с сердцем в виде математической модели. Заходите почитать, как это устроено.

Читать далее

Как я строю рекомендательную модель фильмов: cold start, вектор вкуса и GPT

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели11K

Выбрать фильм на вечер сложно даже для одного человека.
А если фильм нужно выбрать для пары, где вкусы просто разные, задача становится ещё менее предсказуемой.

Обычные подборки, жанровые фильтры и списки “что посмотреть вечером” помогают только до определённого момента.
Они работают как витрина, но плохо работают как персональная рекомендация, потому что почти не учитывают зрительский опыт, индивидуальные предпочтения и то, какие фильмы человек вообще уже видел.

Именно с этой задачи я и подошёл к своему проекту NextFilm: не как к каталогу фильмов, а как к рекомендательной системе.
Основной вопрос звучал так: как выдать полезную рекомендацию новому пользователю, если на старте о нём почти ничего не известно.

По сути, в моём контексте это и есть cold start.
Не абстрактная проблема “мало данных”, а вполне прикладная ситуация: пользователь уже хочет получить рекомендацию, а система пока не знает, что он смотрел, насколько у него большая зрительская база и какие паттерны вкуса у него вообще есть.

Читать далее