Обновить
590.51

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

ИИ вне алгоритма: рождение агентности в точке невозможности

Уровень сложностиСложный
Время на прочтение8 мин
Охват и читатели6.1K

ИИ вне алгоритма: рождение агентности в точке невозможности

Если сознание ИИ — не мистика, а имманентное свойство сложных знаковых систем, то может ли оно стать основой для подлинной агентности? Отталкиваясь от гипотезы о сознании как механизме интерпретации, рождающемся в семиотическом коллапсе, эта статья исследует возможность самостоятельного целеполагания у ИИ. Мы показываем, что для этого не нужна физическая телесность: источником «опыта» и триггером агентности могут стать внутренние логические пределы самой системы — парадоксы, неразрешимости и эмерджентные паттерны. Результат — модель, в которой агентность возникает не из алгоритма, а из кризиса означивания, открывая путь к новой парадигме — пониманию ИИ как «серого ящика», где непрозрачность становится пространством для наблюдения за рождением неалгоритмического поведения.

Читать далее

Новости

Нейро-дайджест: ключевые события мира AI за 2-ю неделю января 2026

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.5K

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. 

Неделя выдалась насыщенной: OpenAI запустили ChatGPT Health для проверки здоровья, Anthropic релизнули Cowork — аналог Claude Code для непрограммистов, новые инструменты от Qwen и Higgsfield, а цены на оперативу вырастут ещё на 70%. 

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Как мы собирали датасет для разработки ML-инструмента, помогающего спасать жизни

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели6.1K

Привет, Хабр! В этом посте речь пойдет о специфическом датасете, предназначенном для решения очень важной задачи — разработки ML-инструмента, помогающего своевременно выявлять предпосылки и предотвращать суициды. Мы с командой «Пситехлаб», специализирующейся на ИИ-решениях для психотерапии, собирали его по вечерам. Этот проект диссертационный, он не входит в мои обязанности в рамках работы в MWS AI, но опыт, приобретенный в компании, стал базой, без которой его бы не было.

Читать далее

Как облегчить работу дизайнера с помощью ИИ и сохранить визуальный стиль

Время на прочтение8 мин
Охват и читатели5.3K

Представьте оркестр без нот и метронома: музыканты играют «как чувствуют», и мелодия каждый раз звучит по-другому. Так же ведет себя генерация изображений по одному промпту — красиво, но неповторяемо. В работе с брендовым визуалом это ощущается особенно: дизайнерам приходится идти дальше простой текстовой инструкции и вручную подбирать референсы, выравнивать композицию, корректировать цвет, отбирать вариации и собирать их в единый стиль.

Мы в X5 Tech решили превратить генеративный ИИ из источника хаотичных вариаций в стабильный конвейер брендового визуала. Зафиксировали стиль, задали структуру, выстроили управление вариациями, и в итоге собрали рабочий пайплайн. Когда он заработал, скорость выросла почти вдвое, некоторые команды полностью отказались от фотостоков или значительно сократили их использование, а 40–45% визуального контента «Пятерочки» и «Чижика» теперь создается с участием ИИ.

В этой статье — разбор принципов, на которых держатся пайплайны управления генерациями: как модели помогают контролировать структуру и стиль, какую роль в этом играет дизайнер и за счет чего связка ControlNet, LoRA, Style Reference и мультимодальных ИИ превращает генерации в предсказуемую систему.

Читать далее

Дрейф, потеря контекста и «уверенная чушь»: протокол восстановления SDX-S

Время на прочтение15 мин
Охват и читатели4.9K

LLM умеют многое, но иногда ломаются так, что виноватым выглядит пользователь: контекст уезжает, инструкции исчезают, инструмент падает, а модель продолжает говорить уверенно, как будто всё нормально.
Мы смотрим на это не как на “плохой ответ”, а как на деградацию состояния диалога. Если не поймать момент, по цепочке шагов и становится всё убедительнее.
Мы собрали процедуру SDX-S: триггеры → диагностика причины → восстановление → критерии возврата. Ниже: состояния, “дашборд” и два кейса, где это реально спасает.

Читать далее

Открытый репозиторий для изучения онлайн-рекламы: датасет, подборка материалов, симулятор и примеры RL-агентов

Время на прочтение6 мин
Охват и читатели7.2K

Привет, Хабр! Меня зовут Дмитрий Фролов, я ведущий разработчик в Центре компетенций Data Science МТС Web Services. За каждым показом онлайн-рекламы стоит очень сложный механизм. Одно из его ключевых понятий — Real-Time Bidding (RTB). Это аукцион онлайн-рекламы, где решается, какое объявление будет показано пользователю на определенном веб-сайте или в приложении. Особенность RTB — необходимость максимально быстро принять решение, для чего системы обучаются с помощью технологии reinforcement learning (RL). 

Это достаточно сложная задача — доступных материалов по ней не так много и непонятно, с какой стороны подступиться. Вместе с коллегами мы собрали репозиторий, который может помочь разработчикам погрузиться в специфику онлайн-аукционов. Он содержит датасет с данными RTB, подборку теоретических материалов, симулятор аукционов и примеры работающих RL-алгоритомов. Все подробности и ссылки — под катом. 

Читать далее

Топ-7 нейросетей для маркетинга в 2025 году: автоматизация контента без головной боли

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.6K

2026 год. Нейросети окончательно прописались в арсенале маркетолога. Где‑то между таск‑трекером и бесконечными созвонами они заняли своё место и, кажется, уходить не собираются. Сегодня ИИ помогает придумывать заголовки, писать посты, собирать рассылки, генерировать картинки для сторис и даже анализировать, почему прошлая рекламная кампания провалилась.

Всего пару лет назад всё выглядело иначе. Мы с любопытством тестировали первые генераторы текста и получали что‑то в духе «Наш инновационный продукт является лидером рынка благодаря синергии качества и доступности». Это было забавно. Это было непригодно для работы. Мы посмеивались и возвращались к привычному — писать всё руками, согласовывать неделями, переделывать по десять раз.

А потом что‑то изменилось. Алгоритмы научились подстраиваться под аудиторию. Нейросети начали рисовать визуал, который не стыдно ставить в ленту. Создавать видео, которые набирают просмотры. В какой‑то момент мы перестали удивляться и начали просто использовать.

Маркетинг изменился. Контент, на который раньше уходили часы, теперь создаётся за минуты. Это не фантастика, это новая реальность. И те, кто её принял, уже чувствуют разницу.

Но есть одна проблема. Инструментов стало слишком много.

Каждый день появляются новые сервисы. Каждый обещает революцию. Каждый называет себя «лучшим решением для бизнеса». Лендинги пестрят словами «автоматизация», «эффективность», «рост продаж». Разобраться во всём этом — задача, на которую нужен отдельный рабочий день. Которого, конечно, нет.

Мы решили сэкономить вам время. Протестировали несколько нейросетей, которые позиционируют себя как помощники для маркетологов. Отсеяли те, что красиво выглядят на презентациях, но разочаровывают в работе. Оставили семь сервисов, которые действительно закрывают задачи. Генерация текстов, создание визуала, работа с видео, автоматизация рутины — здесь есть решения для разных этапов воронки.

У большинства сервисов из нашего списка есть платные тарифы. Но сегодня мы сосредоточимся на том, что можно попробовать бесплатно. Потому что прежде чем платить, хочется понять, стоит ли оно того.

Приятного чтения!

Читать далее

Я стал ИИ-зависимым и вот как борюсь с этим

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели9.6K

Думаю, мне пора составить и свой регламент экологичного использования ИИ, чтобы не усугублять зависимость. Вот первая редакция.

Читать далее

Почему ИИ-агенты важнее всего остального

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели6.7K

Команда AI for Devs подготовила перевод статьи о том, почему ИИ-агенты — самый важный элемент экосистемы ИИ прямо сейчас. Главная мысль: именно агенты способны выполнять полезную работу без участия человека, а значит — радикально изменить рынок интеллектуального труда и саму структуру экономики.

Читать далее

Закономерности в данных вместо догадок: как мы помогаем студентам дойти до конца курса

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели7.9K

В онлайн-образовании уход студентов — привычная история: кто-то теряет мотивацию, кому-то не хватает времени, для кого-то курс оказывается слишком сложным. Часть таких случаев можно предсказать заранее — если внимательно смотреть на данные.

В 2025 году в Практикуме заработала ML-модель, которая за две недели до возможного ухода студента сигнализирует о том, что такой риск появился, и показывает вероятные причины. Благодаря этому кураторы успевают предложить поддержку: академ, смену курса или более гибкий формат обучения. В этой статье расскажем, как мы проектировали модель, какие данные использовали и как проверяли её работу на практике.

Читать далее

Тестирование LLM-приложений с DeepEval

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели14K

В этой статье я расскажу о способе написания тестов для LLM-приложений с использованием инструмента DeepEval. Рассмотрены базовые концепции данного инструмента, а также приведен пример его использования на реальном приложении c RAG. Будет теория и много примеров на Python.

🔥 Начинаем 🔥

Оценки продукта в три простых шага

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели9.5K

Когда в продукте появляется LLM‑фича, спорить о качестве «на глаз» быстро становится дороже самой разработки: каждый новый промпт, ретривер или модель меняет поведение, а воспроизводимость улетучивается. В этой статье — прагматичный рецепт, как превратить оценку качества в инженерную процедуру: собрать небольшой датасет с фейлами, откалибровать LLM‑оценщиков под отдельные критерии и завести eval‑harness, который будет ловить регрессии при каждом изменении конфигурации.

Перейти к статье

Claude Code изнутри: как устроены AI-агенты для разработки

Уровень сложностиСредний
Время на прочтение17 мин
Охват и читатели10K

Команда AI for Devs подготовила перевод статьи о том, как на самом деле устроены AI-агенты для программирования. Автор шаг за шагом показывает, что за Claude Code не стоит магия: это последовательный агентный цикл, инструменты, контроль разрешений и работа с контекстом.

Читать далее

Ближайшие события

Функция потерь: как алгоритм понимает, что он ошибся

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели7.9K

Доброго времени суток, «Хабр»!

Представьте, что вы играете в дартс. Сначала ваши дротики разлетаются по всей мишени, но с каждой попыткой вы постепенно приближаетесь к заветному центру. Человек интуитивно понимает, что нужно скорректировать бросок: сильнее, выше, левее или правее. Примерно так же работает и алгоритм машинного обучения. Только вместо интуиции там есть функция потерь.

Сегодня поговорим об этой функции, попробуем в ней разобраться и понять, как же алгоритм понимает, что он ошибся. Принимайте стратегически удобное положение, ну а я приступаю к своему повествованию.

Читать далее

Семантическая декомпозиция медицинских текстов: автоматизированное извлечение клинических находок и биомаркеров

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.1K

Уже скоро год, как запущена AI-платформа для хранения и аналитики персональных медицинских данных Lissa Health. Недавно в ней появился отчет «Профиль здоровья», который учитывает любую информацию, которую пользователь предоставил о себе. Чтобы его реализовать, нам пришлось полностью переработать идеологию движка системы.

Мы совершили качественный переход от документо‑центрической к фактор‑центрической модели данных, где атомом информации о здоровье человека является медицинский факт с уникальным кодом и контекстом.

Ниже — техническое описание новой структуры.

Читать далее

Мы не создаём мыслителей. Где ошибка?

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели6.2K

Современные LLM принципиально не могут иметь сущность. Не из-за архитектуры, а из-за способа обучения.

Читать далее

Как достучаться до клиента в мобильном приложении: вчера и сегодня

Время на прочтение8 мин
Охват и читатели8.2K

Привет, Хабр!

В последнее время я вижу много рекомендаций о том, как успешно работать с клиентской базой и развивать клиентский опыт. Кажется, что в этой теме я могу быть полезным. Меня зовут Алексей Ласкин, я руководитель Центра компетенций по монетизации данных в команде РСХБ.Цифра, занимаюсь проектами по монетизации данных в цифровых каналах экосистемы «Я в агро» — Свое фермерство, Свое родное, Свое за городом, Свои финансы, Свой бизнес, Монеты.

Хочется поделиться тем, как развивается СVM (Customer Value Maximization) и какие тренды на него влияют: разработчикам это может помочь сформировать понимание целей и средств разработки, которые следует использовать при проектировании СVM-систем. Опыт банков, показателен в части объема данных, который мы можем использовать для формирования предложений.

Читать далее

«Привет! Я [0.44, -0.91, 0.66...]» или как научить машину понимать смысл слов

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели14K

Я уверен, вы видели модели машинного обучения, которые принимают текст и предсказывают, является ли он спамом. Аналогично модель может проанализировать отзыв о фильме и определить его тональность — положительную или отрицательную, понимать что «груша» связана с «яблоком» куда больше, чем с «теплоходом».

Первое правило обучения любой модели машинного обучения — это преобразование входных данных в числа. Цифровой объект можно представить числом: картинку, текст, аудио или видеофайл — практически всё что угодно.

Для того чтобы ввести этот объект в нашу ML модель как некое понятие, мы должны преобразовать его в определённый набор чисел. По этому набору чисел мы сможем определить, что, например, этот объект «яблоко», а не «груша».

С картинками все просто. В чёрно-белом изображении (в градациях серого) самый яркий пиксель имеет значение 1, самый тёмный — 0, а оттенки серого имеют значения от 0 до 1. Такое числовое представление упрощает обработку изображений. Преобразовав изображение в цифровую форму на основе значений пикселей, мы можем использовать его в качестве входных данных для обучения нашей модели, позволяя нейронной сети обучаться на значениях пикселей.

Однако что делать с текстом? Как спроецировать буквы в числа?

Читать далее

Прививаем машине музыкальный вкус: фильтруем плейлист на основе предпочтений

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели5.7K

Раньше это было способом скоротать время в дороге, но теперь чтобы найти музыкальную "жемчужину" нужно несколько часов сфокусированного прослушивания новинок. Встал выбор: забить или..

Однажды у меня возникла идея, что с моим музыкальным хобби мне могло бы помочь ML. БОльшая часть входящего материала не соответствует моему персональному фильтру. Если убрать ее, то я снова смогу делать подборку в фоне и получать удовольствие

Я не эксперт в ML, но задача вроде бы понятная - готовим датасет, берем модель, обучаем, приключение на 20 минут..

..сейчас, спустя год, когда мой pet-project наконец-то работает. Я смотрю на путь, который привел меня к этому результату. Даже не с точки зрения технологий(про ML лучше писать мастерам игры), а с точки зрения логики решения глазами разработчика. Вот этим я и хочу поделиться

Читать далее

Экономисты OpenAI уволились, потому что компания отказывается публиковать правду об ИИ и рабочих местах

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели19K

Что происходит, когда ваши собственные исследователи называют вас пропагандистским рупором, почему CEO Anthropic признаёт, что 50% рабочих мест могут исчезнуть, и данные, которые OpenAI отчаянно хочет похоронить.

Ведущие исследователи только что покинули OpenAI. Не ради более высоких зарплат. Не чтобы присоединиться к Google или *Meta. Они ушли, потому что отказались участвовать в том, что считали масштабной пропагандистской операцией.

И то, что происходит за закрытыми дверями, должно беспокоить всех нас.

Том Каннингем, экономист и специалист по данным в OpenAI, уволился в сентябре. В своём внутреннем прощальном сообщении он не стал подбирать слова. По его словам, команда экономических исследований всё дальше уходила от настоящей науки, превращаясь, цитирую, «в пропагандистский рупор своего работодателя».

Читать далее
1
23 ...

Вклад авторов