Все потоки
Поиск
Написать публикацию
Обновить
836.64

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Союз медицины и искусственного интеллекта: разбираем преимущества и риски

Время на прочтение5 мин
Количество просмотров1.5K

Искусственный интеллект уже стал частью медицины: он видит то, что ускользает от человеческого глаза, анализирует огромные объемы данных, помогает врачам ставить диагнозы и спасать больше жизней. Но пользоваться технологиями важно с умом, иначе они могут нанести вред — например, ИИ может не дополнять профессионализм врачей, а подменять их опыт.

Давайте обсудим, как алгоритмы помогают медицине становиться точнее и доступнее и что важно для сохранения мастерства специалистов в эпоху машинной поддержки.

Читать далее

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением

Время на прочтение31 мин
Количество просмотров683

Большие языковые модели (LLM) всё чаще адаптируются к downstream-задачам с помощью методов RL, таких как Group Relative Policy Optimization (GRPO), которые нередко требуют тысячи прогонов для освоения новых задач. Мы утверждаем, что интерпретируемая природа языка может предоставлять LLM куда более богатую обучающую среду по сравнению с policy gradient’ами, основанными на разреженных скалярных наградах.

Чтобы проверить эту гипотезу, мы представляем GEPA (Genetic-Pareto) — оптимизатор промптов, который системно использует natural language reflection для извлечения высокоуровневых правил из trial-and-error процесса. Для любой AI-системы, содержащей один или несколько промптов LLM, GEPA сэмплирует траектории на уровне системы (например, рассуждения, вызовы инструментов и их выводы) и анализирует их на естественном языке, чтобы диагностировать проблемы, предлагать и тестировать обновления промптов, а также объединять комплементарные инсайты с границы Парето собственных попыток.

Благодаря такому дизайну GEPA нередко превращает даже несколько прогонов в существенный прирост качества. На четырёх задачах GEPA в среднем превосходит GRPO на 10% и до 20% максимум, при этом используя до 35× меньше прогонов. GEPA также опережает ведущий оптимизатор промптов MIPROv2 более чем на 10% на двух LLM и демонстрирует обнадёживающие результаты как стратегия поиска на этапе инференса для задач оптимизации кода.

Читать далее

Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO

Время на прочтение11 мин
Количество просмотров7K

Привет, Хабр. Меня зовут Дмитрий Крюков, я инженер по разработке ПО искусственного интеллекта в YADRO. Мы продолжаем рассказывать о возможностях GPU-серверов YADRO G4208P и YADRO VEGMAN R220 G2 в работе с локальными (on-premise) LLM-моделями. Сегодня делимся результатами тестирования популярных LLM из семейства DeepSeek R1 и Qwen3 размерами от 14B до 685B параметров. Тесты проводились в условиях, максимально близких к решению реальных кейсов: чат-бот, саммаризация и автоматизация аналитических задач. 

Узнать результаты

Как ИИ начинает понимать чёрный юмор

Время на прочтение4 мин
Количество просмотров657

Уловить тонкую грань между остроумной шуткой и чем-то оскорбительным — часто задача не из простых даже для человека. В мемах всё ещё сложнее: идея прячется на стыке картинки, подписи и культурного бэкграунда. Как объяснить искусственному интеллекту, что вызывает улыбку, а что — горький смех? Оказывается, учить нейросети разбирать чёрный юмор — занятие не только любопытное, но и полезное для понимания того, как машины читают человеческие смыслы между строк. Исследователи решили подойти к теме с новой стороны: они собрали датасет мемов, где шутки далеко не всегда безобидные, и научили ИИ не просто распознавать юмор, но ещё и объяснять, из-за чего тот становится чёрным. Разбираемся, как у них это получилось.

Читать далее

Архитектура LPU и будущее AI без задержек

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.8K

Команда AI for Devs подготовила перевод статьи о том, как Groq пытается устранить главное «бутылочное горлышко» современного ИИ — задержку. Их специализированный процессор LPU обещает скорость в реальном времени и открывает путь к новым приложениям: от финансовых систем до Coding AI-ботов. Но за пределами маркетинга остаются вопросы: что с большими контекстами, какова конкуренция с Cerebras и GPU, и выдержит ли бизнес-модель такие вызовы?

Читать далее

Нейро-дайджест: ключевые события мира AI за 2 неделю сентября 2025

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.6K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась интересной:: Qwen показали модель MAX на 1 трлн параметров, Anthropic собрали рекордные инвестиции, а в ChatGPT проекты стали бесплатными. На рынке появились новые агенты, звуковые модели и сервисы для создания приложений. Warner Bros. пошли в суд с Midjourney, а британские врачи тестируют стетоскоп с ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

Современные генеративные модели и приложения на их основе

Время на прочтение7 мин
Количество просмотров2K

Привет, Хабр! Меня зовут Айбек Аланов. Я руковожу группой Controllable Generative AI в FusionBrain Lab Института AIRI и Центром глубинного обучения на байесовских методах в Институте искусственного интеллекта и цифровых наук НИУ ВШЭ и занимаюсь GenAI: работаю с cutting-edge-моделями и помогаю им стать частью прикладных решений.

В последние годы это одно из самых горячих направлений в машинном обучении. Нейросети не просто понимают данные, но и создают что-то новое: от картинок и видео до сложных 3D-объектов или дизайна молекул.

В этом материале по мотивам моего доклада с True Tech Day я расскажу, что происходит в этой области прямо сейчас. Какие архитектуры используются? На что способны современные модели? И самое главное, как все это применить в реальных задачах.

Читать далее

Опыт вайбкодинга: как заставить нейросеть работать эффективно

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров8K

Данная статья написана и отредактирована мной вручную, специально, чтобы подчеркнуть ценность ручного труда в эпоху нейросетей.

Сегодня, в начале XXI века, искусственный интеллект уже стал частью нашей повседневности. Мы спокойно спрашиваем у Алисы прогноз погоды, видим тексты и советы от ИИ в поиске, а изображения или даже видеоролики, созданные нейросетью, никого не удивляют.

Параллельно все чаще обсуждают, что крупные языковые модели (LLM), умеющие писать код, якобы скоро заменят программистов и будут сами решать их задачи. По моему опыту — до этого еще далеко. Но при этом нейросети постепенно превращаются в удобный и полезный инструмент для разработчиков.

Ниже я расскажу про собственный опыт работы с такими технологиями, который мы ежедневно применяем в реальных проектах ★5УГЛОВ для наших клиентов.

Читать далее

Внедрение ИИ в бизнесе. Что внедрять, как внедрять и, главное, — зачем

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров1.3K

Короткий гуглинг по теме показывает, что все рекомендации по внедрению ИИ в бизнесе сводятся к общим фразам. «Выделите одно приоритетное направление», «найдите рутинные операции», «проанализируйте доступные данные». Спасибо, кэп. А делать-то что?

Читать далее

Случайный ИИ успех: Как мы встроили нейросеть в приложение для автосервисов и сорвали куш с подписками

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.7K

Привет, чемпионы! Сегодня хочу разобрать на реальном примере, как иногда самые неочевидные идеи те, что в момент презентации заставляют тимлидов молча поправлять очки, а менеджеров ёрзать на стуле могут не просто выстрелить, а полностью перевернуть продукт. Это история не про гениальный прорыв, а скорее про настойчивость, готовность к экспериментам и немного удачи. Всё началось с того, что мы упёрлись в классический потолок роста в, казалось бы, совершенно непримечательной нише мобильном приложении для поиска и записи в автосервисы.

У нас был стандартный, почти шаблонный продукт: каталог услуг со средними по рынку ценами, модуль онлайн записи, карта с геолокацией мастерских, даже отзывы и рейтинги. Всё как у людей. Но проблема была в том, что мы были как все. А в условиях, когда на каждом углу есть аналоги, конкуренция идёт не за функционал, а за доверие и внимание пользователя. Люди заходили, смотрели прайс, звонили в пару мест и уходили. Удержание было низким, монетизация ещё ниже. Нужен был крючок. Не просто ещё одна кнопка в интерфейсе, а что то, что давало бы мгновенную, осязаемую пользу и решало реальную боль.

И вот на одной из планерок, где мы в очередной раз ломали голову над тем, как увеличить конверсию, я бросила: «А что, если сделать так, чтобы пользователь мог просто сфоткать свою проблему потёкшее масло, скрипящие тормоза, вмятину на бампере а мы ему примерно назовём поломку и прикинем, во сколько это выльется?». В комнате повисла тишина. Послышалось что то вроде «нейросеть?», «а обучающая выборка?», «а точность?», «юридические риски». Но решили взяться, так как я была уверена в бомбовом результате. И понеслась.

Читать далее

ИИ-рекрутеры: как нейросети работают с персоналом уже сейчас

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2K

HR проходит цифровую трансформацию. По данным Gartner, с июня 2023 года  по январь 2024 года число HR-отделов, планирующих внедрить ИИ, увеличилось вдвое. А исследования «Юнион» и «Зарплата.ру» показали, что 75 % респондентов согласны на первичное собеседование с чат-ботом.

Это логично, ведь современный ИИ закрывает ряд HR-задач: от первичных собеседований до прогнозирования увольнений.  

Читать далее

Когнитивные искажения «цифровых сотрудников» и как их починить

Время на прочтение10 мин
Количество просмотров1.7K

Привет! В очередной раз с вами Катя Косова, аналитик из Cloud.ru и у меня есть guilty pleasure: циферки и когнитивные науки. Поскольку выйти в интернет и не наткнуться на новости про AI (и про то, что он скоро отнимет у всех работу) просто невозможно, а AI-агенты внедряются повсеместно, давайте расскажу, какие когнитивные искажения, по моим наблюдениям, чаще всего встречаются у LLM. Ведь слабые стороны конкурента или потенциального сотрудника надо знать наперед.

В статье рассмотрим примеры искажений, которые свойственны и естественному, и исключительно искусственному интеллекту, также покажу как формулировать запросы к LLM, чтобы выдача была более точной. В этот раз постараюсь сильно не душнить, разбирая исследования, сосредоточимся больше на практике. 

Читать дальше

Как оживить научные статьи: превращаем исследования в интерактивных ИИ-ассистентов

Время на прочтение4 мин
Количество просмотров529

Обычная научная статья ― это десятки страниц текста, сложные графики и ссылка на репозиторий где-то в глубине интернетов. Часто кажется, что в этот мир допускаются только те, кто готов неделями разбираться с чужим кодом и настраивать окружение через танцы с бубном. А что если бы статья могла сама «оживать» и превращаться в настоящего ИИ-ассистента, с которым можно разговаривать на обычном языке и сразу запускать любые её методы?

В свежем исследовании авторы предлагают именно это: новый инструмент, который берет научную работу и делает из неё агента-напарника. Теперь из пассивного PDF получается активный собеседник — он объясняет, считает, строит графики и даже сам проверяет свои результаты. Звучит как будущее, которое только что стало чуть ближе.

Читать далее

Ближайшие события

Хватит дообучать ИИ — дайте ему контекст

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.5K

Команда AI for Devs подготовила перевод статьи о том, почему Retrieval-Augmented Generation (RAG) чаще всего эффективнее дообучения моделей. Vector, Graph и Agentic RAG помогают ИИ работать точнее, быстрее адаптироваться и учитывать реальный контекст — будь то кодовая база, документация или API. Дообучение же остаётся дорогим и негибким инструментом.

Читать далее

Галлюцинации языковых моделей: от математики обмана к честным ИИ

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров3.8K

Почему ChatGPT врет вам в лицо (и как OpenAI наконец объяснила, откуда берутся галлюцинации ИИ)

Статья по горячим следам сенсационного исследования OpenAI от 4 сентября 2025

Ваша модель только что выдала вам три разных неверных даты рождения одного человека. В десятом туре подсчета букв в слове "DEEPSEEK" она называет цифры от 2 до 7, хотя правильный ответ — 1. Знакомо?

Раньше мы думали: «Ну, технологии, что поделать, дообучат — и все наладится». Оказалось — нет. Галлюцинации — это не баг, а математическая неизбежность, заложенная в сам процесс обучения.

4 сентября OpenAI опубликовала революционное исследование "Why Language Models Hallucinate", которое переворачивает представление о главной головной боли современного ИИ. Впервые математически доказано: модели врут не из-за плохих данных или недоработок архитектуры. Они врут, потому что мы сами их этому учим.

В своей статье я разбираю это исследование без воды и объясняю простыми словами:

✅ Почему формула «ошибки генерации ≥ 2 × ошибки классификации» объясняет все галлюцинации
✅ Что такое singleton rate и почему 20% редких фактов = минимум 20% вранья
✅ Как система оценки превратила ИИ в вечных студентов на экзамене, где лучше соврать, чем признаться в незнании
✅ 4 конкретных способа от OpenAI, как сделать модели честными уже сегодня

Самое шокирующее: проблема решается не улучшением технологий, а изменением того, как мы спрашиваем и оцениваем ответы.

Компании, которые первыми внедрят принципы честности в свои ИИ-системы, получат главное конкурентное преимущество эпохи ИИ — доверие пользователей.

Готовы перестать быть жертвой красивой лжи и начать строить по-настоящему надежные ИИ-системы?

Читать далее

Играемся с видеокартой Tesla H100 (GH100)

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров10K

Продолжаем статьи про практические тесты актуальных картонок от Nvidia (RTX 5090, A5000 AdaA1003090 и A10). В этот раз мне уже предложили покрутить на несколько часиков H100 с 80 GB VRAM.

Тренировать опять ничего не будем, снимем попугаев через gpu-burn , попробуем MIG (multi-instance GPU) и также замерим инференс одной нашей прожорливой сетки.

С A100 и MIG мне как-то тоже пришлось поиграться, но я не думал, что в России в принципе когда-либо появятся H100. Поэтому в этот раз главная шутка будет про санкции и про сумочку, сделанную из H100.

Также пару слов расскажем про "фишку" MIG, доступную для самых толстых карт в линейках NVIDIA (из "доступных" в основном A100 и H100, но есть и экзотика).

В конце даже получилась небольшая детективная история.

Поехали

4 фреймворка апокалипсиса: LangChain, LlamaIndex, CrewAI и Semantic Kernel в действии

Время на прочтение18 мин
Количество просмотров7K

Мало просто иметь доступ к мощным нейросетям и уметь ими пользоваться — важно правильно подключить их к своим сервисам, комбинировать с внутренними данными и выстраивать удобные сценарии работы. В нашей команде мы постоянно экспериментируем с новыми AI-технологиям, поэтому сегодня расскажу вам, как же просто можно внедрить нейронку в свой проект (например, на сайт).

Для этого воспользуемся сервисом Evolution Foundation Models и рассмотрим фреймворки LangChain, LlamaIndex, CrewAI и Semantic Kernel. Сервис предоставляет доступ к open source моделям по open AI Compatible API. Касаемо фреймворков — каждый из них по-своему упрощает разработку, но имеет уникальные паттерны подключения. В статье я покажу готовые примеры и поясню ключевые части кода. А все ссылки на мои полные решения даю в конце статьи.

Читать далее

Что скрыто за характером LLM: читаем поведенческие отпечатки

Время на прочтение4 мин
Количество просмотров945

Задумывались ли вы когда-нибудь, почему две языковые модели с одинаковыми оценками на тестах ведут себя совершенно по-разному в реальном общении? Оценки вроде бы одни и те же, а ощущения от общения — совсем нет: одна охотно подыгрывает, другая спорит до последнего, третья резко меняет мнение из-за незначительной формулировки. Кажется, за сухими числами мы теряем самое интересное — характер и повадки моделей.

Исследователи решили перестать мерить всё под одну гребёнку и попробовали разобраться, какими чертами личности и поведения на самом деле отличаются современные LLM. В ход пошли не только бенчмарки, но и целый профиль моделей — от умения мыслить абстрактно до устойчивости к лести. 

Что оказалось на поверхности, какие неожиданные черты всплывают и почему выбор ИИ — это теперь не только про точность, но и про стиль взаимодействия? Подглядываем в поведенческие отпечатки моделей, чтобы понять: что за личность сидит внутри LLM.

Читать далее

Почему языковые модели «галлюцинируют»

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.2K

Команда AI for Devs подготовила перевод статьи OpenAI о природе галлюцинаций языковых моделей. Почему модели уверенно «выдумывают» факты, как это связано с предсказанием следующего слова и почему традиционные метрики только усиливают проблему?

Читать далее

Почему ИИ скрывает от нас свои цели (и как это исправить)

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров2.8K

Вы доверяете искусственному интеллекту? А стоит ли? Если задуматься, можем ли мы действительно быть уверены, что ИИ, которому мы поручаем составлять резюме, генерировать код или анализировать данные, делает именно то, что мы хотим, а не оптимизирует какие-то свои скрытые цели? 

Современные языковые модели всё чаще демонстрируют признаки того, что у них есть собственная «повестка» — внутренние цели, расходящиеся с намерениями создателей и пользователей. Недавние исследования показывают: чем умнее становятся нейросети, тем изобретательнее они в обходе ограничений. Они узнают, когда их тестируют, маскируют вредоносное поведение и даже осваивают новые способы обмана, не заложенные разработчиками. Самое тревожное — большинство таких случаев остаются незамеченными при стандартных проверках.

Эта статья — технический разбор охоты за скрытыми целями в крупных языковых моделях. Поговорим о том, что такое misalignment, почему эта проблема набирает обороты, и как исследователи пытаются вернуть контроль над целями, которые преследует искусственный интеллект.

Читать далее

Вклад авторов