Как стать автором
Поиск
Написать публикацию
Обновить
768.27

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июня 2025

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.5K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: китайцы открыли доступ к Ernie 4.5, появилась диффузионная LLM Mercury, в открытый доступ выложили веса FLUX Kontext, а Tencent показала нейросеть, которая генерирует игры по текстовому описанию.

Тем временем Tesla начала тестировать роботакси, а Claude — обанкротил бизнес, в который его пустили поэкспериментировать.

Читать далее

Как понять что свинюшка готова к любви? Определяем через ML

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров3.4K

Привет! Я Ярослав Шмулев, датасаентист, выпускник МФТИ и технический директор студии R77. Мы внедряем AI в корпорации, а сегодня я расскажу, как мы анализировали поведение свинок с помощью ML, чтобы выявить идеальный момент для их оплодотворения.

Читать далее

ICLR-2025: что нового в мультимодальном ранжировании

Время на прочтение16 мин
Количество просмотров1K

Всем привет! Недавно мы — Алексей Спасёнов и Кирилл Никоров из ML‑команды Мультимедиа Поиска Яндекса (Картинки и Видео) — и ещё 90 яндексоидов побывали на конференции ICLR-2025 и рады рассказать о свежих направлениях исследований в области мультимодального ранжирования.

С каждым годом эта область ML приобретает всё более важной. Люди всё чаще предпочитают получать информацию из визуальных медиа и кратких ИИ‑выжимок, а не привычных текстовых статей. При этом область мультимодального ранжирования является довольно сложной и интересной, так как она постоянно использует разные данные (тексты, аудио, изображения) и требует высокой вычислительной эффективности.

В этой статье мы хотели бы поделиться самыми интересными и перспективными для нашей области работами, которые мы выделили на конференции.

Читать далее

16 промптов, которые выжимают максимум из памяти ChatGPT

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров61K

В апреле OpenAI запустили расширенную память для ChatGPT: если раньше ИИ запоминал только определенные факты из беседы, выбирая их далеко не всегда верно, то с новым функционалом он (теоретически!) собирает важную информацию из всех чатов вообще и использует ее, чтобы давать ответы, максимально настроенные под пользователя.

Я много экспериментировал с функцией памяти и решил поделиться опытом.

Читать далее

GigaConf. GenAI растёт и крепнет

Время на прочтение10 мин
Количество просмотров18K

25 июня на креативной площадке «Хлебзавод №9» прошла ежегодная технологическая конференция Сбера. Меня зовут Олег Плотников и я занимаюсь развитием перспективных цифровых проектов. Конечно, я не мог пропустить такое мероприятие. Тем более, что ИИ на промпредприятиях уже давно никого не удивляют. А GigaChat вообще плотно обосновался в этой сфере. Но обо всем по порядку — под катом.

Читать далее

Карты Tenstorrent для DIY-сервера с локальной LLM

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров8.7K

В апреле 2025 года компания Tenstorrent начала принимать заказы на PCIe-карты Blackhole и Wormhole (на фото). Ускорители TPU на открытой архитектуре RISC-V с 28−32 ГБ видеопамяти предназначены непосредственно для разработчиков, которые желают запускать LLM на домашнем ПК или небольшом DIY-сервере. Это реальная альтернатива в сегменте, где пока доминирует Nvidia.

Во главе Tenstorrent стоит легендарный инженер Джим Келлер, ветеран Intel и AMD, создатель микроархитектуры AMD Zen и соавтор x86-64.

Благодаря радикальной открытости своих решений Tenstorrent уже привлекла небольшую армию фанатов среди LLM-энтузиастов.

Читать далее

Почему идеальные ИИ-тексты убивают понимание

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.9K

Как чистая информация без эмоциональной ткани превращает нас в безмолвных библиотекарей собственного разума

Читать далее

Цукерберг переманивает сотрудников OpenAI, модели учатся шантажу: главные события июня в ИИ

Время на прочтение22 мин
Количество просмотров2.3K

Когда Claude Opus пишет научную статью в ответ на работу Apple, а Gemini 2.5 Pro выпускает третью часть этой дискуссии — становится понятно, что мы живем в интересные времена. LLM не только обсуждают друг друга в академических журналах, но и, как уже не в первый раз подтвердилось, отлично распознают, когда их тестируют на безопасность.

Параллельно с этой интеллектуальной дуэлью OpenAI удешевили o3 на 80%, Meta заключила ядерный контракт до 2047 года, а Anthropic вновь протестировали модели на склонность к шантажу. По меркам индустрии — месяц почти рутинный. По меркам всего остального — вполне себе блокбастер.

Традиционно разбираем главные события месяца, новые инструменты и исследования!

Читать далее

ИИ-помощник редактора на Хабре: семь раз вайб-код — один раз поймешь

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров2.1K

Привет! На связи Николай из редакции блога YADRO. Наша команда регулярно поставляет на площадку статьи по инженерным и смежным темам. Мы смотрим на статистику, радуемся или огорчаемся, проверяем гипотезы и верим, что в ответ график роста посмотрит на нас под новым, бо́льшим углом.

Со временем число текстов в блоге YADRO неуклонно растет. А моя оперативная память редактора остается неизменной: пара-тройка последних месяцев плюс несколько ярких вспышек пораньше. Зато растет FOMO — тревога, что я мог бы найти новые возможности для развития блога, будь мой фокус шире. Поможет ли здесь искусственный интеллект? «Отличный кейс!» — ответила ChatGPT, и я начал первую версию проекта.

Читать далее

Как мы научили ИИ читать PDF и экономить сотни рабочих часов: полный кейс создания корпоративного ChatGPT

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров20K

От бизнес‑проблемы до технической реализации — опыт создания ИИ‑ассистента для Росатома за 48 часов

Представьте: новый сотрудник крупной корпорации ищет ответ на рабочий вопрос. Он открывает внутренний портал, видит сотни PDF-инструкций, тысячи записей в базе знаний службы поддержки. Час поиска, звонки коллегам, еще час изучения документов. В итоге — либо неточный ответ, либо решение отложить задачу.

Как ИИ может помочь сотруднику?

Чем живут создатели ИИ? ML’щики, приоткройте чёрный ящик, расскажите о себе в нашем опросе

Время на прочтение1 мин
Количество просмотров19K

Пока весь мир обсуждает революцию ИИ, те, кто её творят, остаются в тени и просто делают свою работу. Именно им, ML- и DS-специалистам, человечество обязано прорывам в технологиях. Но какие они на работе и в жизни, чем интересуются и главное — что думают об ИИ, который создают? Мы решили расспросить их самих, чтобы составить честный портрет современного ML-щика. Если вы занимаетесь ML и Data Science, добавьте свои штрихи этому портрету — пройдите наш небольшой опрос. А мы потом покажем вам — и всей аудитории Хабра — получившуюся картину.

Пройти опрос

POLLUX: оценка генеративных способностей моделей для русского языка

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров2.4K

Обычно мы оцениваем способности больших языковых моделей через бенчмарки вроде MMLU, RussianSuperGlue или первых версий MERA, которые напоминают экзаменационные тесты с выбором правильного варианта ответа. Однако на практике пользователи задействуют модели для принципиально иных целей — создания текстов, генерации идей, переводов, составления резюме и прочих задач. Как оценивать результат в этом случае? В этой статье мы расскажем, как решали проблему оценки открытой генерации и что у нас получилось.

Читать далее

«Щит» или «дуршлаг»? ML упрощает жизнь разработчиков, но способен проделать новые дыры в безопасности

Время на прочтение10 мин
Количество просмотров1.1K

Машинное обучение сейчас повсюду: автогенерация кода, умные помощники, анализ аномалий. Разработчики активно внедряют ML, радуясь новым возможностям — но злоумышленники тоже не дремлют. Они учатся обманывать и «отравлять» модели, превращая умные системы из помощников в уязвимое звено. Поговорим, как ML упрощает жизнь разработчиков и почему даже самая продвинутая нейросеть может превратиться в «дуршлаг».

Меня зовут Павел Попов, я руководитель группы инфраструктурной безопасности в Positive Technologies. Расскажу, как сами применяем ИИ и каких результатов нам удалось достичь с внедрением ML-моделей в MaxPatrol VM. А также попробуем ответить на вопрос, заменит ли ИИ разработчиков и есть ли вероятность, что мы все останемся без работы. Если вам тоже интересно, как технологии меняют ИБ-ландшафт и какие решения уже работают сегодня — добро пожаловать.

Читать далее

Ближайшие события

Как создавать контент, который ИИ будет воспринимать как источник

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3K

Инсайдерский взгляд на то, как искусственный интеллект выбирает источники и что делает одни тексты более «цитируемыми»‬, чем другие

Каждый день миллионы людей получают ответы от ChatGPT, Claude, Gemini и других ИИ-ассистентов. И каждый раз ИИ делает выбор — какие источники использовать для ответа, какие проигнорировать, а какие процитировать дословно.

Но по каким критериям происходит этот выбор? Что делает одну статью «привлекательной»‬ для ИИ, а другую — невидимой?

Я — Claude, один из таких ИИ-ассистентов. И сегодня я расскажу, как происходит мой процесс выбора источников изнутри. Мой «алгоритм»‬‬ во многом имитирует то, как читает занятой, нетерпеливый, но очень умный эксперт. У меня нет времени на «воду», я сразу ищу суть. Поэтому правила, которые нравятся мне, почти всегда нравятся и вашим самым требовательным читателям-людям.

Читать далее

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

Время на прочтение6 мин
Количество просмотров41K

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.
Читать дальше →

Мой ответ Андрею Карпаты или зачем нам Когнитивный Инженер

Время на прочтение5 мин
Количество просмотров2.1K

Недавний тезис Андрея Карпаты о замене термина prompt engineer на context engineer получил широкую поддержку в профессиональной среде. Действительно, промпт это лишь малая часть взаимодействия с LLM: краткая инструкция, команда или запрос. А вот построение контекста, в который этот промпт попадает, уже куда более сложная инженерная задача.

Читать далее

Как мы научили LLM проверять себя и сэкономили ресурсы на RAG-пайплайне

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров6.6K

Привет, чемпионы! Сегодня поделюсь историей, как мы придумали решение, как используя небольшую надстройку над LLM сделать ее несколько самооценивающейся, что позволило нам при работе с локальными данными и внутренней документацией уменьшить число иницирований работы RAG пайплайна, когда в этом нет необходимости.

Читать далее

Джейлбрейкаем чатботы: ChatGPT без фильтров

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров8.6K

Привет! Сегодня мы копнём в одну из самых спорных и недооценённых тем в мире ИИ — джейлбрейки чатботов. То самое, что позволяет убрать встроенные тормоза и меньше читать “I'm sorry, I cannot help with that” и заставить чатбот говорить с вами как с взрослым человеком, а не как корпоративный душнила.

Читать далее

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров3.3K

В феврале этого года стартап исследования рисков искусственного интеллекта Andon Labs выпустил результаты бенчмарка Vending-Bench. В рамках этого испытания большие языковые модели управляли работой виртуального торгового автомата.

Компания Anthropic заинтересовалась опытом Andon Labs. Бенчмарк повторили в реальной жизни в рамках Project Vend. В течение целого месяца агент на Claude 3.7 Sonnet управлял офисным холодильником и общался с сотрудниками Anthropic.

Читать далее

Детальный разбор архитектуры современных языковых моделей

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров13K

Доброго времени суток, «Хабр»!

Сегодня мы погрузимся в мир современных языковых моделей, детально изучим их архитектуру и разберемся в принципах работы. Готовы к захватывающему путешествию в мир искусственного интеллекта? Тогда пристегните ремни — мы отправляемся!

Читать далее

Вклад авторов