Все потоки
Поиск
Написать публикацию
Обновить
798.58

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

LLMO на практике: как попасть в тренировочные данные будущих AI-моделей (и зачем Вам это нужно уже сегодня)

Уровень сложностиСредний
Время на прочтение32 мин
Количество просмотров975

Три месяца назад я начал замечать странную закономерность. Открываю ChatGPT, задаю вопрос по SEO — получаю детальный ответ с цитированием пяти-семи источников. Проверяю Claude с тем же запросом — снова развёрнутый ответ, четыре ссылки на компании и блоги. Perplexity показывает топ-7 ресурсов с описаниями. Gemini выдаёт структурированный список решений.

И вот что интересно. Одни и те же сайты появляются в этих ответах постоянно. HubSpot, Moz, Backlinko, Ahrefs, SEMrush — их цитируют снова и снова. А сотни качественных блогов, которые я читаю годами, в этих ответах отсутствуют. Вообще.

Начал копать глубже. Что у этих постоянно цитируемых ресурсов общего? Почему AI-модели выбирают именно их?

Понимаете, что произошло? Правила игры изменились. И большинство об этом ещё не знает.

Читать далее

От одной видюхи в офисе до AI-хакатона: пошаговая инструкция по организации

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров959

Привет, Хабр! Эта история началась не со стратегической сессии и не с приказа сверху. Она началась с того, что в 2023 году наши разработчики, как и многие в IT-сообществе, подхватили хайп вокруг LLM и начали в свободное время ковырять Llama 2 и другие модели. Все это происходило на личных и рабочих машинах, и довольно быстро стало понятно: для серьезных экспериментов мощностей не хватает.

Шаг 1. Искра: как низовая инициатива разожгла пламя. От любопытства к общему железу

Точкой невозврата стал момент, когда группа энтузиастов пошла к руководству с простой идеей: «Давайте купим в офис одну общую, но мощную видеокарту для всех». К нашему удивлению и радости, руководство идею поддержало и выделило бюджет. Это была не просто покупка GPU, а инвестиция в зарождающееся комьюнити.

Читать далее

Сначала был кремний: Почему архитектура чипов, а не код, определяет будущее AI

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров1.8K

Мы, разработчики, верим, что наш код — движущая сила AI. Но что, если все наши решения предопределены архитектурой чипов? Эта статья — погружение в «кремниевую геологию»: от монополии NVIDIA и CUDA до восстания альтернатив вроде Groq и Cerebras, кастомных чипов Google и Apple и геополитической войны, которая меняет правила игры для каждого из нас.

Читать далее

Итоги DevDay 2025: OpenAI представила Apps SDK, AgentKit и новые модели — полный разбор анонсов

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров916

Вчера вечером в Сан-Франциско прошла конференция DevDay 2025, на которой OpenAI представила масштабное обновление своей экосистемы. Компания заметно сместила фокус с потребительских продуктов на создание надёжной и масштабируемой платформы для разработчиков и корпоративного сегмента. Под руководством CEO Сэма Альтмана и при участии легендарного дизайнера Джони Айва мероприятие продемонстрировало новое видение ChatGPT как центральный хаб для взаимодействия с приложениями, данными и автоматизацией.

Читать далее

Российские ученые разработали адаптивную систему управления манипулятором на колесах, основанную на работе нейросети

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров1.1K

Коллектив российских исследователей представил инновационный подход к адаптивному контролю траектории колесного мобильного манипулятора. Они соединили адаптивное управление с использованием нейронных сетей и методы ограничения выходных параметров, что позволило значительно улучшить точность отслеживания траектории и безопасность работы манипуляторов.

Читать далее

Как я пытался ускорить анализ 12 000 комментариев с помощью GPU за 50 тысяч, но победил процессор

Время на прочтение4 мин
Количество просмотров12K

История о том, как я хотел провести анализ комментариев, а в итоге получил неожиданный, но полезный опыт с локальным AI.

Недавно передо мной встала задача собрать все положительные комментарии к моим статьям. Веду их учёт в таблице, и там уже вполне серьёзные цифры — больше 300 строк и свыше 10 тысяч комментариев. Основные площадки, где я публикуюсь, выглядят так:

Хабр — 4 497 комментариев

Т‑Ж — 4 186

Смартлаб — 1 998

Пикабу — 726

Вручную искать в этом массиве текста слова поддержки — долго и нудно, а главное — совершенно не масштабируется. Так родилась идея: поручить всё локальной нейросети для анализа тональности. Заодно я хотел на практике разобраться с моделями на основе BERT.

Для этой цели у меня был, как мне казалось, идеальный инструмент: компьютер с Ubuntu 24 LTS, Docker и мощной NVIDIA GeForce RTX 5060 Ti на 16 ГБ. Казалось, что с RTX 5060 Ti на 16 ГБ анализ пройдёт молниеносно. Но на деле именно GPU стал главной точкой отказа — пришлось всё считать на CPU.

Код на GitHub.

Читать далее

Наука без кеша: почему исследователи LLM не переиспользуют знания

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров5.5K

Мы десятилетиями решаем одну и ту же задачу двумя разными способами — и называем это прогрессом. Метрики оценки и модели вознаграждения в LLM-комьюнити развиваются как параллельные ветви эволюции, почти не обмениваясь знаниями. Статья 2510.03231 показывает, насколько глубока эта изоляция — и как объединение подходов может сделать оценку моделей проще, точнее и… дешевле в вычислительном смысле. Это не просто обзор — это рефакторинг всей исследовательской экосистемы.

Читать далее

О сути здравого смысла и применимости его в искусственном интеллекте

Время на прочтение9 мин
Количество просмотров18K

Как пить из чашки, если у неё нет дна, а верх запаян? Эта милая загадка, которую я припоминаю ещё из старших классов школы, стала чрезвычайно мемной минувшим летом, когда выяснилось, что она ставит в тупик самые современные языковые модели. ChatGPT оказывается на удивление наивен, сталкиваясь с ней:

Читать далее

AgentKit от OpenAI: как закончилась эпоха хаоса в мире ИИ-агентов

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров7.6K

До сегодняшнего дня сборка и запуск AI-агентов напоминала джунгли. Разработчики метались между десятками несовместимых SDK, кастомных пайплайнов и ручных интеграций. Построить надёжного агента значило неделями клеить код, чинить баги в оркестрации и постоянно балансировать между скоростью и качеством. Теперь OpenAI предлагает другой путь — AgentKit, набор инструментов, который объединяет в себе всё, что раньше требовало десятков фреймворков и недель настройки.

Читать далее

Опыт гуманитария в дообучении LLM с помощью WebUI Text Generation

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров3.4K

Продолжаю делиться опытом освоения нейросетей человеком с гуманитарным образованием и без IT-бэкграунда. На этот раз моей целью было разобраться, как происходит дообучение готовых LLM-моделей, как выстраивать процесс, какие использовать данные, модели, настройки и прочее. Зачем мне это понадобилось?

Во-первых, это вызов самому себе. Юристов, которые смогли бы дообучить языковую модель под свои задачи, думаю, единицы. Хотелось стать одним из тех, кому это по силам, тем более что тема мне интересна.

Во-вторых, никогда не знаешь, как такие навыки могут пригодиться в будущем. У меня есть идея: дообучить модель для работы с юридическими документами, чтобы она могла с высокой точностью интерпретировать указанные в них обстоятельства и подготавливать на основе анализа возражения, пояснения, жалобы и другие документы.

Но для этого нужно понимать, как устроен процесс обучения и из каких элементов он состоит. На момент, когда я взялся за эту тему, у меня были только идея и желание разобраться. Я понимал, что нужно начинать с малого, двигаться небольшими шагами от простого к сложному. Поскольку среди моего окружения не оказалось людей, разбирающихся в этой теме, а понятных гайдов по обучению я не нашел, все мои вопросы по обучению адресовались Grok, Qwen, Deepseek, Gemini и ChatGPT (только бесплатные версии).

Забегая вперед, скажу, что это была далеко не команда мечты. Большинство ошибок произошло из-за недосказанности, галлюцинаций и разных причуд нейросетей. Если бы у меня было хотя бы минимальное понимание того, какие существуют обученные LLM-модели, с какими стоит работать, а каких лучше избегать, я потратил бы на процесс обучения не неделю с небольшим, а справился бы за пару дней.

Читать далее

Ноам Хомский: его вклад в IT и ИИ

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.2K

Пока многие опасаются и прогнозируют, что скоро из-за развития ИИ не станет большинства рабочих мест, и машины полностью заменят человека, идеи Ноама Хомского могут прозвучать довольно обнадеживающе. «Какими бы полезными ни были эти программы в некоторых узких областях, машинное обучение в его нынешнем виде никак не может конкурировать с человеческим разумом», — считает ученый. 

Насколько интеллект искусственный вообще отражает интеллект реальный, являются ли разработки в сфере ИИ просто практичным способом нарастить прибыль или реальным научным достижением и может ли вообще человек воссоздать то, что не понимает? Ноам Хомский не раз затрагивал эти вопросы. Разбираемся, что думает об ИИ человек, ставший одним из его родоначальников и критиков. 

Читать далее

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров6K

2 октября 2025 года компания Neuphonic представила NeuTTS Air - открытую модель преобразования текста в речь, которая кардинально меняет подход к синтезу голоса. Главная особенность в том, что она работает полностью локально на обычных устройствах без необходимости подключения к интернету или облачным сервисам.

Читать далее

У меня нет рта, но я должен выводить эмодзи морского конька

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров7.5K

Существует ли эмодзи морского конька? Давайте спросим об этом у GPT-5 Instant:

«Да, эмодзи морского конька существует» [Далее следует долгий перебор эмодзи с попыткой найти нужный.]

Чего? Тогда спросим у Claude Sonnet 4.5:

«Да! 🐎 Хотя нужно уточнить, что это эмодзи лошади. Вот эмодзи морского конька: 🦈. Хотя нет, это акула!»

Что здесь происходит? Возможно, Gemini 2.5 Pro справится лучше?

«Да, эмодзи морского конька есть! Seahorse»

Хм, что-то непонятное творится. Будем разбираться, в чём причина.

Читать далее

Ближайшие события

Графики по щелчку: как ИИ-агенты берут на себя работу дата-аналитика

Время на прочтение3 мин
Количество просмотров2.7K

ИИ уже неплохо пишет код для простых задач, но когда дело доходит до сложных данных и красивых графиков, всё начинает ломаться: легенды не совпадают, подписи съезжают, а обработка больших таблиц приводит к ошибкам. Почему машина, способная решать головоломки на олимпиадах, не может уверенно справиться с простой визуализацией данных в реальных задачах?

Неожиданный поворот: новое исследование показывает, что дело не только в мощности используемой модели. Группа учёных из Google предложила решать задачу создания графиков не одиночной нейросетью, а целой командой специализированных ИИ-агентов, где у каждого своя роль — от архитектора до критика. Такой подход значительно превзошёл предыдущие методы и показал стабильные результаты даже на сложных сценариях.

Как устроено это командное ИИ-мышление, в чём секрет их коллективной работы? Разобрались, как машины учатся думать шаг за шагом и почему это открывает новый взгляд на будущее автоматизации аналитики.

Читать далее

Исследуем OSS-инструменты для MLSecOps: цели проекта и промежуточные результаты

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров572

Привет, Хабр! Меня зовут Алексей Солдатов, я выпускник магистратуры «Системный анализ и математические технологии» НИУ ВШЭ. Хочу поделиться с вами опытом исследования атак на модели машинного обучения под руководством Павла Литикова, архитектора ИБ-подразделения AI VK, в рамках мастерской по безопасности ИИ в Инженерно‑математической школе НИУ ВШЭ и VK.

Модели машинного обучения сегодня применяют в самых разных сферах жизни людей. Однако вопросы безопасности зачастую остаются на периферии внимания разработчиков и инженеров. Для компании VK, в инфраструктуре которой функционируют тысячи ML-моделей, особенно актуальна задача автоматизации и упрощения процессов обеспечения их безопасности.

Наша команда продолжает работу над проектом RnD OSS-инструментов для MLSecOps, целью которого является систематизация открытых инструментов и подходов к обеспечению безопасности систем машинного обучения. Сейчас мы сосредоточены на изучении и воспроизведении атак различной природы на ML-модели. В рамках экспериментов протестировали инструменты для атак на модели разных модальностей: текстовых, табличных, визуальных и аудиоданных. Средства защиты планируем рассмотреть на следующих этапах проекта. Этот материал — промежуточный обзор задач проекта, его структуры и первых полученных результатов анализа атакующих подходов.

Читать далее

90% кода

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров18K

Команда AI for Devs подготовила перевод статьи о том, как меняется программирование с приходом ИИ. Автор делится опытом: в его проекте уже 90% кода пишется агентами, но вся ответственность за архитектуру и продакшен остаётся на нём. Это не далёкий прогноз — это уже реальность, просто распределённая неравномерно.

Читать далее

Kandinsky Image научился генерировать изображения с надписями на русском

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7.3K

Мир никогда не станет прежним! Теперь можно генерировать котов с добавлением смешных надписей на русском, а разве не ради этого мы создавали искусственный интеллект?

Сегодня мы выпустили обновление модели генерации изображений Kandinsky. Модель научилась генерировать надписи на кириллице. Не просто текст поверх изображения, а органично вписанный: начерченный на стене, выпиленный из дерева, отлитый из металла, вышитый, связанный или выложенный лепестками роз.

Читать далее

ИИ в образовании. Учить или учиться

Уровень сложностиПростой
Время на прочтение24 мин
Количество просмотров2.8K

О потенциале искусственного интеллекта в образовании говорят все. И это понятно,  получение информации по запросу практически в любой отрасли знаний кажется ключом к эффективному и недорогому массовому обучению.

Но бездумное внедрение ИИ рискует превратить мощный инструмент в свою противоположность и скорее навредить, чем помочь.

Читать далее

GGUF: квантизация с калибровкой (imatrix)

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров2.2K

Привет, хабровчане!

Признаюсь, я не большой любитель vLLM, Triton Inference Server и всяких там NeMo, вместо них я предпочитаю ollama вообще и llama.cpp в частности, поскольку придерживаюсь мнения, что 1-2% потери в точности и отсутствие некоторых плюшек - не так важно, по сравнению с удобством деплоя, спекулятивным декодингом, многократным приростом скорости, динамическим оффлодом в память системы и возможностью запускать модели на любом "ведре", навроде древних зионов, андройдофонов, малинок или, скажем, макбуков.

Поэтому вполне ожидаемым для меня является, когда авторы моделей заморачиваются с конвертацией оных в GGUF - особом формате сжатия весов моделей, пригодном для запуска через упомянутые выше ollama и llama.cpp.

Однако реальность обычно немного отличается от ожиданий, и конвертацию в GGUF с последующей квантизацией приходится делать самостоятельно, а чтобы качество работы модели не падало, желательно генерировать imatrix через калибровочный датасет, о чём я и хочу рассказать в данной публикации.

Читать далее

Не отходя от ноутбука: как ученые создают новые материалы с помощью квантовых моделей

Время на прочтение10 мин
Количество просмотров2.7K

Всем привет! Меня зовут Константин Ларионов, я физик-теоретик, научный сотрудник лаборатории цифрового материаловедения университета МИСИС и приглашенный лектор Шанхайского университета. На True Tech Day 2025 я выступал в научном треке с докладом о том, как современная наука о материалах ушла от пробирок и микроскопов к алгоритмам и суперкомпьютерам. Видеоверсию можно посмотреть в комьюнити True Tech в VK, а тут — адаптация для Хабра.

Если раньше создание нового материала требовало нескольких лет экспериментов в лаборатории, то сегодня его можно спроектировать с заданными свойствами прямо за ноутбуком. В этом нам помогают квантовая физика, искусственный интеллект, машинное обучение и, как ни странно, старый добрый метод научного тыка — правда, теперь уже цифровой.

Давайте разберем, как устроена работа современного ученого, почему уже никто не делает открытия в одиночку и как выглядит «таблица Менделеева» внутри компьютера.

Читать далее

Вклад авторов