Обновить
1169.39

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Графики по щелчку: как ИИ-агенты берут на себя работу дата-аналитика

Время на прочтение3 мин
Количество просмотров2.9K

ИИ уже неплохо пишет код для простых задач, но когда дело доходит до сложных данных и красивых графиков, всё начинает ломаться: легенды не совпадают, подписи съезжают, а обработка больших таблиц приводит к ошибкам. Почему машина, способная решать головоломки на олимпиадах, не может уверенно справиться с простой визуализацией данных в реальных задачах?

Неожиданный поворот: новое исследование показывает, что дело не только в мощности используемой модели. Группа учёных из Google предложила решать задачу создания графиков не одиночной нейросетью, а целой командой специализированных ИИ-агентов, где у каждого своя роль — от архитектора до критика. Такой подход значительно превзошёл предыдущие методы и показал стабильные результаты даже на сложных сценариях.

Как устроено это командное ИИ-мышление, в чём секрет их коллективной работы? Разобрались, как машины учатся думать шаг за шагом и почему это открывает новый взгляд на будущее автоматизации аналитики.

Читать далее

Исследуем OSS-инструменты для MLSecOps: цели проекта и промежуточные результаты

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров970

Привет, Хабр! Меня зовут Алексей Солдатов, я выпускник магистратуры «Системный анализ и математические технологии» НИУ ВШЭ. Хочу поделиться с вами опытом исследования атак на модели машинного обучения под руководством Павла Литикова, архитектора ИБ-подразделения AI VK, в рамках мастерской по безопасности ИИ в Инженерно‑математической школе НИУ ВШЭ и VK.

Модели машинного обучения сегодня применяют в самых разных сферах жизни людей. Однако вопросы безопасности зачастую остаются на периферии внимания разработчиков и инженеров. Для компании VK, в инфраструктуре которой функционируют тысячи ML-моделей, особенно актуальна задача автоматизации и упрощения процессов обеспечения их безопасности.

Наша команда продолжает работу над проектом RnD OSS-инструментов для MLSecOps, целью которого является систематизация открытых инструментов и подходов к обеспечению безопасности систем машинного обучения. Сейчас мы сосредоточены на изучении и воспроизведении атак различной природы на ML-модели. В рамках экспериментов протестировали инструменты для атак на модели разных модальностей: текстовых, табличных, визуальных и аудиоданных. Средства защиты планируем рассмотреть на следующих этапах проекта. Этот материал — промежуточный обзор задач проекта, его структуры и первых полученных результатов анализа атакующих подходов.

Читать далее

90% кода

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров18K

Команда AI for Devs подготовила перевод статьи о том, как меняется программирование с приходом ИИ. Автор делится опытом: в его проекте уже 90% кода пишется агентами, но вся ответственность за архитектуру и продакшен остаётся на нём. Это не далёкий прогноз — это уже реальность, просто распределённая неравномерно.

Читать далее

ИИ как новая промышленность: зачем миру столько электричества

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.9K

В двадцатом веке мерой прогресса была нефть. В двадцать первом становится электричество. Искусственный интеллект превратил мегаватты в новую валюту, и теперь страны соревнуются не за месторождения, а за подстанции. У кого больше энергии у того и будущее. О Мире, России и снова Илоне Маске.

Читать далее

Kandinsky Image научился генерировать изображения с надписями на русском

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7.9K

Мир никогда не станет прежним! Теперь можно генерировать котов с добавлением смешных надписей на русском, а разве не ради этого мы создавали искусственный интеллект?

Сегодня мы выпустили обновление модели генерации изображений Kandinsky. Модель научилась генерировать надписи на кириллице. Не просто текст поверх изображения, а органично вписанный: начерченный на стене, выпиленный из дерева, отлитый из металла, вышитый, связанный или выложенный лепестками роз.

Читать далее

ИИ в образовании. Учить или учиться

Уровень сложностиПростой
Время на прочтение24 мин
Количество просмотров3.7K

О потенциале искусственного интеллекта в образовании говорят все. И это понятно,  получение информации по запросу практически в любой отрасли знаний кажется ключом к эффективному и недорогому массовому обучению.

Но бездумное внедрение ИИ рискует превратить мощный инструмент в свою противоположность и скорее навредить, чем помочь.

Читать далее

GGUF: квантизация с калибровкой (imatrix)

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров3.1K

Привет, хабровчане!

Признаюсь, я не большой любитель vLLM, Triton Inference Server и всяких там NeMo, вместо них я предпочитаю ollama вообще и llama.cpp в частности, поскольку придерживаюсь мнения, что 1-2% потери в точности и отсутствие некоторых плюшек - не так важно, по сравнению с удобством деплоя, спекулятивным декодингом, многократным приростом скорости, динамическим оффлодом в память системы и возможностью запускать модели на любом "ведре", навроде древних зионов, андройдофонов, малинок или, скажем, макбуков.

Поэтому вполне ожидаемым для меня является, когда авторы моделей заморачиваются с конвертацией оных в GGUF - особом формате сжатия весов моделей, пригодном для запуска через упомянутые выше ollama и llama.cpp.

Однако реальность обычно немного отличается от ожиданий, и конвертацию в GGUF с последующей квантизацией приходится делать самостоятельно, а чтобы качество работы модели не падало, желательно генерировать imatrix через калибровочный датасет, о чём я и хочу рассказать в данной публикации.

Читать далее

Не отходя от ноутбука: как ученые создают новые материалы с помощью квантовых моделей

Время на прочтение10 мин
Количество просмотров2.9K

Всем привет! Меня зовут Константин Ларионов, я физик-теоретик, научный сотрудник лаборатории цифрового материаловедения университета МИСИС и приглашенный лектор Шанхайского университета. На True Tech Day 2025 я выступал в научном треке с докладом о том, как современная наука о материалах ушла от пробирок и микроскопов к алгоритмам и суперкомпьютерам. Видеоверсию можно посмотреть в комьюнити True Tech в VK, а тут — адаптация для Хабра.

Если раньше создание нового материала требовало нескольких лет экспериментов в лаборатории, то сегодня его можно спроектировать с заданными свойствами прямо за ноутбуком. В этом нам помогают квантовая физика, искусственный интеллект, машинное обучение и, как ни странно, старый добрый метод научного тыка — правда, теперь уже цифровой.

Давайте разберем, как устроена работа современного ученого, почему уже никто не делает открытия в одиночку и как выглядит «таблица Менделеева» внутри компьютера.

Читать далее

AI Review кода за 30 минут: локальная LLM прямо в CI/CD

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров16K

Как за полчаса подключить автоматическое ревью кода с помощью AI Review и локальной LLM Ollama прямо в CI/CD — без токенов и VPN.

Читать далее

Виртуальный гаджет эпохи ИИ-революции

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров1K

Современные интерфейсы не готовы к эпохе LLM.

Мы общаемся с самыми мощными AI-моделями через интерфейсы, спроектированные для переписки с людьми. Линейный чат, где невозможно работать с отдельными элементами ответа. Бесконечные итерации с потерянным контекстом. Копипаст вместо манипуляции объектами.

APPARAT — это концепция AI-first интерфейса, где:

Данные пользователя и ответы LLM становятся интерактивными объектами с собственными свойствами

Гранулярная работа с элементами запроса и ответа вместо монолитных текстовых блоков

Геймификация не ограничивается бейджами — весь интерфейс проектируется как «гаджет внутри гаджета»

Антропоморфизм AI объясняет различия между человеком и моделью, а не имитирует человеческое поведение

Это манифест нового подхода к проектированию интерфейсов для работы с искусственным интеллектом. От принципов эргономики до объектно-ориентированного UI. От идеи до первой концепции дизайна.

Ищу единомышленников — технических специалистов и дизайнеров, готовых превратить это в работающий прототип.

Читать далее

Понимание оценки LLM: детальный разбор 4 основных подходов

Время на прочтение26 мин
Количество просмотров1.1K

Привет! Вчера вышла отличная статья от Себастьяна Рашки, которая детально разбирает основные способы оценки LLM-моделей. Глобально их можно разделить на 4 категории: оценка по бенчмаркам, использование верификаторов, лидерборды и LLM-as-a-judge.

Для каждого метода есть описание и код реализации с нуля, которые отлично показывают, что под капотом у каждого из методов оценки. И такой материал заслуживает того, чтобы быть на русском языке, поэтому я сделал качественный перевод, включая ключевые картиночки. Объёмные блоки кода скрыты за спойлерами, основные схемы переведены — если вы интересуетесь оценкой LLM (ее еще называют evals), то будет интересно.

Важное уточнение: статья позиционирует себя как «создание с нуля» (from scratch), и для этой цели она отлично подходит. Однако, будучи глубоко погружённым в эту тему, я посчитал многие моменты достаточно базовыми. Поэтому финальные выводы с radar-диаграммой и таблицей плюсов-минусов я вынес в самое начало — это отличный способ быстро освежить знания и систематизировать понимание для тех, кто уже глубоко в теме. И продублирую идею о том, что в реальной жизни под конкретную задачу стоит создавать свой бенчмарк и замеряться именно на нем.

В остальном — из песни слов не выкинешь, всё переведено как в оригинале, и это действительно отличный материал. Дальше будет именно он.

Читать далее

Шатдаун правительства США, а также Грокипедия от Илона Маска

Время на прочтение8 мин
Количество просмотров9.1K

Самые интересные новости финансов и технологий в России и мире за неделю: Electronic Arts продались Эмиратам за $55 млрд, больше налогов для айтишников в России, приватизация Союзмультфильма, нейрослоп-машина Sora 2 от Сэма Альтмана, первая AI-актриса Тилли Норвуд, а также смарт-взрывное кольцо на палец от Самсунга.

Читать далее

Как управлять интернетом вещей с помощью LLM

Время на прочтение4 мин
Количество просмотров3.1K

ИИ сегодня уверенно распознаёт тексты, пишет программный код и подсказывает сложные решения — но как только его просят поработать с реальными датчиками или «умным» домом, всё становится неожиданно сложно. Один и тот же датчик может передавать данные в разных форматах, соединения обрываются, взаимодействие превращается в квест с кучей костылей и кастомных скриптов.

Однако совсем недавно инженеры предложили элегантное решение этой застарелой проблемы: не добавлять «ещё один слой» или велосипедить интеграции, а полностью переосмыслить, как LLM взаимодействуют с миром железа. В основе нового подхода — чистая, структурная логика, где роли чётко распределены и всё работает более похоже на реальную команду, чем на беспокойную толпу серверов.

Почему это важно? Такой сдвиг — не просто удобство для разработчиков, а первый реальный шаг к тому, чтобы ИИ начал по-настоящему работать с физическим миром. Как это получилось, где скрыты ключевые идеи и почему новая архитектура может стать стандартом для всего IoT — рассказываю простыми словами.

Читать далее

Ближайшие события

ChatGPT как главный маркетплейс планеты: разбираем OpenAI Agentic Commerce Protocol

Время на прочтение10 мин
Количество просмотров5.1K

Не так давно OpenAI анонсировала Instant Checkout и затем опубликовала Agentic Commerce Protocol — два важных изменения, которые могут качественно повлиять на то, как будет выглядеть еком в ближайшие несколько лет. А может и нет.

Однажды в интервью продуктологов OpenAI я прочитал важную мысль про подход к запуску новых продуктов — «мы трясем яблоню и смотрим что упадет». Можно любить OpenAI и не любить, любить LLMки и нет (лучше — любить), но все, что делает OpenAI неизбежно долгосрочно оказывает влияние на всю индустрию, поэтому совсем пройти мимо такого интересного события — не хотелось.

И как говорил мой англоговорящий друг: «Is that just hype, low hanging fruit, or a real game changer?» (хороший вопрос, кстати).

Попробуем разобраться что внутри и куда движет еком, сравнив в том числе с тем, что делает Google.

Читать далее

Могут ли арты нейросетей участвовать в конкурсах иллюстраций?

Время на прочтение3 мин
Количество просмотров1.6K

Перед вами лонг-лист литературного конкурса Литрес в номинации книжка-картинка. Стикерами указаны те файлы, которые были созданы с помощью различных бесплатных ИИ-платформ. Из 25 книг минимум 7 были созданы не художником-иллюстратором, а программой. Более того, это те иллюстрации, которые можно определить с точностью на обывательском уровне опыта, есть несколько книг в иллюстрациях, которые вызывают сомнения, но я не могу причислить их к артам нейросетей с уверенностью. Также часть иллюстраций в других книгах была просто использована из Canvы. По факту в конкурсе иллюстрированных книг Литрес имеет 28% (почти треть!) сгенерированных картинок. Одно дело, что платформа имеет полное право проводить конкурс, как ей вздумается, но совершенно другое дело - отношение к художникам-иллюстраторам, которые используют свой талант, время и силы для участия, а их ставят в один ряд с состряпанными за пару минут изображениями в бесплатной версии генератора картинок. Вишенкой на торте является и тот факт, что все книги участников конкурса являются платными. Однако, плата за работу иллюстратора очевидна, но за что хотят оплату те "авторы", которые не вкладывали в книгу практически ничего, окромя вёрстки на уровне студента. Проблема на самом деле носит глобальный характер: мы живём во время формирования рыночной значимости цифровых ИИ-продуктов.

Читать далее

Google ADK и «Startup Technical Guide: AI Agents»: как Google переопределяет создание AI-агентов

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.7K

Когда Google Cloud выкатывает Startup Technical Guide: AI Agents – это не просто очередная документация, а знаковое событие. Почему? Да потому что вокруг AI-агентов сейчас шумиха, но до сих пор не было целостного технического ориентира. Этим летом я уже погружался в тему и даже написал статью на Хабре о Google ADK и интеграции AI-агента в кастомный UI. Но новый гайд от Google – это совсем другой уровень: 64 страницы, охватывающие путь от идеи до продакшена. Он появился на фоне взлёта экспериментов с LLM-агентами (те же Auto-GPT, BabyAGI) и стремления многих команд как можно быстрее собрать своего «умного» помощника. Однако, в отличие от отдельных туториалов и фреймворков, этот гайд претендует зафиксировать новую инженерную норму работы с агентами.

Чем же он отличается от других материалов? Во-первых, масштабом и глубиной: Google явно вложила экспертизу своих команд, чтобы описать всё – от архитектуры до AgentOps (операции и сопровождение агентов в продакшене). Во-вторых, уклоном на практическую надёжность: внутри шаг за шагом расписано, как превратить прототип агента в устойчивую систему с мониторингом, тестами, безопасностью. В-третьих, фокусом на экосистему Google Cloud: гайд показывает, как использовать Vertex AI, модель Gemini, Agent Development Kit (ADK) и прочие инструменты. Но, что ценно, принципы из гайда применимы шире – они будут полезны любому разработчику LLM-агентов, даже если вы используете альтернативные платформы.

Итак, прочитав весь документ, я выписал для себя пять главных инсайтов. Ниже я делюсь ими от первого лица – что я понял из гайда, какие цитаты это подтверждают, и какие мысли появились у меня как у разработчика.

Читать далее

Опасности планирования следующей поездки с помощью ИИ

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.5K

ИИ-планировщик отправил туристов в несуществующий каньон. Разбираем, почему нейросети опасны для путешественников

Недавно BBC опубликовала статью о том, как туристы, доверившись нейросети, оказываются в несуществующих местах.

Кейс №1: «Священный каньон» в Перу

Гид из Перу Мигель Анхель Гонгора Меса столкнулся с туристами, которые собирались в одиночный поход к «Священному каньону Умантай». Проблема в том, что такого места не существует. Нейросеть просто скомбинировала названия двух реальных локаций и сгенерировала красивое, но абсолютно фейковое описание. Туристы потратили $160, чтобы добраться до глухой дороги в горах без связи, гида и понимания, что делать дальше. На высоте 4000 метров такая «галлюцинация» ИИ могла закончиться трагически.

Кейс №2: Застрявшие на горе в Японии

Другая пара использовала ChatGPT для похода на гору Мисэн в Японии. ИИ уверенно сообщил, что последняя канатная дорога вниз работает до 17:30. В реальности она закрылась раньше, и туристы застряли на вершине горы после заката.

Таких историй становится все больше: от Эйфелевой башни в Пекине до невыполнимых марафонских маршрутов. Почему так происходит?

Суть проблемы — «галлюцинации» LLM

Большие языковые модели не «знают» фактов. Они лишь статистически подбирают слова, чтобы ответ звучал убедительно. При этом ИИ выдает и правду, и откровенный вымысел с одинаковой уверенностью. Отличить одно от другого почти невозможно, особенно когда речь идет о незнакомой стране.

Сами разработчики, включая главу Google Сундара Пичаи, признают, что галлюцинации — это, похоже, врожденная и неустранимая особенность таких систем.

Что в итоге?

Полагаться на ИИ в путешествиях можно, но с большой осторожностью. Золотое правило: если совет от нейросети кажется слишком хорошим, чтобы быть правдой, — скорее всего, так и есть. Каждое название, время работы и маршрут нужно перепроверять по надежным источникам. Иначе рискуете оказаться героем похожей истории.

Читать далее

Паттерны программирования при работе с LLM

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров10K

LLM - мощный инструмент, но его эффективность в продакшене зависит не от одного «хитрого промпта», а от всей архитектуры: что мы даём модели, как управляем её рассуждением и как проверяем/обрабатываем результат. В этой статье - компактная карта паттернов, разбитая по этапам конвейера: Input -> Reasoning -> Output.

Читать далее

Как мы делали свою ноду для n8n

Время на прочтение4 мин
Количество просмотров4.8K

Всем привет!

Самостоятельное создание ноды HTTP Request может быть сложной задачей. Нужно самостоятельно искать и указывать эндпоинт, прописывать body для запроса и проставлять нестандартный заголовок авторизации, что совершенно неудобно и сложно для многих пользователей.

По вышеописанной причине мы решили разобраться в этой проблеме, и опубликовать собственную комьюнити-ноду n8n-nodes-amvera-inference, которая сможет помочь пользователям, без сложностей, работать с нашим Inference API нужной модели.

В статье мы расскажем и про саму разработку комьюнити-ноды, и про её установку с настройкой.

Читать далее

От GPT-2 к gpt-oss: анализ достижений архитектуры

Уровень сложностиПростой
Время на прочтение21 мин
Количество просмотров4.5K

📝 Описание

На этой неделе разбираем релиз GPT-OSS — первых полностью открытых моделей OpenAI с момента GPT-2 в 2019 году. Две модели: gpt-oss-20b и gpt-oss-120b представляют собой современные LLM с архитектурой MoE (Mixture of Experts), оптимизированные для рассуждений и способные работать на одном GPU благодаря квантованию MXFP4.

Читать далее

Вклад авторов