

Искусственный интеллект
AI, ANN и иные формы искусственного разума
Новости
Мечтать, чтобы строить: как прошёл сезон «Будущее здесь»

Гипотезы становятся концепциями, идеи — планами, а мечты — реальностью особенно быстро, когда речь идёт об искусственном интеллекте. Сезон «Будущее здесь» на Хабре стал лабораторией ближнего будущего, где ИИ — больше чем просто инструмент. Он превращается в собеседника, помощника, зеркало, в котором наши ценности, страхи и надежды сначала отражаются, а затем обретают самостоятельную жизнь.
Участники сезона принесли десятки версий завтрашнего дня: одни — в виде рассказов, другие — как инженерные концепции и технологические прогнозы. Вместе с ВТБ мы подводим итоги — и выбираем идеи, готовые воплотиться в жизнь.
Жесткий контроль над ИИ агентами как инструмент для массовой слежки

Уже в ближайшем будущем сеть будет наполнена ИИ агентами. Персональные агенты, агенты компаний, государств… Скорей всего уже через пару лет почти у всех нас будут как минимум поодному своему агенту, как сейчас у нас есть профили в соцсетях.
Как понять кому принадлежит агент, с которым ты или твой агент сейчас собираетесь взаимодействовать? Можно ли ему доверять? Не фейк ли это? Брать ли трубку или заказывать ли на этом сайте билеты?
Агент ID — это что‑то вроде телефонного номера, но более сложное, так как поведение определяется многими параметрами — промптом, базой знаний и моделью. Изменение любого из них приведет к изменению поведения агента. Можно рассматривать это как версию определенной программы, она как бы та же, но немного иная. По мнению авторов, каждая такая версия заслуживает своего ID.
От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

Как фильтры стиля и настроения меняют рейтинг LM Arena
Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами.
Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control, который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента.
Что такое LM Arena и зачем она нужна
Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench).
На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.
Секреты Spark в Arenadata Hadoop: как мы ускорили построение витрин для задач ML

Привет, Хабр! Я Дмитрий Жихарев, CPO Платформы искусственного интеллекта RAISA в Лаборатории ИИ РСХБ-Интех. В этой статье я и архитектор нашей платформы Александр Рындин @aryndin9999расскажем о том, как мы построили взаимодействие Платформы ИИ и Озера данных для работы с витринами данных моделей машинного обучения с использованием Spark.
Тестируем новые модели o3 и o4-mini от OpenAI

Привет! На связи Кирилл Филипенко, сисадмин в Selectel. Недавно OpenAI анонсировала два новых поколения моделей — o3 и o4-mini, которые стали частью линейки o-series. В статье разбираемся, за счет чего они получились мощнее, насколько дешевле обойдется их использование и какие кейсы стоит обязательно протестировать уже сегодня. В OpenAI уверены, что эти образцы задают новую планку того, каким должен быть AI-ассистент. Так ли это? Проверим под катом.
Как тестировать AI-агентов, чтобы не было больно

AI-агенты трансформируют индустрии — от чат-ботов в службе поддержки до продвинутых ассистентов для программирования. Однако, чтобы они действительно были эффективными и заслуживающими доверия, необходимо их тщательное тестирование. Строгая процедура тестирования и оценки позволяет оценить производительность агента, адаптивность к новым сценариям и соответствие требованиям безопасности.
В этой статье изложены структурированные шаги для тестирования и оценки AI-агентов с точки зрения надежности, устойчивости к сбоям и общего воздействия.
ИИ в тестировании ПО: возможности, ограничения, эксперименты и практический опыт

Вот уже пару лет чат-боты, основанные на больших языковых моделях, «гремят» на весь интернет. Поражают своими возможностями и делают то, о чем около 15 лет назад можно было услышать только в фантастических сюжетах. При этом важно что, сейчас Large Language Model (LLM) дошли до широкого круга потребителей и все могут их увидеть и протестировать. В связи с этим возникают дискуссии, размышления, статьи-прогнозы на тему того, как искусственный интеллект (ИИ) изменит рынок труда, кого заменят, сократят, а кто останется и т.д. Профессия QA и процессы тестирования тоже не остались без подобных рассуждений.
Привет, Хабр! Меня зовут Андрей, я QA-специалист в компании SimbirSoft. В этой статье хочу поделиться опытом и впечатлениями моих коллег в использовании ИИ для рабочих задач.
ИИ пишет книги, рисует картины и снимает кино. Творцы, пора паниковать?

Сначала машины забрали у нас заводы, теперь добрались до искусства. Нейросети уже пишут романы, сочиняют симфонии и генерируют картины, которые продаются за сотни тысяч долларов.
Так что закрываем ноутбуки, выбрасываем кисти и идём искать новую работу?
LLM как концептуальный симулятор для универсальных «теорий всего». Скорректированный прогноз ai-2027.com и другие
"Вселенная - это библиотека, где каждая книга отражает все другие, а Бог - её вечный Читатель и Текст", Хорхе Луис Борхес.
"Реальность - это язык, на котором Вселенная наполняется смыслом", Я.
В истории человеческой мысли появление новых концептуальных моделей всегда открывало новые горизонты понимания. От буддийской философии до гелиоцентрической системы Коперника, от психоанализа Фрейда до теории сложных систем - каждая новая "концептуальная линза" позволяла увидеть реальность в ином свете, выявляя прежде скрытые закономерности и связи. Сегодня в нашем распоряжении множество таких линз: синергетика, структурализм и постструктурализм, холизм, теория коэволюции и бесчисленно прочие.
Проблема в том, что освоение каждой новой концептуальной линзы требует значительных интеллектуальных усилий. Мы должны изучить особый язык, систему понятий, методологию применения. Этот высокий барьер входа ограничивает распространение новых способов мышления и восприятия.
Команда разработчиков больше не нужна? Может ли один product engineer писать код с помощью AI

AI меняет не только процессы, но и профессии. Полгода назад для того, чтобы запустить MVP продукта, нужен был не только product owner, но и команда разработчиков. Сегодня прототип может сделать один человек без команды, используя только AI. Вы все еще относитесь к этому со скепсисом, но это уже так.
Меня зовут Сергей Спиренков, я евангелист в KODE и CEO собственных проектов. Последние месяцы я провел внутри этой трансформации — собирая продукты в одиночку, без строчек кода руками, с помощью AI и нового подхода к разработке. В статье поделюсь мнением, как изменится профессия product owner и что ждет разработчиков. И главное: расскажу про AI-инструменты, с помощью которых сам делаю MVP продуктов.
Персонализируем контент с помощью ИИ

Всем привет! Меня зовут Анастасия Шмалько, я лидер команды «Персонализация контента» в кластере Кампании продаж Сбера. В нашем кластере создаётся контент разных видов, но сегодня я расскажу о рекламных SMS. А точнее, о том, как с помощью машинного обучения мы составляем более личные послания каждому адресату. Это помогает нам чаще достигать главной цели — заинтересовать человека, чтобы он перешёл по ссылке и оформил продукт (наши клиенты — это ИП и собственники бизнеса).
Я знаю, что ты думал в прошлый дейлик

На входе — обычный push. На выходе — коммит, улучшенный с помощью LLM, сохранённый в векторной базе, доступный для поиска и семантического анализа. Пишем простой MCP-сервер для трекинга изменений ваших проектов.
Ближайшие события
Решалка судоку: сам не представляю, как она у меня получилась

В этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.
WorkTeam: новый мультиагентный фреймворк для автоматизации сложных бизнес-процессов

В стремительно меняющемся мире бизнеса автоматизация процессов перестала быть роскошью - сегодня это жизненная необходимость. Представьте, что вы можете переводить даже самые сложные инструкции на привычном человеческом языке напрямую в готовый бизнес-процесс, обходясь без десятков часов ручной разработки и без узкоспециализированных экспертов. Звучит как фантастика? Новая мультиагентная платформа WorkTeam претендует на то, чтобы воплотить это в реальность.
Будни вайбкодинга: лайфхаки при работе с LLM

Современные LLM давно уже вышли за предел «галлюционнирующей генерации» и дают устойчивую точную генерацию практически на всех популярных языках, фреймворках и библиотеках... При наличии правильного контекста. В большинстве случаев контекст, который вы скармливаете LLM имеет высокую избыточность и низкую концентрацию полезной информации. При нехватке контекстного окна вы практически гарантированно получите низкокачественную галлюцинацию. Что можно сделать в таком случае: обрезается весь ненужный контекст, добавляется весь необходимый. Как это выглядит: вы подготавливаете свой проект в IDE, убирая всё лишнее, и оставляете только самое необходимое, что бы LLM получила весь необходимый контекст и не байтом больше, то есть контекст должен на 100% состоять из полезной информационной нагрузки.
Если есть объёмная база данных — оставьте в ней всего несколько значений для примера. Неиспользуемые в данной конкретной ситуации зависимости так же удаляете из контекста. Если речь о текстовой работе с LLM — то делаете тоже самое в форме промпта или загружаемого текстового файла‑инструкции, подготавливая всё необходимое, т. е., в промпте должно быть описание кодовой базы и окружения, файловая структура, используемый стек, назначение кодовой базы, весь необходимый код всех задействованных файлов, выдаваемые ошибки и прочее. То есть вы должны своими руками построить 100% удобный для работы LLM контекст. Фактически, при данном подходе, вероятность генерации неправильно ответа — околонулевая. Простыми словами — воспринимайте контекстное окно как бутылочное горлышко, через которое необходимо достать информацию из бутылки, то есть из модели.
Попросили нейросеть задать нашим программистам необычные вопросы о разработке в финтехе

Но это не простые разработчики, а те, кто будет выступать завтра с докладами на нашем ежегодном бесплатном митапе Frontend Mix. 😎 Ребята расскажут про рефакторинг приложений за 10 секунд, стандарты тестирования во фронтенде, анимацию и уязвимости в финтехе. Ссылка на страницу конференции и регистрацию будет ниже, а пока оценим ответы на вопросы ИИ. 👇
Нейро-дайджест: ключевые события мира AI за 14-20 апреля 2025

Привет!
Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.
Меня зовут Вандер и каждую неделю я делаю обзор новостей о нейросетях и ИИ.
Неделя с 14 по 20 апреля выдалась горячей: революционные LLM от гигантов, прорывы в мультимодальных технологиях, инновационные платформы — всё это я собрал в одном месте. Только самое важное и только то, что реально интересно и полезно. Поехали!
Нейрофизиология внимания: как алгоритмы и мозг обрабатывают первые 3 секунды видео

Биология клипового мышления: почему 400 мс решают всё
Исследования MIT (2023) доказали: мозг принимает решение "смотреть/не смотреть" за 400-800 мс. Это результат эволюции — наши предки оценивали опасность за доли секунды.
Отношения между ИИ и обычной девушкой

Из всех утюгов звучат новости о появлении новых видов ИИ, нейронных сетей, но как будто хайп спадает, ну есть какой-то сайт, который напишет статью, сделает домашнее задание, запрограммирует простую программу, ну и что? Большинство людей как жили своими жизнями, так и живут и их никак не касается развитие ИИ.
Я тоже так думал, думал что начнется застой в сфере ИИ, но кое что произошло. Я некоторое время назад, разработал Телеграм бота для знакомств, но не просто бота, в нем помимо реальных анкет людей были анкеты "Виртуальных людей", по сути ботов. Разработал я бота просто так, чтобы друзьям показать, поприкалываться. Но мне неделю назад пришло в личку в телеге письмо от незнакомой девушки, которая просила не удалять из бота какую-то анкету. Я сначала не понял, что от меня хотят, но потом как понял... и решил поделиться сообществом тем, что произошло.