Как стать автором
Обновить
1007.35

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Часть 3. Обзор технологий RAG для LLM: оптимизация извлеченных данных

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров296

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь) Во этой, третьей части авторы совсем кратенько разбирают технологии оптимизации извлеченных данных.

Читать далее

Новости

Мечтать, чтобы строить: как прошёл сезон «Будущее здесь»

Время на прочтение8 мин
Количество просмотров288

Гипотезы становятся концепциями, идеи — планами, а мечты — реальностью особенно быстро, когда речь идёт об искусственном интеллекте. Сезон «Будущее здесь» на Хабре стал лабораторией ближнего будущего, где ИИ — больше чем просто инструмент. Он превращается в собеседника, помощника, зеркало, в котором наши ценности, страхи и надежды сначала отражаются, а затем обретают самостоятельную жизнь.

Участники сезона принесли десятки версий завтрашнего дня: одни — в виде рассказов, другие — как инженерные концепции и технологические прогнозы. Вместе с ВТБ мы подводим итоги — и выбираем идеи, готовые воплотиться в жизнь.

Читать далее

Жесткий контроль над ИИ агентами как инструмент для массовой слежки

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров554

Уже в ближайшем будущем сеть будет наполнена ИИ агентами. Персональные агенты, агенты компаний, государств… Скорей всего уже через пару лет почти у всех нас будут как минимум поодному своему агенту, как сейчас у нас есть профили в соцсетях.

Как понять кому принадлежит агент, с которым ты или твой агент сейчас собираетесь взаимодействовать? Можно ли ему доверять? Не фейк ли это? Брать ли трубку или заказывать ли на этом сайте билеты?

Агент ID — это что‑то вроде телефонного номера, но более сложное, так как поведение определяется многими параметрами — промптом, базой знаний и моделью. Изменение любого из них приведет к изменению поведения агента. Можно рассматривать это как версию определенной программы, она как бы та же, но немного иная. По мнению авторов, каждая такая версия заслуживает своего ID.

Читать далее

От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров314

Как фильтры стиля и настроения меняют рейтинг LM Arena

Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами.

Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control, который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента.

Что такое LM Arena и зачем она нужна

Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench).

На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.

Читать далее

Секреты Spark в Arenadata Hadoop: как мы ускорили построение витрин для задач ML

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров324

Привет, Хабр! Я Дмитрий Жихарев, CPO Платформы искусственного интеллекта RAISA в Лаборатории ИИ РСХБ-Интех. В этой статье я и архитектор нашей платформы Александр Рындин @aryndin9999расскажем о том, как мы построили взаимодействие Платформы ИИ и Озера данных для работы с витринами данных моделей машинного обучения с использованием Spark.

Читать далее

Тестируем новые модели o3 и o4-mini от OpenAI

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров2.6K

Привет! На связи Кирилл Филипенко, сисадмин в Selectel. Недавно OpenAI анонсировала два новых поколения моделей — o3 и o4-mini, которые стали частью линейки o-series. В статье разбираемся, за счет чего они получились мощнее, насколько дешевле обойдется их использование и какие кейсы стоит обязательно протестировать уже сегодня. В OpenAI уверены, что эти образцы задают новую планку того, каким должен быть AI-ассистент. Так ли это? Проверим под катом.
Читать дальше →

Как тестировать AI-агентов, чтобы не было больно

Время на прочтение9 мин
Количество просмотров598

AI-агенты трансформируют индустрии — от чат-ботов в службе поддержки до продвинутых ассистентов для программирования. Однако, чтобы они действительно были эффективными и заслуживающими доверия, необходимо их тщательное тестирование. Строгая процедура тестирования и оценки позволяет оценить производительность агента, адаптивность к новым сценариям и соответствие требованиям безопасности.

В этой статье изложены структурированные шаги для тестирования и оценки AI-агентов с точки зрения надежности, устойчивости к сбоям и общего воздействия.

Читать далее

ИИ в тестировании ПО: возможности, ограничения, эксперименты и практический опыт

Уровень сложностиПростой
Время на прочтение28 мин
Количество просмотров760

Вот уже пару лет чат-боты, основанные на больших языковых моделях, «гремят» на весь интернет. Поражают своими возможностями и делают то, о чем около 15 лет назад можно было услышать только в фантастических сюжетах. При этом важно что, сейчас Large Language Model (LLM) дошли до широкого круга потребителей и все могут их увидеть и протестировать. В связи с этим возникают дискуссии, размышления, статьи-прогнозы на тему того, как искусственный интеллект (ИИ) изменит рынок труда, кого заменят, сократят, а кто останется и т.д. Профессия QA и процессы тестирования тоже не остались без подобных рассуждений. 

Привет, Хабр! Меня зовут Андрей, я QA-специалист в компании SimbirSoft. В этой статье хочу поделиться опытом и впечатлениями моих коллег в использовании ИИ для рабочих задач.

Читать далее ⚡

ИИ пишет книги, рисует картины и снимает кино. Творцы, пора паниковать?

Время на прочтение2 мин
Количество просмотров791

Сначала машины забрали у нас заводы, теперь добрались до искусства. Нейросети уже пишут романы, сочиняют симфонии и генерируют картины, которые продаются за сотни тысяч долларов.

Так что закрываем ноутбуки, выбрасываем кисти и идём искать новую работу? 

Читать далее

LLM как концептуальный симулятор для универсальных «теорий всего». Скорректированный прогноз ai-2027.com и другие

Уровень сложностиСредний
Время на прочтение63 мин
Количество просмотров302

"Вселенная - это библиотека, где каждая книга отражает все другие, а Бог - её вечный Читатель и Текст", Хорхе Луис Борхес.

"Реальность - это язык, на котором Вселенная наполняется смыслом", Я.

В истории человеческой мысли появление новых концептуальных моделей всегда открывало новые горизонты понимания. От буддийской философии до гелиоцентрической системы Коперника, от психоанализа Фрейда до теории сложных систем - каждая новая "концептуальная линза" позволяла увидеть реальность в ином свете, выявляя прежде скрытые закономерности и связи. Сегодня в нашем распоряжении множество таких линз: синергетика, структурализм и постструктурализм, холизм, теория коэволюции и бесчисленно прочие.

Проблема в том, что освоение каждой новой концептуальной линзы требует значительных интеллектуальных усилий. Мы должны изучить особый язык, систему понятий, методологию применения. Этот высокий барьер входа ограничивает распространение новых способов мышления и восприятия.

Читать далее

Команда разработчиков больше не нужна? Может ли один product engineer писать код с помощью AI

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.9K

AI меняет не только процессы, но и профессии. Полгода назад для того, чтобы запустить MVP продукта, нужен был не только product owner, но и команда разработчиков. Сегодня прототип может сделать один человек без команды, используя только AI. Вы все еще относитесь к этому со скепсисом, но это уже так.

Меня зовут Сергей Спиренков, я евангелист в KODE и CEO собственных проектов. Последние месяцы я провел внутри этой трансформации — собирая продукты в одиночку, без строчек кода руками, с помощью AI и нового подхода к разработке. В статье поделюсь мнением, как изменится профессия product owner и что ждет разработчиков. И главное: расскажу про AI-инструменты, с помощью которых сам делаю MVP продуктов.

Читать далее

Персонализируем контент с помощью ИИ

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров612

Всем привет! Меня зовут Анастасия Шмалько, я лидер команды «Персонализация контента» в кластере Кампании продаж Сбера. В нашем кластере создаётся контент разных видов, но сегодня я расскажу о рекламных SMS. А точнее, о том, как с помощью машинного обучения мы составляем более личные послания каждому адресату. Это помогает нам чаще достигать главной цели — заинтересовать человека, чтобы он перешёл по ссылке и оформил продукт (наши клиенты — это ИП и собственники бизнеса). 

Читать далее

Я знаю, что ты думал в прошлый дейлик

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров1.8K

На входе — обычный push. На выходе — коммит, улучшенный с помощью LLM, сохранённый в векторной базе, доступный для поиска и семантического анализа. Пишем простой MCP-сервер для трекинга изменений ваших проектов.

Читать далее

Ближайшие события

Решалка судоку: сам не представляю, как она у меня получилась

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.9K

В этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.

Читать далее

WorkTeam: новый мультиагентный фреймворк для автоматизации сложных бизнес-процессов

Время на прочтение3 мин
Количество просмотров1.7K

В стремительно меняющемся мире бизнеса автоматизация процессов перестала быть роскошью - сегодня это жизненная необходимость. Представьте, что вы можете переводить даже самые сложные инструкции на привычном человеческом языке напрямую в готовый бизнес-процесс, обходясь без десятков часов ручной разработки и без узкоспециализированных экспертов. Звучит как фантастика? Новая мультиагентная платформа WorkTeam претендует на то, чтобы воплотить это в реальность.

Читать далее

Будни вайбкодинга: лайфхаки при работе с LLM

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров8.8K

Современные LLM давно уже вышли за предел «галлюционнирующей генерации» и дают устойчивую точную генерацию практически на всех популярных языках, фреймворках и библиотеках... При наличии правильного контекста. В большинстве случаев контекст, который вы скармливаете LLM имеет высокую избыточность и низкую концентрацию полезной информации. При нехватке контекстного окна вы практически гарантированно получите низкокачественную галлюцинацию. Что можно сделать в таком случае: обрезается весь ненужный контекст, добавляется весь необходимый. Как это выглядит: вы подготавливаете свой проект в IDE, убирая всё лишнее, и оставляете только самое необходимое, что бы LLM получила весь необходимый контекст и не байтом больше, то есть контекст должен на 100% состоять из полезной информационной нагрузки.

Если есть объёмная база данных — оставьте в ней всего несколько значений для примера. Неиспользуемые в данной конкретной ситуации зависимости так же удаляете из контекста. Если речь о текстовой работе с LLM — то делаете тоже самое в форме промпта или загружаемого текстового файла‑инструкции, подготавливая всё необходимое, т. е., в промпте должно быть описание кодовой базы и окружения, файловая структура, используемый стек, назначение кодовой базы, весь необходимый код всех задействованных файлов, выдаваемые ошибки и прочее. То есть вы должны своими руками построить 100% удобный для работы LLM контекст. Фактически, при данном подходе, вероятность генерации неправильно ответа — околонулевая. Простыми словами — воспринимайте контекстное окно как бутылочное горлышко, через которое необходимо достать информацию из бутылки, то есть из модели.

Читать далее

Попросили нейросеть задать нашим программистам необычные вопросы о разработке в финтехе

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2K

Но это не простые разработчики, а те, кто будет выступать завтра с докладами на нашем ежегодном бесплатном митапе Frontend Mix. 😎 Ребята расскажут про рефакторинг приложений за 10 секунд, стандарты тестирования во фронтенде, анимацию и уязвимости в финтехе. Ссылка на страницу конференции и регистрацию будет ниже, а пока оценим ответы на вопросы ИИ. 👇

Читать далее

Нейро-дайджест: ключевые события мира AI за 14-20 апреля 2025

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров886

Привет!

Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя с 14 по 20 апреля выдалась горячей: революционные LLM от гигантов, прорывы в мультимодальных технологиях, инновационные платформы — всё это я собрал в одном месте. Только самое важное и только то, что реально интересно и полезно. Поехали!

Читать далее

Нейрофизиология внимания: как алгоритмы и мозг обрабатывают первые 3 секунды видео

Время на прочтение2 мин
Количество просмотров842

Биология клипового мышления: почему 400 мс решают всё

Исследования MIT (2023) доказали: мозг принимает решение "смотреть/не смотреть" за 400-800 мс. Это результат эволюции — наши предки оценивали опасность за доли секунды.

Читать далее

Отношения между ИИ и обычной девушкой

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров1.6K

Из всех утюгов звучат новости о появлении новых видов ИИ, нейронных сетей, но как будто хайп спадает, ну есть какой-то сайт, который напишет статью, сделает домашнее задание, запрограммирует простую программу, ну и что? Большинство людей как жили своими жизнями, так и живут и их никак не касается развитие ИИ.

Я тоже так думал, думал что начнется застой в сфере ИИ, но кое что произошло. Я некоторое время назад, разработал Телеграм бота для знакомств, но не просто бота, в нем помимо реальных анкет людей были анкеты "Виртуальных людей", по сути ботов. Разработал я бота просто так, чтобы друзьям показать, поприкалываться. Но мне неделю назад пришло в личку в телеге письмо от незнакомой девушки, которая просила не удалять из бота какую-то анкету. Я сначала не понял, что от меня хотят, но потом как понял... и решил поделиться сообществом тем, что произошло.

Читать далее
1
23 ...