Машинное обучение *

Основа искусственного интеллекта

Блог компании Альфа-БанкТестирование IT-систем * Машинное обучение *

Как строить эффективное тестирование ИИ-моделей в бигтехе?

Меня зовут Валентин, я — руководитель направления тестирования моделей машинного обучения в Альфа-Банке. Моя команда занимается тестированием ML-моделей и модельных сервисов для наших клиентов уже более четырех лет, и более трех из них я погружен в наши процессы QA.

За несколько лет прошел путь от линейного тестировщика до руководителя команды из 8 человек, и в этой статье рассказываю о своем опыте. О том, как:

начал как единственный тестировщик ML-моделей в Альфа-Банке, совмещая функциональное и нагрузочное тестирование, что оказалось очень сложно из-за ограниченных ресурсов и растущего потока задач,
понял необходимость расширения команды,
столкнулся с выбором между кросс-функциональной командой и специализацией,
продумал подход к делегированию задач,
начал автоматизацию тестирования на основе Postman-коллекций, Pytest и Allure, интегрированную в CI/CD через Jenkins и Airflow, что ускорило и упростило тесты…

Эта статья будет полезна:

• тем, кто только начинает выстраивать процессы тестирования моделей;
• начинающим тимлидам QA-команд до 10 человек;
• тем, кто просто хочет познакомиться с примером организации QA-процесса с нуля.

Читайте: Я управляю тестированием ИИ-моделей 4 года. Что я понял за это время?

Editor_cloud_ru

4 сен в 11:264.6K

Блог компании Cloud.ruIT-инфраструктура * Машинное обучение * Облачные сервисы * Искусственный интеллект

Создайте виртуальную машину в облаке за 1 минуту 30 секунд... с AI-помощником Клаудией 🤖☁️

В скринкасте показали, как развернуть ВМ для чат-бота за полторы минуты. И вы можете сделать так же в личном кабинете Cloud.ru.

Что еще умеет Клаудия:

подбирать для виртуалки нужную конфигурацию, в зависимости от ваших задач;
настраивать мониторинг и алертинг;
давать подсказки для терминала и работать с консолью как co-pilot;
отвечать на вопросы по всем платформам: Evolution, Advanced, VMware;
помогать в FinOps и SRE: мониторить по логам приложения и алерты, искать неэффективно используемые ресурсы и советовать, как все оптимизировать.

✨ Бонусом — до 31 октября 20+ моделей в Evolution Foundation Models будут бесплатными. Протестируйте на своих проектах эмбеддеры, ранжировщики и мощные LLM, например GLM-4.5, Qwen3-235B, Qwen3-Coder или gpt-oss-120b.

denis-19

4 сен в 03:527.9K

Машинное обучение * Управление проектами * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

Инженер Google выпустил бесплатный учебник для всех, кто хочет создавать ИИ-агентов и изучить работу нейросетей. Там собрана вся информация от А до Я про ИИ-агентов, включая продвинутые техники промптинга, тонких настроек, обучение агентов пользоваться браузером с практическими примерами с кодом.

GarantexAi

3 сен в 20:147K

Визуализация данных * Машинное обучение * Исследования и прогнозы в IT *

Moebio Mind — интерактивная визуализация работы языковых моделей

Датавиз-художник Сантьяго Ортис создал интерактивный инструмент Moebio Mind, который показывает, как большие языковые модели генерируют текст. Проект визуализирует вероятностные процессы выбора следующего токена и траектории в многомерном семантическом пространстве.

Принцип работы

Языковая модель назначает вероятность каждому слову (токену), которое может появиться следующим, и повторяет этот процесс до завершения генерации. Moebio Mind демонстрирует этот механизм через несколько визуализаций.

Основные компоненты интерфейса:

Облако слов — размер слова отражает его вероятность появления в контексте
3D-куб связей — показывает взаимосвязи между токенами в семантическом пространстве
Траектории эмбеддингов — пути через 1536-мерное семантическое пространство

Техническая реализация

Для создания визуализации автор использует ChatGPT API, запуская один и тот же промпт сотни раз. Каждый текст имеет эмбеддинг — позицию в 1536-мерном пространстве, которое автор называет семантическим пространством.

Проект показывает траектории генерации: от начального промпта "Intelligence is" через промежуточные состояния "Intelligence is the", "Intelligence is the ability" до полного завершения фразы.

Образовательная ценность

Инструмент решает проблему понимания работы ИИ-систем. Обычно процессы выбора токенов скрыты от пользователя, что создает иллюзию "магии" в работе языковых моделей.

Что можно изучить:

Как модель оценивает вероятности разных продолжений
Почему модель выбирает конкретные слова в контексте
Как семантические связи влияют на генерацию
Принципы работы attention-механизмов в трансформерах

Визуализация помогает разработчикам и исследователям лучше понимать поведение моделей и отлаживать их работу.

Технические особенности

Проект требует значительных вычислительных ресурсов для рендеринга интерактивной 3D-графики и обработки многомерных данных в реальном времени. Автор рекомендует использовать десктопные браузеры из-за высокой нагрузки на GPU.

Архитектура включает:

WebGL для 3D-визуализации
Обработку API-ответов от языковых моделей
Алгоритмы снижения размерности для отображения эмбеддингов
Интерактивные элементы управления траекториями

Контекст и применение

Сантьяго Ортис — известный специалист по интерактивной визуализации данных, создающий проекты на стыке математики, науки и искусства. Moebio Mind продолжает его исследования в области объяснимого ИИ.

Инструмент полезен для:

Образования — понимание принципов работы LLM
Исследований — анализ поведения моделей
Разработки — отладка и оптимизация промптов
Демонстраций — наглядное объяснение ИИ-технологий

Проект показывает важность визуализации для понимания сложных алгоритмических процессов и делает "черный ящик" ИИ более прозрачным.

Editor_cloud_ru

3 сен в 11:574.8K

Блог компании Cloud.ruIT-инфраструктура * Машинное обучение * Облачные сервисы * Искусственный интеллект

LLM и AI-модели для всех и новые возможности AI-помощника в облаке: главные новости с IT-конференции GoCloud Tech 2025 ☁️☁️☁️

Наша IT-конференция в самом разгаре, и мы уже готовы поделиться главными новостями.

Во-первых, делаем LLM доступнее 🤖

До 31 октября 2025 года больше 20 LLM в Evolution Foundation Models можно попробовать бесплатно.

Нам важно, чтобы тестировать и внедрять AI в свои проекты могли компании любого размера. Поэтому с 1 ноября 2025 года объявляем доступные цены на открытые языковые модели в Evolution Foundation Models.

Вы сможете использовать популярные модели:

GLM-4.5 — 55 рублей за миллион входных токенов и 220 рублей за миллион выходных токенов;
Qwen3-235B — 17 и 50 рублей;
Qwen3-Coder — 40 и 80 рублей.

При этом средняя цена составит:

35 рублей за миллион входных токенов,
70 рублей за миллион выходных токенов.

Во-вторых, расширяем возможности нашего AI-помощника Клаудии 🤖

Теперь Клаудия может помогать с FinOps и SRE. Возьмет на себя:

мониторинг приложений и алертов по логам;
поиск неэффективно используемых ресурсов и формирование рекомендаций по оптимизации.

Помимо этого, AI-помощник уже умеет подбирать сервисы и конфигурации под задачу, разворачивать виртуальные машины, работать с консолью в режиме co-pilot, настраивать мониторинг и алерты.

Немного статистики за пару месяцев работы AI-помощника:

больше 4 000 пользователей обратились к Клаудии,
свыше 12 000 сообщений отправили,
в 15 раз ускорили рутинные операции.

✨ Самый популярный сценарий использования помощника — создание виртуальной машины под веб-серверы, сайты, Telegram-боты, тестовые окружения, веб-хостинг и другие pet-проекты. Раньше это занимало от 5 до 30 минут, а с Клаудией можно запустить ВМ за пару минут.

Если еще не тестировали нашего AI-помощника, переходите в личный кабинет Cloud.ru и ищите Клаудию в нижнем правом углу главной страницы.

atomlib

2 сен в 22:309K

Занимательные задачкиМатематика * Машинное обучение * Карьера в IT-индустрииNatural Language Processing *

«В Сан-Франциско самые аутичные рекламные щиты», — написал Габриэль Питерссон, работающий в OpenAI инженер программного обеспечения и исследователь ИИ. К твиту он приложил фотографию билборда, который удостоился такой характеристики.

Что тут происходит, догадаться легко. Знакомый с заменой текста токенами глаз сразу поймёт, что здесь перечислены номера токенов какой-то языковой модели. Но какой? Опытным путём удаётся установить, что это токенизатор GPT-4o, на данный момент самой популярной модели OpenAI. Номеру 64659 соответствует слово listen, 123310 — .ai, 75584 — /p и так далее. (Вернее сказать, что словам соответствуют токены. Обычно онлайн-инструменты предлагают оценить число токенов для кодирования текста, и найти инструмент для обратного преобразования — та ещё морока).

В результате получается полный УРЛ. По ссылке https://listenlabs.ai/puzzle стоит редирект на berghain.challenges.listenlabs.ai. На этой странице перечисляются правила игры Berghain Challenge: предлагают разработать алгоритм фейс-контроля, где с минимальным числом отказов нужно набрать зал из 1000 человек при множестве долевых ограничений («не менее 40 % берлинцев», «не менее 80% в чёрном» и так далее). Посетители приходят по одному, решение нужно принимать сразу, поток с известными частотами и корреляциями. Сценариев игры три. Людей придёт 20 тысяч, и если зал не набран — проигрыш.

Кроме условий и формы для регистрации для участия в челлендже на странице ведётся таблица со счётом. Как видно, уже больше тысячи человек попытались решить задачу. В таблице также указан результат модели ChatGPT-5 Pro, и лишь двое человек превзошли решение этой языковой модели.

Челлендж работает до 6 утра 15 сентября по часовому поясу Лос-Анджелеса. Победителя на самолёте отправят в Berghain, где подвергнут собеседованию в стартап Listen Labs. Формулировка непонятная — это будет билет в одноимённый берлинский ночной клуб, известный своим строжайшим фейс-контролем, или просто указание на пропуск нескольких раундов собесов? Впрочем, как поясняет сооснователь Listen Labs, это действительно будет вылет в Берлин.

Кстати, тема игры соответствует деятельности стартапа: в нём разрабатывают ИИ-модератора для качественных исследований, то есть бота, который сам проводит интервью с пользователями и суммирует инсайты.

На самом деле искать инженеров для найма таким способом — идея не новая. В комментариях к твиту вспомнили похожий билборд Google, доменное имя которого состояло из первого простого числа из 10 цифр, встречающихся в бесконечной последовательности после запятой у числа . Это было давно, в 2004 году, когда компания была куда меньше. Другой микроблогер замечает, что эти соревнования не только работают как критерий отбора, но и отлично привлекают соискателей особого склада ума.

+12

GarantexAi

2 сен в 18:317.1K

Алгоритмы * Машинное обучение * Исследования и прогнозы в IT *

Sapient представил HRM — ИИ-модель, имитирующую структуру мышления человека

Сингапурский стартап Sapient Intelligence выпустил в открытый доступ Hierarchical Reasoning Model (HRM) — архитектуру нейросети, основанную на принципах работы человеческого мозга. Модель с 27 миллионами параметров обучается на 1000 примерах и превосходит крупные языковые модели в задачах логического мышления.

Архитектура системы

HRM состоит из двух связанных рекуррентных модулей: высокоуровневого (H) для абстрактного планирования и низкоуровневого (L) для быстрых детальных вычислений. Такая структура позволяет избежать быстрой сходимости стандартных архитектур.

Принцип работы основан на двух типах мышления:

Абстрактное планирование — формирует общую стратегию решения
Детальные вычисления — обрабатывает конкретные операции и нюансы

Архитектура вдохновлена тем, как человеческий мозг использует отдельные системы для медленного обдуманного планирования и быстрых интуитивных вычислений. Это кардинально отличается от chain-of-thought подхода современных LLM.

Результаты тестирования

Модель достигает практически идеальных результатов, используя всего 27 миллионов параметров и около 1000 обучающих примеров без предобучения. Для сравнения — GPT-4 содержит триллионы параметров.

Benchmark ARC-AGI (оценка общего интеллекта):

Sapient HRM — 40,3%
o3-mini-high — 34,5%
Claude Sonnet — 21,2%
DeepSeek-R1 — 15,8%

Система превзошла ведущие LLM в сложном для ИИ бенчмарке, который считается одним из наиболее требовательных тестов рассуждения.

Технические преимущества

Эффективность обучения: Модель требует в разы меньше данных и памяти по сравнению с современными LLM. Это решает проблему растущих требований к вычислительным ресурсам.

Специализация задач: Иерархическая структура позволяет оптимизировать обработку разных типов задач — от судоку и лабиринтов до стратегического планирования.

Стабильность обучения: Архитектура обеспечивает устойчивость тренировки при значительной вычислительной глубине.

Практическое применение

HRM показывает эффективность в задачах, требующих пошагового логического анализа:

Решение головоломок и математических задач
Навигация в сложных средах
Стратегическое планирование
Анализ паттернов и закономерностей

Код модели опубликован на GitHub, что позволяет исследователям воспроизвести результаты и развивать архитектуру.

Значение для отрасли

Если результаты Sapient подтвердятся независимыми исследованиями, это может изменить вектор развития ИИ. Вместо наращивания параметров и данных фокус сместится на архитектурные инновации, вдохновленные нейробиологией.

Подход демонстрирует альтернативу гонке масштабирования — создание специализированных, эффективных моделей для конкретных классов задач.

Editor_cloud_ru

2 сен в 13:215.5K

Блог компании Cloud.ruIT-инфраструктура * Машинное обучение * Облачные сервисы * Искусственный интеллект

Успей зарегистрироваться на GoCloud Tech 2025 — IT-конференцию про AI, облачную инфраструктуру и работу с данными ☁️ + 🤖 + 💿

Привет! Регистрация закроется 2 сентября в 17:00 по мск, так что еще есть возможность влететь в последний поезд и попасть на самое технологическое событие этой осени — IT-конференцию о создании решений на базе AI и облаков.

Напомним, что вас ждет:

4 трека: AI&ML, Cloud Infrastructure, Data&Analytics, Dev Platform Services;
демо и интерактивные зоны новых AI-сервисов и сервисов платформы Cloud․ru Evolution;
технические воркшопы;
нетворкинг, кастомный мерч и afterparty.

Основные темы конференции:

кейсы внедрения AI&ML,
тренды в создании облачной инфраструктуры,
актуальные практики для работы с данными в облаке,
инструменты, ускоряющие разработку.

📆 Когда: 3 сентября

📍 Где: в Лофт-пространстве Goelro в Москве + трек «AI&ML» онлайн

Зарегистрироваться 👈

Будем рады видеть всех причастных!

andre_dataist

1 сен в 09:394.6K

Машинное обучение * Искусственный интеллект

Как собрать личного бизнес-ассистента в Telegram с n8n

Я подготовил пошаговый разбор того, как за 15 минут развернуть ИИ-агента, который ведет заметки, ставит задачи, бронирует встречи, а также присылает последние новости из ваших источников.

В видео вы узнаете:

• Из каких частей состоит ИИ-агент и что он умеет;

• Как настраивать интеграции с Telegram, OpenAI и Google-сервисами;

• Как сделать флоу агента для администратора в роли личного секретаря;

• Как собрать флоу агента для консультаций клиентов или коллег;

• Как подключить RAG-систему для более точных ответов, используя загруженную информацию.

Такой Telegram-ассистент поможет автоматизировать рутину, разгрузить голову, ускорить работу и быть в курсе последних новостей своей индустрии. Также отправляю готовый шаблон, чтобы вы могли протестировать агента у себя.

Что нужно сделать, чтобы всё заработало:

1. Импортируйте шаблон в n8n (содержимое JSON можно просто скопировать в рабочую среду).

2. Вставьте свои ключи: OpenAI, Telegram-бота и Google.

3. Укажите ID таблиц, календаря, пользователя в условном операторе и канала.

4. Добавьте свои статьи, документы или книги в RAG — и готово.

Это быстрый способ вкатиться в автоматизацию на n8n и почувствовать, как ИИ реально экономит время и делает работу удобнее. Если давно хотели попробовать собрать собственного ИИ-агента, но не знали, с чего начать — это отличный старт.

В следующем видео разберем больше сценариев и расширим функциональность нашего агента. Подписывайтесь на Youtube-канал, если хотите видеть чаще подобный контент.

GarantexAi

31 авг в 17:388.5K

Веб-дизайн * Машинное обучение *

Genspark запустил AI Designer для автоматической генерации брендинга

Компания Genspark представила AI Designer — инструмент, который создает полную систему брендинга от логотипа до веб-сайта по одному текстовому запросу. Новинка интегрирована в экосистему Genspark Super Agent и доступна бесплатно через веб-интерфейс.

Архитектура и возможности

AI Designer работает через агентскую архитектуру Genspark, планируя задачи и распределяя их между специализированными модулями. Система создает согласованные дизайн-активы без необходимости ручной координации между различными инструментами.

Генерируемые материалы включают:

Логотипы и цветовые палитры
Дизайн интерьеров и упаковки
Веб-сайты и лендинги
Рекламные макеты
Контент для социальных сетей

Система объединяет несколько экспертных агентов и множество инструментов для выполнения процесса от начала до конца. Это позволяет избежать переключения между разными сервисами и сократить циклы правок.

Техническая реализация

Платформа Genspark использует девять специализированных больших языковых моделей и более 80 интегрированных инструментов, динамически распределяя задачи между ними. AI Designer расширяет этот подход на область визуального дизайна и брендинга.

Особенность системы — шаблоны, которые отличаются от стандартных решений типа Canva образца 2010-х годов. Алгоритм адаптирует дизайн под конкретную задачу, а не использует готовые шаблоны.

Практическое применение

Ранние тесты сообщества показали способность инструмента создавать полные бренды за несколько минут, включая фирменный стиль, упаковку, меню и веб-макеты. Это делает решение полезным для стартапов и малого бизнеса, которым нужен быстрый результат без привлечения дизайн-команды.

Целевая аудитория:

Основатели стартапов
Маркетологи
Малый и средний бизнес
Команды, требующие быстрого создания брендинга

Контекст и конкуренция

Genspark позиционируется как поисковая система нового поколения с ИИ-агентами, которые глубоко понимают намерения пользователя и выполняют задачи от планирования до создания мультимедиа. AI Designer — логичное развитие этой концепции в сторону автоматизации креативных процессов.

Решение конкурирует с такими сервисами как Midjourney для генерации изображений и Canva для дизайна, но предлагает комплексный подход к созданию брендинга.

Доступность

Инструмент запущен в веб-приложении Genspark с функцией мгновенного доступа. Сохраняется бесплатная модель использования, что выделяет сервис на фоне конкурентов с платной подпиской.

denis-19

31 авг в 16:588.9K

Машинное обучение * Учебный процесс в ITИскусственный интеллект

Представлен открытый проект abogen для превращения любой книги в аудиокнигу. Поддерживает много языков, качественные голоса от одной из лучших моделей KokoroTTS. Если никакой голос не подходит — можно создать свой. Простая установка.

denis-19

31 авг в 14:438.5K

Машинное обучение * РобототехникаБудущее здесьУрбанизм

Инженеры из Гонконга разработали робота‑прыгуна, способного прыгать с грузом в девять раз тяжелее себя. Устройство представляет собой квадрокоптер с закреплённой снизу ножкой, оснащённой пружиной. Двигатели коптера ускоряются по направлению к земле, что позволяет скакуну запасать больше энергии для прыжка. Благодаря этому робот массой всего 220 граммов может переносить на себе груз весом два килограмма. Чтобы робот не терял равновесие и не падал, его бортовой компьютер оснастили нейросетью. Она в реальном времени вычисляет, под каким углом и с какой ориентацией аппарату следует приземлиться.

denis-19

30 авг в 16:507.1K

Машинное обучение * Управление персоналом * Карьера в IT-индустрииИскусственный интеллектФинансы в IT

Бывший топ-менеджер OpenAI и Facebook Питер Денг рассказал, что борьба за специалистов в сфере искусственного интеллекта ведет к все большему разрыву в зарплатах между исследователями и другими сотрудниками технологических компаний.

В подкасте Unsupervised Learning Денг пояснил, что компенсации ведущих специалистов растут стремительно, в то время как многие другие сотрудники, также вносящие значимый вклад в продукты и развитие компаний, получают существенно меньше. По словам Денга, «HR-отделам придётся в какой-то момент заняться этой проблемой».

Денг сравнил ведущих исследователей ИИ со спортивными звёздами, за которых IT-компании ведут ожесточённую борьбу. Подобные специалисты получают многомиллионные контракты и предложения от крупнейших игроков — OpenA, Anthropic, Perplexity, xAI и других. Аналогии со спортом звучат все чаще: вице-президент по ИИ в Databricks Навин Рао ранее называл таких учёных «Лебронами Джеймсами» мира технологий.

Однако за пределами «первой лиги» остаётся большое количество инженеров и специалистов, чьи доходы несопоставимы с уровнем ведущих исследователей. Это создаёт риск недовольства и дисбаланса внутри компаний.

GarantexAi

30 авг в 09:535.3K

Обработка изображений * Машинное обучение * Искусственный интеллект

AI-синхронизация губ: от Wav2Lip до коммерческих решений

Технологии автоматической синхронизации движений губ с аудио перешли от исследовательских проектов к готовым продуктам. Современные сервисы создают реалистичное видео за секунды, где персонаж произносит любой текст с сохранением деталей лица.

Ключевые прорывы

Wav2Lip (2020, IIT Hyderabad) стал первой моделью, работающей без предварительного обучения на конкретном человеке. Исследование показало возможность генерации синхронизированного видео на основе GAN-архитектуры с дискриминатором, обученным отличать реальные движения губ от синтетических.

FaceFormer от Microsoft Research (2022) применил трансформерную архитектуру. Модель использует 6-слойный Transformer для обработки MFCC-признаков аудио и генерирует 768 3D-точек лицевых landmarks с учетом временных зависимостей.

Коммерческие решения

Lipsync 2.0 от Sync Labs работает как zero-shot модель без настройки. Поддерживает обработку видео с несколькими говорящими в кадре.

D-ID Creative Reality Studio генерирует говорящие аватары из статичных фото, ограничен 5-минутными роликами в базовой версии.

Synthesia ориентирована на корпоративный сегмент с готовыми AI-аватарами. Стоимость от $30/месяц за 10 минут видео.

Технические характеристики

Производительность:

CPU Intel i7: 1 секунда видео за 30-45 секунд обработки
GPU RTX 3060: соотношение 1:3
GPU RTX 4090: близко к real-time (1:1.2)

Метрики качества:

LSE-D (точность синхронизации): лучшие модели <8.0
SSIM (сохранение деталей): целевое значение >0.85
FID (реалистичность): оценка качества генерации

Практические применения

Стриминговые платформы: Netflix автоматизирует дубляж сериалов, сокращая локализацию с 3-6 месяцев до 2-3 недель.

Образование: Coursera тестирует многоязычные версии курсов с автоматической синхронизацией губ преподавателей.

Соцсети: TikTok экспериментирует с автопереводом популярных роликов, YouTube Creator Studio планирует функцию автодубляжа к 2026 году.

Ограничения

Качество исходного материала: требует четкого видео минимум 256×256px с углом поворота головы ±30° от фронтального.

Языковые особенности: модели обучены на английском. Для агглютинативных языков (финский, турецкий) точность падает на 15-20%.

Детекция артефактов: современные детекторы находят AI-генерацию с точностью до 95% (FakeSpotter — 94.2%, Microsoft Video Authenticator — 91.8%).

Открытые инструменты

Wav2Lip GitHub — базовая модель с предобученными весами
FaceFormer — трансформерная архитектура
Google Colab notebooks для экспериментов без установки зависимостей

Следующее поколение моделей будет работать в реальном времени для видеозвонков и включать генерацию жестов, синхронизированных с речью.

denis-19

30 авг в 06:234.9K

Обработка изображений * Машинное обучение * Облачные сервисы * Искусственный интеллект

Представлен сервис Kira.art, который позволяет редактировать картинки прямо в чате. Все просто: грузим картинку и описываем, что хотим получить. Никаких кистей, слоёв и прочих инструментов. Можно поменять оттенок глаз на фото, добавить или удалить фон и другие предметы, создать арт или стилизовать пикчу, например, в аниме. Внутри также есть встроенный апскейлер — бустануть качество фото можно в несколько раз. Никаких сложных промптов, диалог идёт на естественном языке.

denis-19

29 авг в 16:349.8K

Поисковые технологии * Машинное обучение * Искусственный интеллектСоциальные сетиБудущее здесь

С учётом бурного роста популярности чат‑ботов вроде ChatGPT и того, что некоторые пользователи склонны слишком доверять информации, которую такие инструменты выдают, интересно посмотреть, откуда они её берут. Такие данные (по состоянию на июнь) есть у аналитиков Semrush по 150 тысячам цитирований.

В Visual Capitalist представили инфографику с ресурсами в сети Интернет, на которые чаще всего ссылаются ИИ‑модели вроде чат‑ботов ChatGPT. Некоторые пользователи склонны слишком доверять информации, которую такие инструменты выдают по запросу к ИИ-системам.

Самым популярным источником знаний для ИИ оказался Reddit — форум упоминается в 40% цитат. За ним с большим отрывом идёт «Википедия», дальше — YouTube и Google.

Оказалось, что ИИ-системы в основном модели полагаются на дискуссии на форумах и контент, курируемый сообществами модераторов, отмечают в Visual Capitalist. В связи с этим есть риск, что распространённые там взгляды, неточности и предвзятости могут перекочевать в ответы моделей и распространиться ещё шире.

Editor_cloud_ru

29 авг в 13:445.8K

Блог компании Cloud.ruIT-инфраструктура * Машинное обучение * Облачные сервисы * Искусственный интеллект

Валидация RAG с помощью RAGAS — доклад на IT-конференции GoCloud Tech 2025 ☁️

Retrieval-Augmented Generation — мощный инструмент, но вы уверены, что ваш RAG действительно работает? RAGAS — это метрика, которая даст ответ. По ходу доклада разберемся, как оценивать качество генерации, релевантность документов и достоверность ответов. Поговорим о метриках и пайплайнах, а также покажем, как найти слабые места в RAG-системе до того, как это сделает пользователь.

Трек: AI&ML — про AI-продукты нашей разработки и работу с GenAI. Узнаете, как устроены RAG-системы и мультиагентные ассистенты, а также, для чего они уже применяются и как начать их использовать.

📅 Когда: 3 сентября в 12:00 мск

👉 Зарегистрироваться

Что еще интересного будет на GoCloud Tech, смотрите в программе конференции.

denis-19

29 авг в 10:115.1K

Машинное обучение * Учебный процесс в ITУправление персоналом * Карьера в IT-индустрииИскусственный интеллект

Исследователи из Чикагского и Роттердамского университетов выяснили на базе изучения данных 67 тыс. собеседований, что при большой загрузке и текучке голосовые ИИ‑агенты более эффективно отбирают кандидатов на работу, чем люди.

Проблема человеческого фактора в рекрутинге — это усталость, предвзятость и непоследовательность.

Рекрутеры‑люди могут забывать задавать ключевые вопросы, особенно при массовом подборе. Исследование показало, что ИИ‑агенты, в отличие от людей, всегда придерживаются сценария, охватывая значительно больше важных тем. В результате у нанимающих менеджеров оказывается больше релевантной информации для принятия решения, а усталость, предвзятость и непоследовательность рекрутёров‑людей наоборот игнорируется с помощью ИИ.

Хотя ИИ‑агенты ускорили процесс назначения собеседований, рекрутерам‑людям требовалось в два раза больше времени на проверку результатов таких интервью. Выгода от использования ИИ в рекрутинге зависит от масштаба. Для крупных компаний с большим потоком кандидатов и высокими зарплатами рекрутеров экономия может быть значительной. Кроме того, более качественный подбор снижает текучесть кадров, что особенно важно в таких отраслях, как колл‑центры.

andre_dataist

29 авг в 08:204.9K

Машинное обучение * Искусственный интеллект

«‎ИИ не существует» или пять опасных заблуждений про ИИ, которые тормозят технологический прогресс

Когда речь заходит о внедрении ИИ, всегда находятся скептики. Они повторяют одни и те же фразы: на первый взгляд логичные, но на деле — тормозящие развитие. Такие установки демотивируют команды и мешают компаниям трансформироваться. Разберем пять самых популярных.

1. «ИИ — это просто статистика»

На первый взгляд — так и есть: нейросети действительно основаны на математике и вероятностях. Но по сути похожим образом работает и человеческий мозг: мы тоже оцениваем вероятности, ищем закономерности и строим прогнозы, хотя используем иной тип вычислений. Наш мозг до сих пор остается большой загадкой, а нейросети можно рассматривать как лабораторный макет мышления — упрощенный, но доступный для изучения.

Так современные исследования показывают, что модели обладают эмерджентными свойствами: они решают задачи, которым их не учили, а в скрытых слоях формируются целые стратегии. Да, «это просто статистика», но именно статистика лежит в основе прогноза погоды, медицины и экономики — и мы доверяем ей, потому что она видит больше, чем человек. И вот главный вопрос: когда машина учится понимать и предсказывать мир, чем ее деятельность принципиально отличается от нашей?

2. «Это все хайп, скоро пройдет и пузырь лопнет»

Удобно: можно ничего не менять и остаться в зоне комфорта. Но ИИ уже встроен в повседневную жизнь — от рекомендательных систем до банковского скоринга. Да, вокруг ИИ действительно завышенные ожидания — так всегда бывает с новыми технологиями (см. кривую Gartner). Но хайп не отменяет того факта, что компании уже перестраивают процессы и продукты, а выгоды измеряются миллиардами долларов. Подождать пару лет — значит отстать навсегда. Что опаснее — переоценить возможности ИИ или проспать момент, когда конкуренты перестроят рынок?

3. «Нейросети все равно ошибаются»

Да, ошибаются. Но и люди ошибаются — зачастую даже чаще. Отличие в том, что модели работают быстрее и дешевле. Ошибки — не повод отказываться от ИИ, а часть рабочего процесса. Грамотный подход — строить систему, в которой ИИ делает 80% работы, а человек проверяет критические 20%. Те, кто осваивает такие гибридные процессы, вырываются вперед. Кто победит — тот, кто ждет безошибочный ИИ, или тот, кто учится работать с его ошибками?

4. ИИ обесценивает опыт и знания людей

Люди подсознательно боятся, что машина быстро осваивает то, на что раньше уходили годы учебы и работы. Во время первой промышленной революции ткачи разрушали станки, боясь потерять работу. Но ИИ не обесценивает опыт — он меняет роли. Тогда исчезли ткачи, но появились инженеры, а сегодня ИИ забирает на себя рутину и освобождает место для управленческих и творческих задач. Ответственность все равно остается за человеком, а ИИ — лишь инструмент. Разве инструмент, который расширяет возможности мастера, обесценивает его опыт?

5. Российский контекст

В России нет полноценных LLM уровня флагманских моделей от OpenAI и Anthropic. Импортозамещение пока невозможно: собрать качественный датасет на русском сложно, вычислительные мощности ограничены санкциями, а многие таланты работают на западные компании. Доступ к зарубежным решениям закрыт, а открытые модели не дотягивают до флагманских. Если догнать в лоб нельзя, не пора ли проявить смекалку: научиться синтезировать данные и обучать модели децентрализованно?

Главная причина отрицания ИИ кроется не в самой технологии, а в человеке. Нам проще быть в зоне комфорта, но признать сегодняшнюю значимость ИИ — значит признать необходимость учиться и перестраивать привычный процесс работы. Это требует усилий, а мозг всегда ищет путь экономии. Иллюзия комфорта опаснее всего: она оборачивается отставанием — личным, профессиональным и национальным.

Будущее у нас заберет не ИИ, а привычка жить прошлым и отрицать перемены.

***

Если вы не хотите отставать от прогресса и смотрите в будущее — подписывайтесь на мой TG-канал, где я рассказываю как работают все эти ИИ-чудеса и как внедрять ИИ в бизнес.

SofiaShpak

28 авг в 11:085.5K

Блог компании SelectelBig Data * Машинное обучение * Управление проектами * Data Engineering *

ML Impact — рассказываем, как компании внедряют ML и что из этого получается

Мы запустили ресурс о том, как эффективно использовать искусственный интеллект в рабочих задачах. Уже доступны материалы про настоящую роль ИИ в автоматизации и работу EDGE AI. Скоро появятся новые статьи!

Их можно использовать, чтобы обосновать коллегам или руководству целесообразность запуска ML-проекта. У вас под рукой будет готовый ресурс, которым можно просто поделиться — вместо тысячи слов и долгих объяснений.

Перейти в ML Impact

1 2 ...

7 8

10 11 ...

34 35

Машинное обучение *

Ближайшие события

Вклад авторов