Присоединяйтесь к третьему Cloud․ru Tech Lab: AI&ML — митапу для тех, кто планирует внедрение AI в свои сервисы и не только 🤖
📅 Дата: 24 июля в 18:00 📍 Место: Москва, ул. Большая Почтовая, 40, строение 4, Гоэлро Лофт, зал Tesla, 3-й этаж
Расскажем, как мы автоматизировали пользовательские сценарии с помощью AI-агента, подробно разберем устройство нашего стека (агенты, RAG, Ragas) и объясним, почему сейчас все говорят про Model Context Protocol (MCP) и как собрать MCP-сервер без кода.
В программе:
Как мы встроили AI-агента в онлайн-обучение и улучшили опыт студентов — Стас Гридин, менеджер проектов, и Илья Жбанов, Data Science инженер, Cloud.ru.
Адаптация RAGAS для оценки RAG — Иван Ловцов, старший Data Science инженер.
MCP: почему о нем все говорят? — Игорь Латкин, управляющий партнер и системный архитектор, KTS.
Как мы приручили мультиагентный хаос с A2A — Артемий Мазаев, менеджер продукта, Cloud.ru.
Секретный доклад от приглашенного эксперта.
А еще — демозона AI-решений на базе Cloud.ru Evolution, активности, живой нетворкинг и возможность лично задать вопросы практикам и архитекторам.
Мы предусмотрели два формата участия:
офлайн — для тех, кто планирует лично посетить площадку,
онлайн — для тех, кто хочет посмотреть доклады в записи.
ОТП Банк первым среди ТОП-30 финтех-сайтов внедрил новый стандарт для поискового ИИ
ОТП Банк первым среди топ-30 финтех-сайтов по версии рейтинга Ашманова (отраслевой рейтинг "Финансовые услуги" по видимости в SEO), кто модернизировал свой сайт под новые поисковые ИИ- интерфейсы. Теперь популярные нейронные сети могут корректно использовать данные с otpbank.ru в своих языковых моделях и обновлять их в случае изменений. Проект был реализован при поддержке компании Вебпрактик.
«Рост популярности нейросетей радикально меняет то, как люди ищут информацию: ChatGPT уже занял 5-е место среди самых посещаемых сайтов мира по данным SimilarWeb за май 2025 г. Вслед за пользователями перестраиваются и поисковики — Яндекс добавил «Поиск с Алисой», Google запустил Gemini, предлагая готовые AI-ответы вместо традиционных переходов по ссылкам», - отмечает Виталий Палагин, руководитель SEO-направления ОТП Банка.
Чтобы гарантировать видимость своего контента в новых условиях, ОТП Банк на otpbank.ru внедрил структурированный файл llms.txt — универсальная «карта сайта» для языковых моделей. Он стандартизирует разметку, сокращает риск ошибок интерпретации, ускоряет обновление данных в LLM и повышает шансы сайта быть процитированным напрямую в ответах ChatGPT, Gemini и «Поиска с Алисой».
«Мы уверены, что будущее цифрового поиска напрямую связано с развитием языковых моделей. Наша задача — не просто подстраиваться под тренды, а формировать их: сделать otpbank.ru эталоном открытости для AI-систем. llms.txt поможет ИИ находить свежие данные, поэтому мы можем быть уверены, что клиенты увидят самые актуальные ставки, условия и сервисы банка именно там, где им удобнее всего — в ответах нейросетей», — подчеркивает В. Палагин.
Исследовательская группа Model Evaluation & Threat Research из Калифорнийского университета в Беркли представила новый способ измерения прогресса больших языковых моделей. Вместо привычных метрик вроде точности ответов или скорости генерации учёные предложили другой аспект: сколько времени требуется человеку на задачу, которую ИИ может успешно выполнить хотя бы в 50% случаев?
Согласно расчётам, с каждым годом модели справляются с всё более объёмными задачами, и темп этого роста — экспоненциальный. С 2019 года способности LLM в решении задач улучшаются вдвое каждые 7 месяцев:
GPT-2, вышедший в 2019 году, мог справиться только с ответами на вопросы, что в среднем занимает у человека до минуты;
GPT-4, который появился в 2023, уже мог брать на себя задачу вроде «найти факт в интернете», которая занимает у человека от 8 до 15 минут;
более продвинутые модели вроде Claude 3.7 и OpenAI o1 могут бать на себя задачи, выполнение которых человеком выходит за пределы часа.
Если темпы роста сохранятся, то уже к 2030 году языковые модели смогут решать за часы задачи, которые потребовали бы 167 часов работы человека — это условный месяц работы в графике 5/2. Речь идёт о комплексной интеллектуальной работе: от оптимизации архитектуры кастомного чипа до запуска нового продукта или даже написания содержательной книги.
В исследовании, например, в 167 часов оценена задача открыть новую компанию. Авторы исследования считают, что к 2030 году ИИ сможет браться за такую задачу автономно, то есть не в виде ассистента, а как самостоятельный исполнитель.
Исследование не учитывает внешние ограничивающие факторы, и авторы сами об этом говорят. Даже если ИИ будет таким умным, как его описывают, его возможности могут упереться в вычислительные мощности или доступ к памяти.
Согласно прогнозам экспертов, дата-центры для нужд искусственного интеллекта скоро будут производить выбросов углекислого газа (CO2) больше, чем вся авиационная индустрия в мире.
↗️ Cursor запустил веб-приложение, которое позволяет управлять сетью AI-агентов для программирования прямо из браузера.
↗️ Google представила новые инструменты с искусственным интеллектом для образования. Учителя смогут создавать интерактивные учебные материалы с помощью AI-инструмента Notebook LM. Также для студентов появятся чат-боты, которые помогут в обучении и ответят на вопросы по урокам.
↗️ Представлен полный список увольнений в сфере технологий в 2025 году. В списке представлены увольнения как в крупных компаниях, так и в стартапах, распределённые по месяцам. Это помогает увидеть общую картину изменений на рынке труда в IT-индустрии.
↗️ Songscription запустила сервис с ИИ, который за несколько минут превращает аудиозапись песни в нотную партитуру. Продукт работает по модели freemium и подходит как для профессиональных музыкантов, так и для любителей.
↗️ Apple рассматривает возможность глубокой интеграции технологий искусственного интеллекта от компаний Anthropic и OpenAI для работы Siri. Сейчас Siri уже может обращаться к ChatGPT для сложных вопросов, но новые изменения могут расширить использование сторонних ИИ в голосовом помощнике.
↗️ Cloudflare запустила маркетплейс, который позволяет сайтам взимать плату с ИИ-ботов за сбор данных. Компания обслуживает 20% интернета. Новый сервис дает владельцам сайтов больше контроля над своим контентом и направлен на сотрудничество с ИИ-компаниями.
↗️ Perplexity запускает новый тариф Perplexity Max за $200 в месяц. Подписка дает неограниченный доступ ко всем сервисам и приоритетное использование последних моделей больших языковых моделей (LLM)
↗️ Google объявила о начале глобального запуска новой модели генерации видео Veo 3. Модель стала доступна пользователям Gemini более чем в 159 странах. Veo 3 предназначена для создания видео с помощью искусственного интеллекта
↗️ Sakana AI представила TreeQuest — новую технологию, которая объединяет несколько больших языковых моделей (LLM) для совместной работы над сложными задачами. Используется метод Монте-Карло Tree Search для координации моделей. Команды моделей показывают результат на 30% лучше, чем отдельные LLM
В продолжении серии постов про Claude Desktop MCP Servers.
В этом посте расскажу про первый из 4 серверов, с которыми работаю
Вот какие MCP сервера подключены у меня
🟢 TickTick — мой таск трекер (на чтение и на запись) 🟢 Notion (на чтение и на запись) 🟢 GitHub (на чтение и на запись) 🟢 Google Analytics 4 (только на чтение)
Я пользуюсь им для ведения своих задач. Так как работаю я сам на себя, то трекер это важная часть моей жизни, который у меня в основном выглядит вот так
Первый MCP, с которого я начал свое изучение этой темы — Tick Tick MCP Было интересно сделать себе мини ассистента
Как это работает
У меня есть чат в Claude Desktop, в контекст которого вгружена роль Claude в этом диалоге
Затем в этот чат я пишу, что я хочу, Claude сам понимает, хочу ли я обратиться к TickTick или просто спрашиваю что-то. Если из контекста он понимает, что нужно использовать TickTick, то он вызывает ту функцию, которую примерно определил
Что умеет мой MCP TickTick
Ставить задачи, можно даже на конкретное время
Удалять задачи, переносить задачи
Добавлять описание задачам
Создавать / удалять проекты, группировать задачи по проектам
В среднем, каждый MCP умеет делать то, что в нем написали. И то, насколько богатое API есть у сервиса, к которому будет подключен наш MCP.
Разные энтузиасты могут написать различные MCP для одного и того же сервиса. И все они будут разного уровня глубины и проработки
Какие основные кейсы при работе с TickTick MCP есть у меня
Почти каждую неделю я планирую в воскресенье вечером. Этот процесс у меня в основном происходит внутри ChatGPT, чтобы он был в контексте моих планов
Затем, я закидываю получившийся план в Claude, и прошу поставить мне эти задачи на неделю через TickTick, например, через такой промпт
Вот мой список задач на неделю. К каждой задаче поставь Start Date и End Date в течении следующих 7 дней, учитывая их приоритет. Выполнение каждой задачи в этом списке в среднем должно занимать не больше 3 часов. После каждой задачи ставь буфер в 40 минут. Для каждой задачи можешь примерно добавить Definition of Done Учти, что сейчас я живу в Бангкоке, работаю в среднем с 12 дня до 10 вечера. Суббота и Воскресенье -- не нагружай меня больше чем на 4 часа работы Старайся не допускать накладывания задач на уже существующие задачи
Сначала напиши список и скинь в чат, а затем, после моего аппрува, добавь в TickTick
Это самый частый кейс ⤴️
Иногда закидываю в него разовые задачи
Например, я в Spotify увидел, что недалеко от меня через 2 месяца будет концерт. Я скинул скрин в Claude и попросил, чтобы он собрал инфу о билетах и поставил напоминалку через пару недель
Он задействовал свой deep research и все собрал в задачу. Я потом просто перейду по ссылке и куплю
Или, например.
Мне нужно купить новые кроссовки в диапазоне 200$, скорее всего найк
Поставь это в задачи, и перед этим проанализируй их модельный ряд, сравни с NB, PUMA и Adidas. Выбери топ 3 под мой запрос -- бег по городу, 5-6км в среднем. А затем глянь, есть ли они в Бангкоке
И оформи в задачу, чтобы я через неделю сгонял в магазин
---------
Пока на этом все
Такие черновые посты помогают мне написать большую статью. Но у постов слишком много ограничений. Например -- только одна картинка на весь пост и лимит по символам. Поэтому сделать посты информативными сложно, пусть хотя бы в выгрузке мыслей помогают
Как Новосибирский государственный университет использует ресурсы облака Cloud.ru Evolution для размещения умного чат-бота в Telegram 🎓
Что за компания
Новосибирский государственный университет — пример эффективной интеграции образовательного процесса и научной деятельности. На базе механико-математического факультета НГУ работает лаборатория прикладных цифровых технологий, в которой проводят разработки на базе искусственного интеллекта.
Какая была задача
Один из проектов лаборатории — умный чат-бот в Telegram на базе больших языковых моделей. На сайте университета есть интеллектуальная база знаний, с помощью которой можно найти информацию или ответ на вопрос. Задача бота — упростить и сократить поиск до нескольких секунд.
Команда НГУ искала мощное и выгодное решение для размещения бота, а также тестирования других гипотез.
Как ее решили
Сотрудники НГУ самостоятельно перенесли и развернули проект. Для размещения выбрали виртуальную машину с GPU 4 vCPU/64 ГБ RAM/1 GPU V100 на облачной платформе Cloud.ru Evolution, которая идеально подходит для задач машинного обучения, искусственного интеллекта и обработки трехмерной графики. А еще она позволяет масштабироваться по мере необходимости и использовать ресурсы по модели pay-as-you-go.
Что в результате
Чат-бот помогает решить сразу несколько задач университета:
привлечь абитуриентов,
разгрузить службу поддержки,
упростить поиск изображений по внутренней базе знаний.
Я основатель PrimeWay — сервиса для автоматического запуска и масштабирования ML-задач на GPU без DevOps-рутины. Сейчас мы общаемся с ml инженерами, CTO, data scientist's и другими специалистами, которые сталкиваются с проблемами в ML-инфраструктуре.
Я не хочу показывать продукт или что-то продавать — мы проводим серию коротких интервью (по 30 минут, можно и без созвона, просто текстом в telegram) с разработчиками, чтобы лучше понять их задачи и сложности. Формат простой: 100% про ваши реальные проблемы и задачи. Я задам 5 коротких вопросов, все ответы строго конфиденциальны.
Если готовы — напишите в тг, когда вам будет удобно
⚡️ Создавайте 3D-модели за секунды — просто опишите или загрузите изображение
Как это работает: — Вводите текстовый запрос или загружаете фото — Получаете готовую 3D-модель (с текстурами или в чистом виде) — Оптимизировано для 3D-печати, игр и дизайн-проектов — САМОЕ ГЛАВНОЕ: бесплатно
Забрать имбу можно тут. Если вам и этого мало, то вот больше максимально полезных тулз!
Цукерберг собрал «Мстителей ИИ» из OpenAI, Google и Anthropic, дав им контракты уровня суперзвёзд спорта — до $300 млн за 4 года.
Среди участников — Трапит Бансал, один из ключевых исследователей OpenAI, работавший с Ильёй Суцкевером. Подразделение, получившее название Meta Superintelligence Labs, будет заниматься разработкой AGI-системы и действует как автономная структура с прямым доступом к Цукербергу.
Неизвестно, все ли новые сотрудники получили бонусы по $100 млн. Для понимания — это больше, чем годовые зарплаты CEO Apple, Microsoft и Uber.
Исследование показало, что некоторые учёные начали оставлять в своих научных статьях скрытые промты для ChatGPT, чтобы нейросеть хвалила их работу.
При проверке научного портала arXiv уже нашлись 17 работ от 14 ведущих вузов мира — в каждой статье были скрытые промпты, которые просили ИИ хвалить её и не подсвечивать минусы. Учёные в научных статьях прячут нужный промпт для ИИ в белом тексте минимального размера, а на выходе получают похвалы и восхищение их трудом от «прочитавших» статью ИИ-сервисов.
Если супер просто, то вот что такое MCP сервера внутри Claude Desktop
Прослойка с кодом, которая связывает клиент, например Claude Desktop, и сервис на той стороне
Связывает таким способом, что я могу человеческим языком писать в чат Claude, а эта прослойка сама понимает, какую функцию нужно вызвать
Есть официальные прослойки, которые пишут сами компании. А есть те, которые написаны энтузиастами. К одному MCP серверу, нужному мне, я тоже приложил руку, а точнее форк
Пока что технически установить и подключить эти сервера не так просто, хотя Anthropic, создатели протокола, постоянно думают над упрощением процесса установки и подключения
Вот какие MCP сервера подключены у меня
🟢 Notion (на чтение и на запись) 🟢 GitHub (на чтение и на запись) 🟢 TickTick — мой таск трекер (на чтение и на запись) 🟢 Google Analytics 4 (только на чтение)
Какие сценарии использования есть у меня
MCP Server TickTick — мой сервис для задач
Через подключенный MCP сервер я обычным языком, как живому ассистенту, говорю список задач. Он их может ставить, удалять, передвигать, менять описание и все, что могу делать я.
Например,
Поставь мне вот эти 10 задач на неделю, к каждой напиши Definition of Done и выстави время в течении недели, когда эту задачу лучше сделать, учти зависимости с другими задачами
Или
Передвинь задачи из этого проекта на день вперед, я не успеваю сегодня их сделать
А что у меня сегодня запланировано
В общем, как будто через ассистента задачами управляете
Дальше идет Notion — моя база знаний и хранение всего подряд
Claude через Notion MCP знает все файлы, к которым я дал ему доступ. Может создавать там сложные таблицы и контент, который я его прошу В Notion у него есть доступы к моей таблице управления UTM ссылками, финансовому дашборду и бизнес дашборду.
Во все эти места у Claude есть доступ, и все это он умеет заполнять, пока я просто ему наговариваю, что хочу
Затем — Google Analytics
К моему продукту, гайду по ChatGPT, подключеные две аналитики. Яндекс и Гугл. И вот в Google Analytics мой Claude умеет смотреть.
Может приносить мне инсайты недели, какие источники лучше работают, по каким источникам лучше / хуже удержание и возвращаемость
И последний в списке, но не по значимости — GitHub
Через MCP GitHub я улучшаю мои MCP сервера — если понимаю, что их можно улучшить. Claude сам мне может подсказать, что текущая конфигурация MCP сервера ему не нравится, и предлагает улучшения. Мы с ним делаем форк существующего MCP сервера и улучшаем
Плюс все мои сайты могу создавать напрямую из Claude -> GitHub
Это был краткий экскурс в MCP сервера, надеюсь в течении пары дней я смогу упаковать это в подробный пост 🧑💻
На archive.org выложили еще одну полезную и очень приятную книжку -- букварь по нейронным сетям итальянского исследователя и преподавателя Симона Скардапане (Simone Scardapane), который преподает в университете Sapienza в Риме и сотрудничает в нескольких исследовательских центрах. Называется книжка "Приключения Алисы в дифференциируемой стране чудес" (Alice’s Adventures in a differentiable wonderland). Годится и для преподавания и для самообразования, если математическая подготовка позволяет.
Я читал с удовольствием, чего и вам желаю.
Два линка для получения pdf книжки, но если вас обуяет благодарность к автору, можете и на Амазоне книжку купить.
Узнай, что люди на самом деле думают, а не то что они говорят. Mind Reasoner это инструмент, который выходит за рамки простых резюме встреч.
Приложение позиционируется как инструмент для анализа вербальной и невербальной коммуникации с целью выявления скрытых мыслей, истинных эмоций и убеждений собеседников. Комментарии, как говорится, излишни.
«Эпоха ИИ «доверяй мне» закончилась. Мы были вынуждены создать новый тип интеллекта, потому что существующие модели терпели неудачу, когда на кону стояли доказательства. С Mind Reasoner мы берем тот же стандарт доказуемой истины и применяем его к нашей самой сложной задаче: пониманию себя и друг друга. Мы не просто создаем еще одно приложение; мы предоставляем интеллект, которому вы наконец-то можете доверять».
Основатель, Уэйн Чанг
Созданный на основе новой архитектуры, основанной на фактах, Mind Reasoner дает пользователям ранее невозможную суперспособность: видеть разрыв между тем, что люди говорят, и тем, что они на самом деле имеют в виду, причем каждый такой инсайт подкреплен проверяемым доказательством (декларируют так).
Определенным образом они бросают вызов всем ведущим LLM, особенно лидеру. А состав инвесторов не оставляет никаких сомнений в том, что верят в стартап очень серьезные люди.
Я запросил доступ, жду... выше их собственная оценка по сравнению с о1.
Компания утверждает, что Mind Reasoner идентифицирует более 100 различных метрик, мониторя входящий информационный поток (невысказанные оговорки, подсознательные мотивы итд). Все ответы системы сопровождаются исходными доказательствами, включая конкретные слова и фразы, на основе которых система сделала такие выводы, чтобы предоставить пользователям прослеживаемость и уверенность в тех или иных выводах. Компания называет это «неразрывной цепочкой доказательств».
Бесконтактный полиграф, короче) Большой брат. Все тайное стало явным.
Довольно широкий спектр бизнес-задач можно решать.
***
О новых ИИ бизнес-моделях, нерешенных задачах и ИИ-стартапах: Айвентор и Фред
Предыдущие материалы и выпуски дайджеста, там до сих пор много интересных инсайтов.
Знаю, что у меня есть ребята, которые занимаются или интересуется вайб-кодингом. Для вас полезное видео на YouTube - основное выступление про разработку в эпоху ИИ на мероприятии AI Startup School 17 июня 2025 года. Причем, лекцию читает Андрей Карпаты, сооснователь OpenAI.
Он считает, что мы находимся в «1960-х годах» эры LLM 🙆🏻♀️ В выступлении выделил 3 этапа развития ПО. Рассказал, чему обязательно необходимо учиться современному программисту, в чем основные проблемы современных LLM, психологию взаимодействия с ними, и куда движется software разработка.
Вкратце, Про агентов, он сказал, что:
Лучше предоставлять документацию в машиночитаемом формате, например, Markdown - это мы итак знаем, ибо, читая pdf, агент жрет кредиты как не в себя, плавали-знаем 😅
Заменять в инструкциях фразы «нажмите сюда» на эквивалентные команды (curl), которые может выполнить агент.
И даже пойти дальше и создавать специальные инструменты, которые преобразуют контент (например, репозиторий на GitHub) в формат, удобный для подачи в LLM 🤯
Если хотите узнать что-то новое, то недавно я рассказывал про автоматизацию с помощью AI агентов. Советую чекнуть!
Приснилась сегодня любопытная аналогия, которой захотелось поделиться.
Искусственный интеллект сегодня - это голограмма разума.
Как при создании голограммы световое поле отраженное объектом со всех сторон запечатлеется в виде узора на фотопластинке. Также нейросеть во время обучения собирает воедино самые разные проявления разума (в виде фрагментов датасета) и формирует "узор" в виде матрицы весов нейронов...
Если взглянуть на модель со стороны - то, также как если смотреть на голограмму, будет полное ощущение реального предмета (разума), но "внутри" - никого нет... (пока)
Можно строить аналогию дальше, но это уже совсем ненаучно:)
Такая вот мысль. Прощу прощения если это избитая идея.
Разработчик создал приложение, которое скрывает наружную рекламу — от постеров и баннеров до объявлений на столбах и в газетах.
Программа сканирует окружение и с помощью AR-фильтров «затирает» рекламные элементы прямо в поле зрения — будто у вас личный редактор реальности. Работает на популярных моделях смарт-очков, включая Ray-Ban Meta и XREAL Air.
Наконец-то AdBlock в реальной жизни, еще советую чекнуть топ-3 маркетинговых взрыва июня 2025, может найдете для себя что-то новое!