Как стать автором
Обновить
725.18

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Вышла нейросеть для расшифровки скриншотов — Snippai. Работает Gemini или GPT-4. Умеет перегонять формулы со скринов в LaTeX-формат, решать задачи и примеры, генерировать код по скринам или тексту, преобразовывать таблицы в Markdown, извлекать, переводить и пояснять текст. Доступна на macOS, Windows и Linux.

Теги:
+3
Комментарии0

АГЕНТНАЯ ЭКОНОМИКА. Микро-дайджест недели. Интересные мысли.

Дайджест по материалам Fast Company, Venture Beat, The Atlantic, 

Как Open AI страхуется от возможного замедления интереса со стороны инвесторов к появлению AGI и ASI

OpenAI представляет собой ярчайший пример того, как компании, ориентированные на искусственный интеллект, могут эволюционировать, чтобы выжить

Самые мощные технологические компании добиваются успеха не только благодаря своим индивидуальным программным продуктам и гаджетам, но и за счет создания экосистем связанных сервисов.

OpenAI можно рассматривать как еще одну технологическую компанию, идущую по стопам Meta, Apple и Google, стремящуюся не просто вдохновлять пользователей новыми открытиями, но и удерживать их в линейке бесконечно обновляемых продуктов.

А это значит ровно то, что они способны убить немало стартапов своими планами развития.

С другой стороны, AGI это довольно условный термин...

Если бы показать сегодняшний Chat GPT людям в 2020 году, многие бы тогда сказали, что это AGI.

По сути Сэм Альтман в своем интервью на Snowflake Summit 2025 говорит, что кривая роста когнитивности моделей останется в том виде в котором мы ее наблюдали последние годы, по крайней мере в течение следующих 5 лет. Я давал ссылку на это интервью в прошлом дайджесте, прочитайте, там очень много интересных мыслей.

В тоже время, откуда совсем не ждали:

Даже если волна ИИ не заменит вас и вашу роль, она может заменить место вашей работы.

Бизнес может попасть под гораздо больший удар, чем сами люди. Т.е. потерять работу можно быстрее не потому что вас сократят, а потому что у компании, в которой вы работаете, какой-нибудь Айвентор (технологический предприниматель нового поколения) просто отберет долю рынка. AI isn’t coming for your job, it's coming for your company

Старый интернет был создан для людей. Новый будет создан для ИИ-агентов. 

Агенты уже пытаются работать в мире, созданном человеком. Нажимают кнопки. Перетаскивают курсоры. Заполняют формы. 

Но это как надеть на робота перчатку и сказать ему притвориться, что у него есть пальцы. Пока это работает, но это дико неэффективно!

Потому что через пять лет это будет не человек, нажимающий «купить сейчас». Это будет ваш агент на базе искусственного интеллекта, действующий от вашего имени, принимающий сотни решений в день, и не только о покупках, но и о планировании встреч, бронировании поездок, просмотре контента и обсуждении услуг во всех областях цифровой жизни. Agent-based computing is outgrowing the web as we know it

Уже писал об этом пару недель назад, и эта тема оч активно развивается в сети.

Подписывайтесь, чтобы не пропустить дайджест в ленте, если такие мысли по теме вам интересны. Я пока экспериментирую со временем публикаций.

Теги:
+8
Комментарии0

С начала года Anthropic тестирует Claude Code — терминального агента для программирования на больших языковых моделях. Совсем недавно, 4 июня, инструмент добавили в подписки Pro и Max. Энтузиасты с удовольствием принялись тестировать продукт.

Как на личном примере показал микроблогер snwy, не обходится без курьёзов. Как утверждает программист, он попросил агента исправить баг парсера и прилёг. Когда энтузиаст вновь подошёл к компьютеру, Mac уже не загружался, выдавая ошибку об отсутствии операционной системы.

Вероятно, Claude Code дохимичился до того, что снёс содержимое системного диска. Что конкретно случилось, автор твитов не рассказывает. Указывается лишь, что на этой машине утилита для выполнения команд с полномочиями суперпользователя sudo была настроена с директивой NOPASSWD, чтобы при вызове команды пароль вводить не приходилось.

snwy

К происшествию snwy отнёсся с явным юмором. Он в шутку пообещал добраться до штаб-квартиры Anthropic и надрать Claude зад.

Теги:
+2
Комментарии0

Исследование показало, что искусственный интеллект может создавать смешные интернет-мемы, но самые остроумные шутки по-прежнему придумывают люди. Учёные сравнили мемы, созданные людьми, искусственным интеллектом и в сотрудничестве человека с ИИ. Результаты показали, что у машин есть потенциал, но человеческая интуиция в юморе пока незаменима.

Суть проблемы заключается в понимании границ креативности ИИ. Может ли машина по-настоящему понять культурный контекст, иронию и нюансы, необходимые для качественного юмора? Исследователи из Технологического института KTH, Мюнхенского университета Людвига‑Максимилиана и Дармштадтского технического университета провели масштабный эксперимент для ответа на этот вопрос.

В ходе исследования три группы участников создавали мемы. Первая группа состояла только из людей, вторая использовала языковую модель для генерации мемов, а третья совмещала работу человека и ИИ. Затем почти 100 человек оценивали созданные мемы по креативности, юмору и желанию поделиться. В среднем мемы, полностью созданные ИИ, получили более высокие оценки.

Однако самые смешные и запоминающиеся отдельные мемы были созданы людьми. В то же время, совместная работа человека и ИИ привела к появлению наиболее креативных и виральных мемов. Это говорит о том, что ИИ отлично справляется с генерацией большого количества идей, но человеческое участие необходимо для отбора и доработки лучшего контента.

Теги:
+1
Комментарии2

Представлен ультимативный бесплатный гайд по вайб-кодингу, в котором есть всё. Автор — ведущий инженер Google. Внутри проекта описаны лучшие техники промптинга, готовые шаблоны, фреймворки, сценарии — всё продумано до мелочей. Там нет устаревших советов, всё подогнано под новейшие модели и ИИ-сервисы.

Теги:
+1
Комментарии4

Привет, меня зовут Александр, я аналитик в Альфа-Банке. Однажды я устал, что на Feature Store, на платформе для дата-инженеров (DE) и дата-саентистов (DS), невозможно ничего найти.

Поиск по контексту отсутствует. Приходится руками шерстить огромное количество ETL-проектов в поисках той самой полезной информации, полагаясь сначала на удачу, а после — на опыт и помощь коллег. 

Feature Store сама по себе — платформа, которая должна упрощать работу коллег с большими данными, упрощает бюрократию жизненного цикла создания ETL, ввода моделей в промышленную эксплуатацию. Но какой же поиск там...В общем, хотелось бы улучшить процесс по поиску данных в ней.

И я сделал MVP с GPT-2: весит около ~400 МБ и, самое главное, не требует регистрации. В статье пошагово описал, как всё прикрутить. Заходите почитать.

Примечание. Для прома MVP, конечно, не прокатит, но после показа решения начали реализовывать решение на OpenSearch.

Теги:
+3
Комментарии1

RPA 2025: Как программные роботы меняют бизнес уже сегодня

ITFB Group и Primo RPA приглашают на вебинар, посвященный роботизации бизнес-процессов в 2025 году.

Когда: 10 июня, 11:00

Формат: онлайн

➡️ Зарегистрироваться

Технологии RPA стремительно меняются, и мы разберём, как максимально эффективно использовать их сегодня.

Обсудим:

  • Как изменилось отношение к Роботизации за последние годы и почему компании продолжают внедрять RPA.

  • Как программные роботы помогают ИТ-отделам справляться с растущим потоком задач, а бизнесу — быстро получать измеримые результаты.

  • Российские кейсы: реальный опыт внедрения, ошибки и успехи.

Спикеры:

  • Илья Кочетов, директор по технологическому развитию платформы Primo RPA.

  • Николай Чекин, директор по развитию отношений с партнёрами ITFB Group.

Для кого вебинар:

  • ИТ-директора и руководители цифровой трансформации.

  • CEO, коммерческие и исполнительные директора.

  • Директора по продажам, клиентскому сервису и маркетингу.

  • ИТ-эксперты и интеграторы.

Узнайте, как RPA помогает бизнесу уже сегодня, и какие возможности откроются завтра. Регистрируйтесь сейчас!

➡️ Зарегистрироваться

Теги:
0
Комментарии0

ВЫШЛА КНИЖКА САЙМОНА ПРИНСА

Как обещал, сообщаю о выходе в издательстве "Бомбора" на русском языке (в моем переводе) монографии Саймона Принса, которую я неоднократно упоминал в своих публикациях. Оригинал называется "Understanding Deep Learning (2023)", перевод вышел под заглавием "Машинное обучение. От основ до продвинутых моделей (2025)".

Судя по тому, что на Литрес книга передана 19 мая 2025 года, из типографии вышла совсем недавно.

Вот ссылка на страничку издательства, на которой есть ссылки на все места, где ее можно купить.

В "электронных библиотеках" книжки пока не вижу, когда украдут увижу - сообщу дополнительно.

Буду признателен за любые отклики на книгу, в том числе за указания на ошибки перевода, просмотры, опечатки и все в этом роде.

Вот она
Вот она
Теги:
+4
Комментарии2

Открытый проект Cursor Free VIP позволяет получить бесплатный доступ к нейросети Сursor Pro для исследовательских целей. Решение я активирует бесконечный триал с откатом данных.

Теги:
0
Комментарии0

Команда исследователей из Palisade Research опубликовала отчёт о возможностях современных ИИ в области наступательной кибербезопасности. Впервые системы искусственного интеллекта были допущены к полноценному участию в хакерских соревнованиях Capture The Flag — и не просто справились, а вошли в число лучших.

В соревновании «AI vs Humans» автономные агенты на базе ИИ попали в топ-5% лучших участников, а на масштабном конкурсе Cyber Apocalypse показали результат в топ-10%, конкурируя с десятками тысяч профессиональных игроков.

Главная идея исследования — протестировать, насколько эффективно можно использовать метод «elicitation» (максимальное раскрытие потенциала ИИ) за счёт краудсорсинга, то есть через открытые соревнования. Вместо того чтобы полагаться на закрытые тесты в лабораториях, Palisade позволила внешним командам и энтузиастам самостоятельно настраивать и запускать ИИ в условиях настоящих CTF‑турниров.

Результаты оказались неожиданными. Некоторые ИИ-агенты смогли решить 19 из 20 задач, не уступая топовым человеческим командам по скорости. Особенно хорошо ИИ справлялись с задачами по криптографии и реверс‑инжинирингу. На турнире Cyber Apocalypse, где участвовало более 8000 команд, ИИ смогли решать те задачи, которые занимают у опытного игрока около часа. Это соответствует оценкам других исследователей: современные языковые модели уже уверенно справляются с техническими задачами продолжительностью до 60 минут.

Теги:
+4
Комментарии3

Майкл Делл, основатель и директор Dell, сообщил, что компания в первом квартале получила заказов на оборудование для ИИ на сумму 12,1 млрд долларов, превысив общий объем поставок за весь 25 финансовый год. И ещё остаётся портфель заказов в 14,4 млрд долларов.

Теги:
0
Комментарии0

Некто Broksh опубликовал видеоролик, где пенсионерка демонстрирует необычного домашнего питомца. В типичной пятиэтажке старушка содержит гиппопотама. Понятно, что это ещё одна демонстрация недавно вышедшей модели генерации видео со звуком Google Veo 3.

Нелегко оценить конкретные человеческие усилия, приложенные для создания этого видеоролика. Broksh — это не человек, а целый продакшн полного цикла с опытом работы в съёмках реалити-шоу, клипов, рекламы и коротких фильмов. Если судить по шоурилам студии (1, 2), навыков вполне хватает на сложную композицию, VFX, CGI и прочий постпродакшн. Вполне возможно, что творчество генеративных моделей Veo 3 или Sora было сильно доработано человеческими руками.

В комментариях автор видеоролика признаётся, что пришлось правильно составить промпты для модели, расставить кадры, прописать текст и интонации несуществующих актёров. Также указывается, что были дополнительно доработаны звук, цветокоррекция и постпродакшн в целом.

Бегемот Булька легко оттягивает на себя всё внимание зрителя, но огрехи работы ИИ всё равно заметны. Внимательный глаз зацепится за то, что старушка меняется от сцены к сцене: то она чуть выше, то её лицо становится другим. В одном случае хозяйка нарушает правила геометрии и достаёт из холодильника нереалистично огромный пластиковый таз, набитый игрушками Labubu — «трендами» для питомца. При этом таз издаёт совсем не похожий на пластик звук. Также по показанному нет никакой возможности хоть как-то оценить геометрию квартиры. Выглядит даже так, будто в квартире две кухни.

Иногда угадываются промпты, всем требованиям которых ИИ пытался удовлетворить. В одном из кадров бабулька едет в магазин, оседлав гиппопотама. При этом заметны сразу два одноэтажных здания магазинов и излишне близко стоящие, в нарушение любых строительных норм, жилые многоквартирные дома. Очевидно, что в реальной жизни значительную площадь крупного двора между домами занимала бы детская площадка, а продуктовые магазины так близко не встречаются и часто располагаются на первых этажах жилых домов.

Наконец, в средней полосе подсолнухи начинают цвести в лучшем случае в конце июня, а вот у героини клипа они украшают подоконник кухни, из окна которого почему-то видны сугробы. В некоторых сценах обычно изображено подобие начала мая с его голыми ветвями деревьев и едва проросшей травой, хотя иногда листва уже есть.

Теги:
+1
Комментарии8

Я Павел Денисенко, отвечаю за развитие дата-платформы в X5 Tech!

Редко публикую тут посты (никогда), но сейчас не могу не поделиться новость о том, что наша команда CDO X5 Tech впервые участвует в Data Fest — главном событии года для сообщества Open Data Science! 

В один из дней, 1 июня, мы принимаем фестиваль у нас в гостях, и это событие нельзя пропустить!

Наша программа будет насыщенной и интересной. Мы будем рады поделиться опытом X5 Tech с сообществом дата-экспертов. Наши эксперты поделятся докладами на самые актуальные темы в области инженерии данных и искусственного интеллекта. С участием признанных экспертов индустрии Data и ML в Retail мы поговорим о том, как данные меняют сферу ритейла и не только ее. 

Но это еще не всё! В нейтральных секциях мы также поговорим о таких темах, как Advanced LLM и ML in Music. Узнаем, как большие языковые модели находят применение в разных сферах и что происходит на стыке машинного обучения и творчества.

🌟 И, конечно, не обойдется без неформальной части: холиварные зоны для тех, кто точно знает, как правильно, и вечеринка после официальной части для самых стойких.

📍 Где и когда? 1 июня, Москва, Loft Hall. 

Data Fest 2025 — must visit для всех, кто интересуется работой с данными и хочет лучше понимать, как информационные технологии меняют бизнес и помогают в работе. Мест немного, так что успевайте зарегистрироваться по ссылке!

Не упустите шанс стать частью этого восхитительного события! Ждем вас!

Ссылка для регистрации

Теги:
+3
Комментарии0

Ближайшие события

Подключайтесь к митапу об Open Source и ML через час

Ровно через час, в 18:00, вместе с ODS проведем митап с двумя полноценными сессиями. Мы расскажем про инфраструктурный ML, а ODS — про Open Source. Подключайтесь к трансляции!

Доклады

  • Автоскейлинг инференса в k8s

  • ML-платформа на базе ClearML с Dataset Mesh-принципами

  • Эффективный мониторинг территорий: MLOps для семантической сегментации спутниковых снимков

  • MLOps для дата аналитики: автоматизация ETL-процессов c помощью ClearML

  • SVETlANNa = свет + artificial neural network: как физики делали Open Source и что из этого вышло

  • Платформа для обучения нейронных сетей 

  • Проблемы и текущие решения в области real-time feature engineering / data processing в ML. Оpen Source проект Volga

Переходите по ссылке и до встречи в эфире ❤️

Теги:
+2
Комментарии0

Все, что нужно знать об ИИ-агентах

Если вы еще не до конца понимаете, кто такие автономные ИИ-агенты, зачем они бизнесу и как они работают - это то самое видео, с которого стоит начать.

В видео разбираю:

• Почему корпорации и государства инвестируют миллиарды в автономных ИИ-агентов;

• Как работает ИИ-агент: от восприятия до принятия решений и действий;

• Где уже сейчас применяются ИИ-сотрудники;

•  Как избежать ключевых рисков и ошибок при работе с ИИ-агентами;

•  Реальные кейсы от OpenAI, Amazon, Harvey, Artisan и других.

Этот ролик для тех, кто хочет быстро войти в тему без перегруза информацией и глубокой технической подготовки. 

В следующем видео расскажу как собрать собственного ИИ-агента под свои задачи.

Теги:
+2
Комментарии0

⚡️Нейросеть Илона Маска Grok стала частью Telegram — об этом объявил Павел Дуров.

Уже в ближайших обновах добавят много крутых фич:
— Можно будет задавать Grok вопросы прямо в поиске;
— Grok сможет менять стиль вашего сообщения и делать его более подробным;
— Можно будет делать выжимки больших сообщений и файлов;
— Grok сможет быть модератором чатов;
— Нейронка сможет проводить фактчеккинг постов из каналов.

Также Telegram получит $300 млн. за партнёрство с Илоном Маском, которое рассчитано на год.

Теги:
+4
Комментарии5

Управляемые сервисы на базе YTsaurus и Apache Spark, новые возможности DataLens и Yandex Cloud AI Studio — о чём говорили на Data&ML2Business

Собрали самые интересные анонсы с Data&ML2Business, ежегодной конференции Yandex Cloud о практическом применении технологий. Вот что прозвучало на главном докладе 28 мая.

Трек Data

Ранний доступ к Yandex Managed Service for YTsaurus. Платформа Яндекса для хранения и обработки больших данных YTsaurus уже два года в опенсорсе, а с этого дня доступ к ней открывается ещё в двух форматах: в облаке и в инфраструктуре заказчика (on‑premise).

Создать базовый кластер YTsaurus теперь можно в привычной консоли
Создать базовый кластер YTsaurus теперь можно в привычной консоли

Для тестирования работы в этих форматах необходимо подать заявку.

Доступ к сервису Yandex Managed Service for Spark. Новый управляемый сервис на базе опенсорс-решения поможет с загрузкой и обработкой данных, а также задачами машинного обучения в облаке. Протестировать его в режиме Preview можно здесь.

Кроме этого, в публичный доступ вышел сервис управления распределённым аналитическим массивно‑параллельным движком обработки больших данных Trino в облачной инфраструктуре.

Обновления Yandex DataLens. Что появилось в сервисе BI‑аналитики:

  • DataLens Gallery — публичная витрина готовых примеров дашбордов. Теперь любой пользователь может открыть галерею, выбрать нужную отрасль или предметную область и изучить готовые дашборды и модели данных, а также стать автором галереи. При согласии автора дашборд из галереи можно развернуть у себя в качестве примера или стартового дашборда.

  • DataLens Editor — редактор для кастомизации графиков и таблиц с помощью JavaScript. Пользователи смогут создавать продвинутые визуализации и удобно интегрировать данные из нескольких источников (включая внешние API).

  • Собственная программа сертификации Yandex DataLens Certified Analyst. С её помощью специалисты могут официально подтвердить свои навыки работы с DataLens. На экзамене проверяются знания и навыки работы с чартами и датасетами, вычисляемыми полями и параметрами, внешними источниками данных, построения дашбордов и выдачи доступов.

Также на конференции рассказали про OLAP-движок для YDB. Теперь СУБД подходит для самых высоконагруженных сценариев. В последней версии YDB появился неточный векторный поиск, позволяющий использовать YDB для специализированных задач, связанных с ИИ.

Трек ML

Обновления RAG‑пайплайна в AI Assistant API. Доступный на платформе Yandex Cloud AI Studio инструмент для создания умных ассистентов дополнился новым графическим UI — теперь создать виртуального помощника можно не только через API или SDK. Возможности поиска данных по базам знаний также расширились: доступны поддержка новых типов данных (таблицы и pdf‑файлы), дообучение эмбедингов, обогащение чанков метаданными, получение метаданных ответа, а также использование дообученной модели. Также на платформе появился рефразер — отдельная модель, которая может перефразировать запросы пользователя.

Доступ к Yandex Cloud AI Studio on‑premise. AI‑платформа Yandex Cloud внесена в реестр отечественного ПО, что позволяет интегрировать решения как в облаке, так и в своей инфраструктуре.

Эксперты обсудили и уже состоявшиеся запуски: 

  • Инструменты работы с OpenAI Compatible API в облаке. API для языковых моделей в Yandex Cloud AI Studio совместим с OpenAI API. Благодаря этому модели YandexGPT проще интегрировать с популярными решениями для работы с ML, например, AutoGPT или LangChain. В совместимом с OpenAI API поддерживаются Function Calling, работа с эмбеддингами и Structured Output.

  • Смысловые теги Yandex SpeechSense — инструмент умного тегирования и поиска для анализа диалогов в колл‑центрах, доступный отдельно по клиенту и оператору.

  • Доступ к VLM и LLM в режиме Batch Processing и co‑pilot сервис для операторов Yandex Neurosupport — о которых мы рассказывали на Хабре.

На конференции более 20 спикеров представили 15 докладов по направлениям Data и ML. Подключайтесь к трансляции на странице мероприятия или смотрите в записи, чтобы познакомиться с опытом внедрения технологий.

Теги:
+5
Комментарии0

26 мая 2025 года в соцсети X появился ролик, про кенгуру, которого не пускают на борт самолёта даже с билетом в лапах. В публикации автор отметил, что видео сгенерировано ИИ, но многие всё равно приняли его за настоящее.

Ролик создан с помощью Google Veo 3. Это одна из первых моделей генерации видео, которая автоматически добавляет звук и речь персонажей.

Теги:
+3
Комментарии0

💬 Google выпустил свой генератор речи.

Он в точности копирует речь живого человека, добавляя паузы, смены интонации, тембр, смех и кашель.

Также внутри есть большая библиотека голосов и возможность выбора несколько спикеров, чтобы сделать свой подкаст 😧

Работает на базе Gemini 2.5 Flash Preview TTS и поддерживает русский язык.

➡️ Потестить бесплатно можно в AI Studio. Для этого выбираем Generate Media — Gemini Speech Generation.

Кстати недавно выкладывал интересную инфу про Gemini, кто не чекал советую ознакомиться.

Теги:
0
Комментарии0

Представлен ИИ-сервис, который поможет понять, почему женщина может вами недовольна (Why Is My Wife Yelling at Me? AI Wife Yelling Simulator).

Нужно просто описать ситуацию, из-за которой ваша жена или девушка пришла в состояние недовольства, а сервис проведёт самую глубокую аналитику. ИИ сам возьмёт на себя роль женщины и ответит в одном из четырёх режимов — нормальном, злом, саркастичном или разочарованном.

Теги:
+4
Комментарии0

Рассказываем, как технологии искусственного интеллекта в облаке помогли Wildberries подготовиться к выходу на новый рынок 🛍️

Что за компания

Wildberries — самый крупный по обороту маркетплейс в России. Доставляет заказы в несколько стран, в том числе Беларусь, Казахстан и Армению. В октябре 2024 года маркетплейс запустил продажи на одном из новых рынков

Какая была задача

Перед выходом на новый рынок Wildberries планировали быстро реализовать важные проекты:

  • автоматизировать перевод карточек товаров на местный и английский языки;

  • дообучить и запустить русскоязычную LLM на закрытом GPU-кластере;

  • разработать классификатор товаров по кодам ТН ВЭД;

  • протестировать собственную гипотезу и построить прогноз.

Как ее решили

Благодаря ресурсам Cloud.ru маркетплейс:

  • дообучил модель на специфическом корпусе текстов и с помощью LLM перевел все карточки;

  • разработал классификатор кодов с использованием языковой модели, что ускорило процесс и повысило точность моделей;

  • автоматизировал выбор таможенного кода: с помощью LLM сформировал обучающую выборку и провел инференс модели на мощных GPU в облаке, а затем на базе этой выборки построил более простую модель на процессорах CPU;

  • сэкономил на закупке оборудования: команде дата-сайентистов нужен был большой объем ресурсов, чтобы проверить гипотезы и построить прогнозы, а провайдер оперативно выделил необходимые вычислительные мощности.

Что в результате

Wildberries быстро получил гибкую инфраструктуру для оперативного решения бизнес-задач, а также сократил time to market. С помощью облачных мощностей с GPU компания смогла быстрее выйти на новый рынок и снизить затраты на подготовку в несколько раз.

Читать кейс 🔍

Теги:
0
Комментарии1

На GitHub Представлена бесплатная база (Learn Agentic AI using Dapr Agentic Cloud Ascent (DACA) Design Pattern: From Start to Scale) по ИИ‑агентам и их правильному созданию с нуля:

  • Подробное введение в общее строение и теорию разработки ИИ‑агентов.

  • Разбор всех популярных нейросетей от ChatGPT до Gemini.

  • Важнейшие протоколы ИИ.

  • Паттерны проектирования ИИ‑агентов.

  • Множество проектов для закрепления знаний — каждый авторы разобрали пошагово. Готовых ИИ‑агентов сможете сразу применять в работе.

  • Разборы процессов в популярных нейростартапах.

Теги:
0
Комментарии0

Интересно применение ML и AI в борьбе за безопасность и доверие пользователей? Тогда Trust&Safety AI Meetup точно для тебя 👀

Когда? 22 мая, 18:00
Где? офлайн в Москве + онлайн-трансляция 

В программе будут 2 технических доклада, интересная дискуссия, спикеры из Wildberries&Russ, Avito, AI Masters. А еще розыгрыш классного мерча среди активных участников и нетворкинг с полезными знакомствами.

Регистрация закроется 21 мая — выбирай формат участия и успей отправить заявку. До встречи на Trust&Safety AI Meetup!

Не пропустите подробности о митапе: @wb_space 🌟

Теги:
0
Комментарии0

22 мая Андрей Квапил (a.k.a. kvaps) проведет вебинар на YouTube-канале CNCF и расскажет о том, как быстро и просто деплоить виртуальные машины и Kubernetes-кластеры и пробрасывать в них GPU с помощью Open Source-платформы Cozystack.

Зарегистрироваться можно по ссылке: https://tinyurl.com/yf9jcfst. Просто кликните по кнопке «Login to RSVP», чтобы получить приглашение в календаре.

Теги:
+2
Комментарии0

Привет! 27 сентября 2025 года мы вновь соберёмся на Practical ML Conf — ежегодной конференции Яндекса о практическом применении ML‑технологий. Открываем приём заявок для тех, кто хочет выступить с докладом.

Основные темы конференции в этом году: CV, RecSys, MLOps, NLP, Speech и Data Science. Мы ждём глубокие технические доклады о прикладных решениях, которые уже приносят пользу в реальных проектах.

Как проходит работа со спикерами Practical ML Conf 2025:

  • при подготовке доклада вы получите поддержку от экспертов программного комитета;

  • перед конференцией пройдут прогоны с профессиональным тренером по публичным выступлениям;

  • мы поможем оформить вашу презентацию, чтобы донести идею максимально чётко и красиво;

  • вы сможете посетить конференцию вместе с +1 без прохождения отбора слушателей;

  • ваш доклад привлечёт внимание сообщества и экспертов: можно будет получить обратную связь, идеи для развития решения и проекта;

  • мы поддерживаем спикеров не только на конференции — ваши доклады будут промоутироваться через каналы Яндекса до и после мероприятия.

Приём заявок открыт до 9 июня 2025. Решение о включении доклада в программу примет программный комитет на основе четырех критериев: полезность, новизна, сложность и практичность.

Предложить свой доклад можно на сайте конференции. Там же можно зарегистрироваться слушателем, узнать подробности и посмотреть записи прошлых выступлений.

Теги:
+9
Комментарии0

Ozon запустил бесплатный инструмент OzonGenerator для автоматической генерации описаний товаров — он встроен в личный кабинет продавца и доступен в приложении Ozon Seller. Использовать функцию можно до 50 раз в месяц, при этом сторонние сервисы больше не нужны.

Теги:
0
Комментарии3

Облачная инфраструктура Рег.ру для AI и ML

Рассказываем, какие решения в Облаке Рег.ру помогут развернуть полноценную инфраструктуру для работы с AI и ML. Сервисы подходят для обучения моделей, хранения больших датасетов в облачных хранилищах и внедрения решений в продакшн. 

Как работает архитектура для AI и ML:

  1. Развертывание вычислительной среды. Выбираете, где будет выполняться обучение: Bare Metal GPU или Cloud GPU.

  2. Загрузка данных. Собираете датасет в удобных инструментах: S3, DBaaS или непосредственно на виртуальной машине/сервере. 

  3. Обучение модели. Запускаете создание или дообучение модели с сохранением результатов в удобном сервисе, например, в S3 или DBaaS.

  4. Использование результатов. Модель можно тиражировать и применять для различных сервисов в продакшене.

С помощью AI и ML-решений можно упростить автоматизацию, ускорить аналитику и повысить производительность проектов.

Теги:
+2
Комментарии1

Гендиректор ИИ-подразделения Google DeepMind Демис Хассабис призвал студентов готовиться к бесконечным переменам и сказал, чему нужно учиться. На вопрос, куда студентам следует направить силы и время в эпоху ИИ. Ответ Хассабиса — «учиться учиться».

«Я думаю, что на истинное понимание: используйте своё время, пока вы студенты, чтобы лучше понять себя и то, как вы лучше учитесь», — отметил Хассабис. Он пояснил, что залог успеха сегодня в адаптивности к новым знаниям — в том, чтобы развить навык быстрого освоения и усвоения нового материала, быть гибким и эффективным в обучении.

Хассабис считает, что сегодняшним студентам придётся жить в мире, где единственной предсказуемой вещью является его непредсказуемость — всё постоянно меняется из‑за стремительного развития технологий. Но он назвал конкретные направления, которые заслуживают внимания.

«Особенно ИИ, а также виртуальная и дополненная реальность, квантовые вычисления. Все эти сферы выглядят многообещающе в перспективе ближайших 5–10 лет», — сказал Хассабис. Он добавил, что каждая перемена несёт в себе «огромные» возможности.

«Я думаю, мы на пороге периода, похожего на 1990-е, когда мы выпускались, и тогда развивался интернет, мобильные телефоны, гейминг. Думаю, мы вступаем в очередной такой период. Это очень захватывающе, но нужно быть очень шустрым и схватывать появляющиеся технологии», — продолжил Хассабис.

Также Хассабис посоветовал студентам помнить о базе. Что‑то новое будет появляться всегда, поэтому лучше не отвлекаться на вещи, которые «модны сегодня, но выйдут из моды завтра».

«Помню, моими любимыми были темы вроде теории вычислений и теории информации, изучение таких вещей, как машины Тьюринга. Это осталось со мной на протяжении всей карьеры. Мне нравятся математические основы и многое из классических, фундаментальных работ», — поделился Хассабис. При том он подчеркнул, что важно не забывать о тех вещах, к которым у вас лежит душа. К выпуску студенты должны быть способны совместить глубокое понимание своих интересов с теми знаниями и навыками, которые они получили.

В свободное время Хассабис посоветовал студентам экспериментировать в любимых направлениях. В его случае это ИИ, и здесь постоянно появляются новые инструменты, в том числе с открытым кодом, поэтому он посоветовал студентам к моменту выпуска хорошо владеть самыми передовыми.

Теги:
+3
Комментарии0

Утечка системного промпта Claude 3.5 Sonnet: что произошло

TL;DR: прозмоьла утечка системного промпта Claude 3.5 Sonnet.

Недавно в открытом доступе на GitHub появился файл с системным промптом модели Claude 3.5 Sonnet от Anthropic. В этой заметке мы подробно разберём, что именно было обнародовано, как устроен промпт и какие риски несёт его утечка.

Системный промпт — это скрытая инструкция, определяющая поведение и «мозг» LLM-модели, задающая стиль, ограничения, формат вывода и логику внутренних решений. Утечка данной инструкции может помочь лучше понять внутренности и логику работы данной нейросети.

  • Источник:

    https://raw.githubusercontent.com/asgeirtj/system_prompts_leaks/refs/heads/main/claude.txt
  • Содержимое:

    • Описания «артефактов» (artifacts) — самостоятельных блоков контента (отчёты, письма, презентации).

    • Правила запуска «структурированного мышления» в тегах <antthinking>.

    • Шаблоны и условия фильтрации: когда создавать артефакт и когда отвечать простым текстом.

    • Ограничения по объёму и форматированию, а также рекомендации по стилю.

Небольшой анализ этой утечки:

  1. Артефакты
    Системный промпт описывает «артефакты» — XML-подобные блоки (отчёты, письма), которые модель генерирует для структурированного редактирования.

  2. Структурированное мышление
    Перед формированием сложных ответов включаются теги <antthinking>, задающие пошаговый алгоритм анализа запроса и выбора формата вывода.

  3. Фильтрация и объём
    Короткие ответы (1–2 предложения) выдаются без артефактов; при этом заданы жёсткие лимиты на размер и глубину артефактов во избежание «раздувания» текста.

  4. Режимы и модерация
    Включены автоматические режимы генерации (быстрый ответ, развёрнутый отчёт) и встроенные фильтры для блокировки нежелательного контента и внутренней информации.

На всякий случай, файл с GitHub'a залил в облако и Web archive, чтобы точно не потерять :). Хотя сам, честно говоря, до сегодняшнего дня но разу не пользовался данной моделью, теперь есть повод поэкспериментировать.

PS. Это мой первый пост, друзья, так что, если найдёте какие-либо недочёты, пожалуйста, укажите на них!

Теги:
+1
Комментарии0

Запустили Evolution ML Inference — сервис для развертывания ML- и DL-моделей в облаке 🤖

❓ Что за инструмент? С помощью Evolution ML Inference можно запускать и развертывать ML-модели из библиотеки Hugging Face на облачных мощностях с GPU, в том числе в пользовательских Docker-образах. А для более эффективного инференса также можно использовать среды исполнения vLLM, TGI, Ollama, Diffusers и Transformers.

🖥 Особенности и преимущества. Благодаря технологии Shared GPU ML-модели могут совместно использовать ресурсы графического ускорителя — это экономит ресурсы облака и повышает производительность. Масштабирование происходит динамически — если число запросов превышено, дополнительные мощности выделяются автоматически. Или наоборот, один GPU можно использовать для инференса сразу нескольких моделей. Оплата за использование — по модели pay-as-you-go.

👨‍💻 Кому будет полезно. Сервис найдет применение во всех сферах, где актуально машинное обучение. Evolution ML Inference можно использовать при создании ML- и DL-моделей для бизнеса, медицинских и образовательных учреждений, ретейла, кибербезопасности, производства и других областей.

✍️ Где, как и для чего использовать. Сервис подойдет для инференса LLM и TGI, диффузионных моделей и моделей-трансформеров, а также аудит-логирования. Какие задачи помогают решать модели:

  • распознавание объектов и речи;

  • прогнозирование поведения клиентов;

  • составление логистических маршрутов;

  • генерация текстов;

  • перевод, суммаризация и другие операции с текстом.

А больше об Evolution ML Inference можно узнать из доклада конференции GoCloud 2025 «Эволюция запуска ML-моделей» 😉.

Теги:
Рейтинг0
Комментарии0

Утечка системного промпта Claude 3.5 Sonnet: что произошло

TL;DR: произошла утечка системного промпта Claude 3.5 Sonnet.

Недавно в открытом доступе на GitHub появился файл с системным промптом модели Claude 3.5 Sonnet от Anthropic. В этой заметке мы подробно разберём, что именно было обнародовано, как устроен промпт и какие риски несёт его утечка.

Системный промпт — это скрытая инструкция, определяющая поведение и «мозг» LLM-модели, задающая стиль, ограничения, формат вывода и логику внутренних решений. Утечка данной инструкции может помочь лучше понять внутренности и логику работы данной нейросети.

  • Оригинальный файл:

    https://raw.githubusercontent.com/asgeirtj/system_prompts_leaks/refs/heads/main/claude.txt
  • Содержимое:

    • Описания «артефактов» (artifacts) — самостоятельных блоков контента (отчёты, письма, презентации).

    • Правила запуска «структурированного мышления» в тегах <antthinking>.

    • Шаблоны и условия фильтрации: когда создавать артефакт и когда отвечать простым текстом.

    • Ограничения по объёму и форматированию, а также рекомендации по стилю.

Небольшой анализ этой утечки:

  1. Артефакты
    Системный промпт описывает «артефакты» — XML-подобные блоки (отчёты, письма), которые модель генерирует для структурированного редактирования.

  2. Структурированное мышление
    Перед формированием сложных ответов включаются теги <antthinking>, задающие пошаговый алгоритм анализа запроса и выбора формата вывода.

  3. Фильтрация и объём
    Короткие ответы (1–2 предложения) выдаются без артефактов; при этом заданы жёсткие лимиты на размер и глубину артефактов во избежание «раздувания» текста.

  4. Режимы и модерация
    Включены автоматические режимы генерации (быстрый ответ, развёрнутый отчёт) и встроенные фильтры для блокировки нежелательного контента и внутренней информации.

На всякий случай, файл с GitHub'a залил в облакo [ Upd: администрация Telebox, как выяснилось, имеет доступ ко всем файлам, даже беспарольным архивам, и уже дважды удалила файл] и Web archive [здесь файл жив и здоров], чтобы у каждого была возможность покопаться в недрах этого конфига. Честно говоря, до сегодняшнего дня ни разу не пользовался данной моделью от Anthropic, теперь есть повод поэкспериментировать :).

PS. Это мой первый пост, друзья, так что, если найдёте какие-либо недочёты, пожалуйста, укажите на них!

Теги:
Всего голосов 6: ↑6 и ↓0+8
Комментарии0

Узнаем содержимое любого GitHub-репозитория за один клик с помощью универсального бесплатного ИИ-помощника Git-Friend.

Решение:

  • создаёт подробные и структурированные README-файлы для ваших проектов — это поможет сэкономить часы работы и сделать ваши труды более узнаваемыми.

  • делает саммари и гайды по любым репозиториям и досконально разжевывает их кодинговую базу

  • отвечает на вопросы, если вы застряли при анализе проекта или установке нового фреймворка.

  • скоро сервис сможет генерить диаграммы для еще более подробного анализа кода.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

AI-агенты в облаке: как они работают, зачем нужны — и как создать собственного

📅 13 мая | 18:00 (МСК) | Онлайн

На встрече поговорим о том, как устроены современные AI-агенты на базе LLM, какие архитектуры и инфраструктуры используются для их работы, и продемонстрируем создание агента в режиме live coding.

👨‍💻 Спикер — Михаил Дремин
Технический лидер Data Science-направления в Clоud.ru

🔍 В программе:
— Основы LLM-агентов и взаимодействие с внешним миром через инструменты (tools)
— Архитектурные подходы: Prompt chaining, ReAct, Evaluator-optimizer, ambient agents и другие
— Реальные кейсы использования
— Практическая часть: разработка собственного агента на Python (с использованием LangChain) и развертывание в облаке

💼 А также: представители компании расскажут о стажировке для студентов и молодых специалистов: какие направления доступны, как попасть в команду.

📌 Участие бесплатное

📎 Регистрация: https://mnlp.cc/mini?domain=digitalmipt&id=7

Теги:
Рейтинг0
Комментарии0

Тикток-блогер its_ken04, известная как Кен, опубликовала запись «собеседования», которая стала вирусной. В ролике ИИ-рекрутер 14 раз подряд повторяет фразу «vertical bar pilates», иногда запинаясь или заикаясь, пока Кен с невозмутимым видом смотрит на экран.

Девушка подавала заявку на работу в фитнес-центре. Кен рассказала, что компания заранее предупредила ее об использовании ИИ в процессе отбора, и платформа называлась Apriora. «Похоже, мне нужно было заслужить право говорить с человеком, ха-ха», — написала девушка в комментариях к видео.

Стартап Apriora обещает помочь компаниям «нанимать на 87% быстрее» и «проводить собеседования на 93% дешевле», поскольку может одновременно интервьюировать нескольких кандидатов. «Соискатели во многих случаях предпочитают проходить собеседование с ИИ, поскольку знание того, что интервьюер — это ИИ, помогает снизить тревогу, позволяя кандидатам проявить себя наилучшим образом», — заявили в компании.

Опыт Кен с Apriora был отрицательным. «Мне показалось это действительно жутким, я была в шоке», — сказала она. «Я не находила это смешным, пока не выложила тикток и комментарии не подняли мне настроение. Я была очень удивлена, я ничего не сделала, чтобы вызвать сбой, так что это было неожиданно. Я больше никогда не буду проходить это снова. Если другая компания захочет, чтобы я общалась с ИИ, я просто откажусь», — заявила блогер.

Теги:
Всего голосов 7: ↑7 и ↓0+11
Комментарии2

Представлен ресурс (Context7 MCP - Up-to-date Code Docs For Any Prompt) из 9000 API с документацией для автоматического подключения к любым нейросетям. Поддерживается: Cursor, Windsurf, VS Code, Docker, Claude.

Теги:
Рейтинг0
Комментарии0

Могучий русский язык и предиктивный ввод в умной клавиатуре

Русский — это вызов даже для самых продвинутых языковых моделей. Одна из ключевых причин — его морфологическая сложность. В отличие от английского языка, где у слов относительно немного форм, русский язык отличается большим количеством словоформ, которые образуются с помощью приставок, суффиксов и окончаний. 

Это означает, что одно лексическое понятие, например глагол «читать», может породить десятки различных форм: «читаю», «читаем», «читаешь», «прочитал», «прочитала» и так далее. Для модели предиктивного ввода это серьезная проблема: чтобы корректно предсказывать или завершать такие слова, ей нужно либо обладать глубоким пониманием морфологии, либо иметь достаточно большой словарь, который покрывает все возможные варианты словосочетаний.

Мы увеличили размер словаря для русского языка до 40 тысяч слов и использовали модель Char CNN + RNN. Так удалось добиться прироста метрики KSS (количество сэкономленных нажатий) на 60%. 

Читайте в статье ИИ-инженера Вадима Воеводкина из YADRO, как его команда улучшила предиктивный ввод на планшетах KVADRA_T и с какими сложностями столкнулась. 

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии0

Магистратура МФТИ и Альфа-Банка

Вместе с МФТИ Альфа-Банк открывает набор в магистратуру «Машинный интеллект в финансах». Обучим управлять циклом создания модели, анализировать и моделировать данные с помощью алгоритмов Python, а также решать прикладные задачи Machine Learning и Deep Learning.

Почему стоит попробовать:

  • Бесплатное обучение — все расходы покрывает Альфа-Банк.

  • Ежемесячная стипендия и оплачиваемая стажировка с первого дня.

  • Возможность попасть в IT-команду Альфа-Банка.

Что нужно:

  • Иметь диплом бакалавра или магистра.

  • Подать заявку и решить задачу по машинному обучению (кредитного скоринга или прогнозирования баланса клиентов).

  • Пройти вступительные испытания в МФТИ (подробнее о них на сайте МФТИ).

Подать заявку и решить задачу можно до 19 мая — подробности на сайте программы, а также в записи со Дня открытых дверей.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

ИИ-проект Cursor раздаёт студентам бесплатную подписку Cursor Pro на 12 месяцев. Подписка даёт доступ к лучшим в мире LLM-моделям, при этом почти безлимитный. Заявки с России тоже принимаются.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии4
Пройдите квиз и узнайте, какое направление Data Science выбрать
Пройдите квиз и узнайте, какое направление Data Science выбрать

🎓 Пройдите квиз и узнайте, какое направление Data Science вам подходит.

В онлайн-магистратуре «Науки о данных» доступны три профильных направления.
Чтобы выбрать подходящий трек, пройдите мини-квиз — он учитывает ваши интересы и бэкграунд.

🔹 ML Engineer
Создает и внедряет модели для обработки данных, изображений, видео и текстов — от прогнозирования оттока до диагностики по снимкам и разработки чат-ботов поддержки клиентов.

🔹 Data Analyst
Проектирует модели для анализа данных: сбор, очистка, визуализация, интерпретация данных. Например, создает дашборд для анализа продаж.

🔹 Data Engineer
Строит инфраструктуру для работы с большими данными: создает каналы и пайплайны для сбора, обработки и хранения данных.

💡 Профильные треки — это возможность получить дополнительные навыки и углубиться в одну из ключевых сфер работы с данными.

👉 Пройти кви: https://t.me/mipt_ds_spec_bot

Теги:
Рейтинг0
Комментарии0

Отец канадского стартапера Маянка Джайна порезался кухонным ножом. К счастью, Маянк не запостил фотку с серьёзностью раны, однако можно понять, что достаточно сильно — сын повёл мужчину к врачу. Джайн с удивлением обнаружил, что врач сделал запрос в ChatGPT.

@mayankja1n

Однако не всё так возмутительно. Если судить по фотографии, терапевт просто забил в GPT-4o (видимо, не хочет расходовать лимит запросов к o3) полный список жалоб пацента: «Порез левого указательного пальца кухонным ножом, направление на хирургическую обработку раны и наложение швов». В ответ чат-бот записал ему историю заболевания (HPI, History of Present Illness) с какими-то шаблонными данными (нет аллергических реакций, не принимает никакие препараты, медицинской истории заболевания нет), результаты осмотра, оценку и план лечения.

Насколько можно судить, врач сгенерировал себе текст, чтобы не стучать самому по клавиатуре, заполняя стандартные формы. Однако заметно, что у него платный (тариф ChatGPT Plus) личный аккаунт, а не корпоративный. Лишь в последнем случае данные от пользователя для последующего обучения моделей использоваться не будут. Как известно, данные даже с платных персональных аккаунтов ChatGPT будут использованы для улучшения продуктов OpenAI.

С другой стороны, если судить по фото, то персональных данных пациента в бота врач не вводил.

Сам Маянк не сильно возмущён. Он тоже считает, что это просто экономия времени на бумажной волоките.

Вообще, любопытно подглядеть, что может спрашивать у ChatGPT врач-терапевт. Собственно чат про порез на пальце озаглавлен «План оценки похожего на грипп заболевания» — то ли этот чат продолжен от другого запроса, то ли врач редактировал запрос в этом же чате. После тоже идёт что-то медицинское: «Диагностика грибка ногтей на ногах», «Калькулятор углеводов в арахисовых M&M’s», «Боль в спине и одышка», «Дифференциальная диагностика кожного поражения», «Обзор анамнеза и текущих препаратов (PMH и Rx)».

Далее о потребностях в информации можно только гадать: «Приказ Аврааму о жертвоприношении», «Дифференциальная диагностика хронической сыпи на ногах». По-арабски там записано «كيفية قول علامة بالعربية» («Как сказать „знак“ по‑арабски»). Ниже опять продолжаются запросы, контекст которых ясен: «Запрос на краткое содержание разговора», «Ответ „Спасибо“», «Головные боли при наклоне».

Теги:
Всего голосов 3: ↑3 и ↓0+5
Комментарии7
1
23 ...

Работа

Data Scientist
45 вакансий