Все потоки
Поиск
Написать публикацию
Обновить
1076.07

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Нейро-дайджест: ключевые события мира AI за 4 неделю августа 2025

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.4K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: апдейт DeepSeek v3.1, xAI выложили веса Grok 2, а PewDiePie собрал собственный сервер для LLM. Alibaba презентовала кодинг-агента Qoder, Apple делает домашних ИИ-роботов, а нейросети теперь читают ваши мысли и предсказывают будущее.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Как служба поддержки ЮMoney научилась общаться с пользователями из разных стран, не зная их языка

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.1K

Привет, Хабр. Мы – Даша (инженер машинного обучения) и Наташа (ведущий аналитик в ЮMoney). В этой статье расскажем о системе машинного перевода, разработанной как end-to-end-решение для многоязычной поддержки в финтех-компании. Рассмотрим архитектуру, технические детали реализации и практические результаты внедрения системы. А ещё покажем, как общались с пользователем из Казахстана.

План статьи:

>> Проанализируем потребность в системе перевода — рассмотрим, почему языковые барьеры критичны для техподдержки и масштабирования бизнеса.

>> Обсудим выбор архитектурного подхода — почему остановились на специализированном агенте вместо универсальных LLM-решений.

>> Детально разберём техническую реализацию — как работают FastText для определения языка и NLLB для перевода и почему потребовалось 12 отдельных LoRA адаптеров.

>> Покажем систему в действии — полный цикл обработки обращения от клиента из Казахстана.

>> Завершим анализом результатов и метрик качества работы системы.

Читать далее

Кофе — мой type, музыка — мой out: строим NERвный-пайплайн на продуктовых запросах

Время на прочтение11 мин
Количество просмотров950

Привет, Хабр! На связи команда Ad-Hoc аналитики X5 Tech. В этой статье расскажем, как мы научили поиск извлекать важные сущности из запросов пользователей. Полный разбор реализации NER (Named Entity Recognition) для продуктового ритейла, шаг за шагом: как мы размечали данные, считали метрики на уровне токенов и сущностей — и почему для коротких и длинных запросов потребовались разные архитектурные решения.

Читать далее

Я был дизайнером 6 лет, делал картинки для новостей, а потом пришла нейросеть

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров36K

В 2022 году я был простым дизайнером в пиар-отделе  — оформлял социальные сети, делал картинки к новостям. Думал, что так и буду всю жизнь постики клепать.

Сейчас работаю полноценно на внешних заказчиков нашей компании. У меня теперь, помимо графического дизайна для SMM, и интерфейсы, и 3D, и моушен. И вот так получилось, что в нашей компании у меня одна из самых больших экспертностей именно в ИИ. Если что-то не понимают, не знают — сразу ко мне идут.

В этой статье расскажу, как нейросети превратили меня из узкого SMM-специалиста в многопрофильного креатора, покажу реальные кейсы и поделюсь работающими техниками, которые использую каждый день.

Читать далее

DevSecOps-консоль для контроля уязвимостей в коде: автоматизация, аналитика и AI-ассистент

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2K

Как автоматизировать DevSecOps с помощью ИИ или как мы разработали DevSecOps-консоль для контроля над уязвимостями.

Читать далее

Как строить умных AI-агентов: уроки Context Engineering от Manus

Время на прочтение9 мин
Количество просмотров6.4K

В самом начале проекта Manus перед нашей командой встал ключевой вопрос: обучать ли end-to-end агентную модель, используя open-source foundation-модели, или же строить агента поверх возможностей in-context learning у frontier models?

В моё первое десятилетие в NLP у нас и выбора-то такого не было. В далёкие времена BERT (да, прошло уже семь лет) модели приходилось fine-tune'ить и тестировать, прежде чем они могли переноситься на новую задачу. Этот процесс часто занимал недели на одну итерацию, даже при том, что тогдашние модели были крошечными по сравнению с сегодняшними LLM. Для быстроразвивающихся приложений, особенно на этапе до PMF, такие медленные циклы обратной связи — смертный приговор. Это был горький урок из моего прошлого стартапа, где я обучал модели с нуля для open information extraction и семантического поиска. А потом появились GPT-3 и Flan-T5, и мои внутренние модели стали не актуальны буквально за ночь. Ирония в том, что именно эти модели положили начало in-context learning — и открыли совершенно новый путь развития.

Из этого болезненного опыта выбор был очевиден: Manus делает ставку на context engineering. Это позволяет выпускать улучшения за часы, а не за недели, и держит наш продукт ортогональным по отношению к базовым моделям: если прогресс моделей — это прилив, то мы хотим, чтобы Manus был лодкой, а не сваей, вбитой в морское дно.

Тем не менее context engineering оказался далеко не тривиальным делом. Это экспериментальная наука — и мы перестраивали наш агентный фреймворк четыре раза, каждый раз находя более удачный способ формировать контекст. Мы с любовью называем этот ручной процесс перебора архитектур, подбора промптов и эмпирических догадок «Stochastic Graduate Descent». Это не изящно, но работает.

В этом посте я делюсь локальными оптимумами, к которым мы пришли через собственный «SGD». Если вы создаете своего AI-агента, надеюсь, эти принципы помогут вам сойтись к решению быстрее.

Читать далее

Как и зачем мы в YADRO сделали свою MLOps-платформу

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров5.1K

В нашей компании есть много проектов, связанных с AI. Всем им нужны ресурсы для работы с моделями на GPU. «Хотим, чтобы только мы имели доступ к оборудованию», — это лишь одно из требований инженеров из AI-дивизиона, а еще нужно оптимизировать использование GPU-ресурсов, вести их учет и быстро подготавливать оборудование к передаче другой команде.

Привет, Хабр! Меня зовут Вадим Извеков, я руководитель группы сопровождения платформы машинного обучения в YADRO. Сегодня расскажу, почему мы решили создать свою MLOps-платформу, как она устроена и для чего используется. 

Читать далее

Spark 4.0 на горизонте: Готовимся к апгрейду или остаёмся на проверенном 3.0?

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров1.8K

Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Кажется, ещё вчера мы радовались возможностям Apache Spark 3.0, разбирались с Adaptive Query Execution и наслаждались улучшениями Pandas API. Но мир больших данных не стоит на месте, и вот уже на подходе Apache Spark 4.0. Новый мажорный релиз — это всегда событие: он обещает новые фичи, прирост производительности и, конечно же, новые вызовы при миграции.

Apache Spark де-факто стал стандартом для распределённой обработки данных. От классических ETL-пайплайнов и SQL-аналитики до сложного машинного обучения и стриминга — Spark так или иначе задействован во многих современных data-платформах. Поэтому каждый новый релиз вызывает живой интерес у комьюнити: что там под капотом? Какие проблемы решены? Не сломается ли то, что работало годами?

Читать далее

ИИ для QA: реальный опыт автоматизации анализа результатов автотестов

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.9K

Каждую ночь тысячи автотестов отрабатывают на бою, и сотни падений превращаются в рутину для QA-команд. Но что если привычный разбор ошибок можно отдать искусственному интеллекту — и самому сосредоточиться только на новых, действительно значимых сбоях? В этой статье — реальный опыт внедрения ReportPortal, который показывает, как ИИ помогает классифицировать падения, экономить время тестировщиков и снижать количество человеческих ошибок, не превращаясь при этом в «волшебную чёрную коробку».

Читать далее

Как облачные ассистенты и RAG‑технологии меняют работу с LLM: интервью с директором продуктовой разработки Cloud.ru

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров879

Привет, Хабр! Последнее время я много слышал, что в облачных технологиях появляются ИИ‑ассистенты. Они перестают быть экспериментом и становятся рабочим инструментом. Кроме того, нейросетевые модели всё больше появляются в разных облаках. Но как это выглядит с точки зрения разработчиков облачных платформ, и какие технологии лежат в основе таких сервисов? Об этом я поговорил на конференции GigaConf с директором продуктовой разработки Cloud.ru Владимиром Шульгой. Также в разговоре затронули темы RAG‑пайплайна, интеграции LLM в DevOps‑процессы, автоматизации рутинных операций и о том, как облачные ассистенты меняют пользовательский опыт. Приятного чтения!

Читать далее

Умный бедный и глупый богатый: диалектика ИИ-ассистентов в мире неравенства

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров890

В Бауманке, то есть в МГТУ им. Баумана, есть свой акселератор, где я сопровождаю проекты бауманцев-стартаперов. И если бы мне нужно было назвать главный тренд последних двух лет, я бы не задумываясь ответил: ИИ-ассистенты.

Каждый второй студент приходит с идеей «умного помощника»: кто-то хочет автоматизировать подбор резюме, кто-то — помогать студентам учиться, кто-то создать личного ассистента для CEO. Сейчас всё просто: купил API у OpenAI или Yandex, накидал промптов, сделал красивый интерфейс — и вперёд, на хакатон, в инкубатор, в венчур.

Но чем больше я погружаюсь в эти проекты, тем сильнее ощущаю тревожный диссонанс: стартаперы делают ИИ-ассистентов не потому, что понимают реальную потребность, а потому что это модно. Они часто действуют "методом тыка", из увлечения, а не из анализа и понимания своего потребителя.

Читать далее

Интеграционная платформа — enabler для построения ИИ-агентов

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.2K

Привет, Хабр! Меня зовут Евгений Лукин, я CPO продукта MWS OctAPI — это интеграционная платформа, которую мы создали для задач МТС, но теперь предлагаем как продукт на рынке.

Интеграционные платформы… кажется, что это что-то скучное и уже давно commodity —  шины данных, kafka — вот это вот всё, что тут может быть интересного?

Да, но нет.

Читать далее

Как устроены нейросети для неспециалистов

Уровень сложностиПростой
Время на прочтение23 мин
Количество просмотров25K

Нам часто предлагают врубиться во что-то с места в карьер: «Вот я формулку нарисовал и всем понятно!».

Но не беспокойтесь, в начале же была не формула, в начале было слово, и вот о словах-то мы сейчас и поговорим. Я хочу этой статьей увлечь как гуманитариев, так и айтишников с математиками!

Понимаю, что у вас кружится голова от большого количества новых незнакомых понятий и терминов. Лучший способ все это уложить — пройти стопами тех людей, которые делали простые вещи, но называли это сложным, узнать историю развития и понять, почему все работает так, а не иначе.

Для этого нам придется углубиться в робопсихологию и робопсихиатрию!

В начале было слово...

И слово это было русское...

Ближайшие события

Лучшие нейросети 2025

Время на прочтение12 мин
Количество просмотров17K

Рынок потребительских GenAI-приложений стабилизируется: в свежем топ-100 от a16z всего 11 новичков в вебе против 17 в прошлом отчёте. ChatGPT всё ещё лидирует, но Google сокращает разрыв с Gemini, а Grok от X показывает взрывной рост.

Анализ данных Similarweb и Sensor Tower выявляет ключевые тренды, включая доминирование китайских видеомоделей и платформ для «vibe coding».

Читать далее

Как OpenAI передаёт ИИ «голос общества»: итоги коллективного эксперимента

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров1.1K

OpenAI представила результаты масштабного исследования, в котором более тысячи человек со всего мира оценивали поведение языковых моделей в этически сложных ситуациях. Это часть программы по так называемой «коллективной настройке» (collective alignment), цель которой — приблизить ответы ИИ к общественным ожиданиям.

Читать далее

Записки с медицинской ИИ-фабрики

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.2K

Мы обучаем медицине большую языковую модель GigaChat и создаём агентов для здравоохранения на её основе. Наша модель уже сдала множество экзаменов и даже устроилась на работу. Как и в других сферах ИИ, в медицине мы делаем то, что раньше было фантастикой, а теперь быстро входит в практику. Давайте я вам об этом расскажу.

Читать далее

Все LLM в одном окне: как мы сделали AI-сервис Daisy

Время на прочтение5 мин
Количество просмотров5.7K

Знакомьтесь, Daisy — наш сервис для быстрого доступа ко всем передовым LLM. Он вырос из инициативы друзей, которым хотелось разобраться, какие пользовательские сценарии работают в GenAI и как сделать удобный AI-based UX. Начав с внутреннего исследования, мы открыли доступ к сервису для внешнего мира и увидели, что им начали активно пользоваться.

За полгода у Daisy — 300 тыс. пользователей, 5 тыс. DAU и более 3,5 млн обращений к моделям. Рассказываем, как мы пошли дальше простого доступа к LLM через API — и сделали полноценный AI-сервис со своим подходом к архитектуре и взаимодействию с пользователями.

Читать далее

Тест-драйв Nano Banana (Gemini 2.5 Flash Image): новый фотошоп и революция в редактировании изображений от Google

Время на прочтение4 мин
Количество просмотров10K

Вчера вышла модель Gemini 2.5 Flash Image (промо название Nano Banana), которая, возможно, изменит мир работы с изображениями так, как это сделал своим появлением фотошоп. На превью — краткий пример возможностей, в посте — полная версия гифки и много классных экспериментов на все виды редактирования картинок, посмотрим с чем моделька справляется хорошо, а с чем не очень.

В заголовке написано «революция», «новый фотошоп» — это, возможно, все же преувеличение. Или нет. Штука очень крутая, залипал с ней до самого утра.

Давайте смотреть.

Читать далее

Процедурная память: как она упрощает и удешевляет работу ИИ-агентов

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.2K

Новая методика, разработанная учёными из Чжэцзянского университета и Alibaba Group, наделяет агентов больших языковых моделей (LLM) динамической памятью, делая их более эффективными и результативными при решении сложных задач. Этот подход, получивший название Memp, обеспечивает агентов «процедурной памятью», которая непрерывно обновляется по мере накопления опыта — подобно тому, как люди учатся через практику.

Memp формирует фреймворк для обучения в течение всей «жизни» агента, благодаря чему ему не приходится каждый раз начинать с нуля при работе с новой задачей. Вместо этого он становится всё более опытным и продуктивным, встречаясь с новыми ситуациями в реальной среде, что особенно важно для надёжной автоматизации в бизнесе.

Читать далее

ElizaOS v2: из мемного AI-фонда в полноценную систему для агентов

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров851

Помните ai16z, тот самый “хедж-фонд на ИИ” с отсылкой к Andreessen Horowitz? Так вот, из шутки он вырос в ElizaOS v2 — open-source фреймворк, который реально позволяет собирать автономных агентов.

Сегодня это уже не набор скриптов, а полноценная операционная система для цифровых компаньонов: с собственной памятью, мозгом (LLM) и возможностью работать напрямую с Web3 и внешними сервисами. Короче, из бот-игрушки он превратился в инструмент для серьёзных автономных агентов в Web3. В этой статье я разберу архитектуру ElizaOS v2, покажу ключевые компоненты и объясню, зачем она нужна нам, разработчикам.

Читать далее

Вклад авторов