Как стать автором
Поиск
Написать публикацию
Обновить
1107.5

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Игровой бот в Telegram с нуля: Как я автоматизировал создание контента с помощью Apache NiFi и LLM

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров3.2K

Как быстро протестировать игровую идею без лишней сложности? Я создал текстовую игру в Telegram за выходные на Apache NiFi и Groovy, весь контент для которой генерируют языковые модели.

В итоге — легковесный, почти не требующий поддержки бот, которого не больно обновлять. Идеально для MVP.

Под катом — архитектура, этапы развития и как AI не просто отвечает, а становится движком продукта.

Все началось с желания сделать что-то интересное для подписчиков моего канала в Telegram. Захотелось интерактива — простой текстовой викторины или квеста. Но разворачивать полноценный бэкенд... Не для такого пет-проекта.

Цель была ясна: создать максимально простого и легковесного бота, которого было бы не больно поддерживать. Выбор пал на связку Apache NiFi для оркестрации и Groovy для скриптовой логики.

P.S. Полная инструкция по запуску, исходники скриптов и шаблон для NiFi я выложил в открытый доступ на GitHub. Буду рад звёздочкам и пул-реквестам!

FutureGuest Bot repository

Читать далее

Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

Время на прочтение6 мин
Количество просмотров757

Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг». При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний, автоматизировав в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM).

Изначально мы рассматривали два подхода к реализации подобных проектов. Первый – предполагал классическую работу с гибкими описаниями документов, когда правила извлечения информации задаются человеком. Второй вариант – комбинированный, с использованием больших языковых моделей (LLM). Наш опыт показал, что последний подход как минимум в три раза экономичнее, при работе с неструктурированными документами. Он обеспечивает хорошую скорость и высокое качество извлечения данных (более 95% правильно извлеченных данных), что позволяет нашим заказчикам масштабировать обработку документов без роста операционных расходов.

Узнать подробности

Как Avengers‑Pro превращает зоопарк LLM в супер-роутер за счёт одного ползунка

Время на прочтение4 мин
Количество просмотров805

Один ползунок — и все ваши языковые модели вдруг начинают работать как слаженная команда. Банально выбирать между «дорого, но точно» и «дёшево, но кое-как» больше не обязательно: Avengers‑Pro предлагает куда более хитрую стратегию. Он невыразимо просто сочетает разные LLM — от топовых GPT‑5 до резвых Qwen — и учится менять баланс между качеством и затратами одним движением. Всё прозрачно, гибко и легко регулируется, а результат — система, способная удивить даже опытных инженеров. Как удалось приручить весь этот зоопарк моделей и что это даёт на практике?

Читать далее

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров3.5K

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код.

Обновить резюме

Нейро-дайджест: ключевые события мира AI за 4 неделю августа 2025

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.3K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: апдейт DeepSeek v3.1, xAI выложили веса Grok 2, а PewDiePie собрал собственный сервер для LLM. Alibaba презентовала кодинг-агента Qoder, Apple делает домашних ИИ-роботов, а нейросети теперь читают ваши мысли и предсказывают будущее.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Как служба поддержки ЮMoney научилась общаться с пользователями из разных стран, не зная их языка

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров557

Привет, Хабр. Мы – Даша (инженер машинного обучения) и Наташа (ведущий аналитик в ЮMoney). В этой статье расскажем о системе машинного перевода, разработанной как end-to-end-решение для многоязычной поддержки в финтех-компании. Рассмотрим архитектуру, технические детали реализации и практические результаты внедрения системы. А ещё покажем, как общались с пользователем из Казахстана.

План статьи:

>> Проанализируем потребность в системе перевода — рассмотрим, почему языковые барьеры критичны для техподдержки и масштабирования бизнеса.

>> Обсудим выбор архитектурного подхода — почему остановились на специализированном агенте вместо универсальных LLM-решений.

>> Детально разберём техническую реализацию — как работают FastText для определения языка и NLLB для перевода и почему потребовалось 12 отдельных LoRA адаптеров.

>> Покажем систему в действии — полный цикл обработки обращения от клиента из Казахстана.

>> Завершим анализом результатов и метрик качества работы системы.

Читать далее

Кофе — мой type, музыка — мой out: строим NERвный-пайплайн на продуктовых запросах

Время на прочтение11 мин
Количество просмотров449

Привет, Хабр! На связи команда Ad-Hoc аналитики X5 Tech. В этой статье расскажем, как мы научили поиск извлекать важные сущности из запросов пользователей. Полный разбор реализации NER (Named Entity Recognition) для продуктового ритейла, шаг за шагом: как мы размечали данные, считали метрики на уровне токенов и сущностей — и почему для коротких и длинных запросов потребовались разные архитектурные решения.

Читать далее

Я был дизайнером 6 лет, делал картинки для новостей, а потом пришла нейросеть

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров12K

В 2022 году я был простым дизайнером в пиар-отделе  — оформлял социальные сети, делал картинки к новостям. Думал, что так и буду всю жизнь постики клепать.

Сейчас работаю полноценно на внешних заказчиков нашей компании. У меня теперь, помимо графического дизайна для SMM, и интерфейсы, и 3D, и моушен. И вот так получилось, что в нашей компании у меня одна из самых больших экспертностей именно в ИИ. Если что-то не понимают, не знают — сразу ко мне идут.

В этой статье расскажу, как нейросети превратили меня из узкого SMM-специалиста в многопрофильного креатора, покажу реальные кейсы и поделюсь работающими техниками, которые использую каждый день.

Читать далее

DevSecOps-консоль для контроля уязвимостей в коде: автоматизация, аналитика и AI-ассистент

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.1K

Как автоматизировать DevSecOps с помощью ИИ или как мы разработали DevSecOps-консоль для контроля над уязвимостями.

Читать далее

Как строить умных AI-агентов: уроки Context Engineering от Manus

Время на прочтение9 мин
Количество просмотров2.2K

В самом начале проекта Manus перед нашей командой встал ключевой вопрос: обучать ли end-to-end агентную модель, используя open-source foundation-модели, или же строить агента поверх возможностей in-context learning у frontier models?

В моё первое десятилетие в NLP у нас и выбора-то такого не было. В далёкие времена BERT (да, прошло уже семь лет) модели приходилось fine-tune'ить и тестировать, прежде чем они могли переноситься на новую задачу. Этот процесс часто занимал недели на одну итерацию, даже при том, что тогдашние модели были крошечными по сравнению с сегодняшними LLM. Для быстроразвивающихся приложений, особенно на этапе до PMF, такие медленные циклы обратной связи — смертный приговор. Это был горький урок из моего прошлого стартапа, где я обучал модели с нуля для open information extraction и семантического поиска. А потом появились GPT-3 и Flan-T5, и мои внутренние модели стали не актуальны буквально за ночь. Ирония в том, что именно эти модели положили начало in-context learning — и открыли совершенно новый путь развития.

Из этого болезненного опыта выбор был очевиден: Manus делает ставку на context engineering. Это позволяет выпускать улучшения за часы, а не за недели, и держит наш продукт ортогональным по отношению к базовым моделям: если прогресс моделей — это прилив, то мы хотим, чтобы Manus был лодкой, а не сваей, вбитой в морское дно.

Тем не менее context engineering оказался далеко не тривиальным делом. Это экспериментальная наука — и мы перестраивали наш агентный фреймворк четыре раза, каждый раз находя более удачный способ формировать контекст. Мы с любовью называем этот ручной процесс перебора архитектур, подбора промптов и эмпирических догадок «Stochastic Graduate Descent». Это не изящно, но работает.

В этом посте я делюсь локальными оптимумами, к которым мы пришли через собственный «SGD». Если вы создаете своего AI-агента, надеюсь, эти принципы помогут вам сойтись к решению быстрее.

Читать далее

Как и зачем мы в YADRO сделали свою MLOps-платформу

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров2.3K

В нашей компании есть много проектов, связанных с AI. Всем им нужны ресурсы для работы с моделями на GPU. «Хотим, чтобы только мы имели доступ к оборудованию», — это лишь одно из требований инженеров из AI-дивизиона, а еще нужно оптимизировать использование GPU-ресурсов, вести их учет и быстро подготавливать оборудование к передаче другой команде.

Привет, Хабр! Меня зовут Вадим Извеков, я руководитель группы сопровождения платформы машинного обучения в YADRO. Сегодня расскажу, почему мы решили создать свою MLOps-платформу, как она устроена и для чего используется. 

Читать далее

Spark 4.0 на горизонте: Готовимся к апгрейду или остаёмся на проверенном 3.0?

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров991

Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Кажется, ещё вчера мы радовались возможностям Apache Spark 3.0, разбирались с Adaptive Query Execution и наслаждались улучшениями Pandas API. Но мир больших данных не стоит на месте, и вот уже на подходе Apache Spark 4.0. Новый мажорный релиз — это всегда событие: он обещает новые фичи, прирост производительности и, конечно же, новые вызовы при миграции.

Apache Spark де-факто стал стандартом для распределённой обработки данных. От классических ETL-пайплайнов и SQL-аналитики до сложного машинного обучения и стриминга — Spark так или иначе задействован во многих современных data-платформах. Поэтому каждый новый релиз вызывает живой интерес у комьюнити: что там под капотом? Какие проблемы решены? Не сломается ли то, что работало годами?

Читать далее

ИИ для QA: реальный опыт автоматизации анализа результатов автотестов

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров403

Каждую ночь тысячи автотестов отрабатывают на бою, и сотни падений превращаются в рутину для QA-команд. Но что если привычный разбор ошибок можно отдать искусственному интеллекту — и самому сосредоточиться только на новых, действительно значимых сбоях? В этой статье — реальный опыт внедрения ReportPortal, который показывает, как ИИ помогает классифицировать падения, экономить время тестировщиков и снижать количество человеческих ошибок, не превращаясь при этом в «волшебную чёрную коробку».

Читать далее

Ближайшие события

Как облачные ассистенты и RAG‑технологии меняют работу с LLM: интервью с директором продуктовой разработки Cloud.ru

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров525

Привет, Хабр! Последнее время я много слышал, что в облачных технологиях появляются ИИ‑ассистенты. Они перестают быть экспериментом и становятся рабочим инструментом. Кроме того, нейросетевые модели всё больше появляются в разных облаках. Но как это выглядит с точки зрения разработчиков облачных платформ, и какие технологии лежат в основе таких сервисов? Об этом я поговорил на конференции GigaConf с директором продуктовой разработки Cloud.ru Владимиром Шульгой. Также в разговоре затронули темы RAG‑пайплайна, интеграции LLM в DevOps‑процессы, автоматизации рутинных операций и о том, как облачные ассистенты меняют пользовательский опыт. Приятного чтения!

Читать далее

Умный бедный и глупый богатый: диалектика ИИ-ассистентов в мире неравенства

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров610

В Бауманке, то есть в МГТУ им. Баумана, есть свой акселератор, где я сопровождаю проекты бауманцев-стартаперов. И если бы мне нужно было назвать главный тренд последних двух лет, я бы не задумываясь ответил: ИИ-ассистенты.

Каждый второй студент приходит с идеей «умного помощника»: кто-то хочет автоматизировать подбор резюме, кто-то — помогать студентам учиться, кто-то создать личного ассистента для CEO. Сейчас всё просто: купил API у OpenAI или Yandex, накидал промптов, сделал красивый интерфейс — и вперёд, на хакатон, в инкубатор, в венчур.

Но чем больше я погружаюсь в эти проекты, тем сильнее ощущаю тревожный диссонанс: стартаперы делают ИИ-ассистентов не потому, что понимают реальную потребность, а потому что это модно. Они часто действуют "методом тыка", из увлечения, а не из анализа и понимания своего потребителя.

Читать далее

Интеграционная платформа — enabler для построения ИИ-агентов

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров445

Привет, Хабр! Меня зовут Евгений Лукин, я CPO продукта MWS OctAPI — это интеграционная платформа, которую мы создали для задач МТС, но теперь предлагаем как продукт на рынке.

Интеграционные платформы… кажется, что это что-то скучное и уже давно commodity —  шины данных, kafka — вот это вот всё, что тут может быть интересного?

Да, но нет.

Читать далее

Как устроены нейросети для неспециалистов

Уровень сложностиПростой
Время на прочтение23 мин
Количество просмотров5.9K

Нам часто предлагают врубиться во что-то с места в карьер: «Вот я формулку нарисовал и всем понятно!».

Но не беспокойтесь, в начале же была не формула, в начале было слово, и вот о словах-то мы сейчас и поговорим. Я хочу этой статьей увлечь как гуманитариев, так и айтишников с математиками!

Понимаю, что у вас кружится голова от большого количества новых незнакомых понятий и терминов. Лучший способ все это уложить — пройти стопами тех людей, которые делали простые вещи, но называли это сложным, узнать историю развития и понять, почему все работает так, а не иначе.

Для этого нам придется углубиться в робопсихологию и робопсихиатрию!

В начале было слово...

И слово это было русское...

Лучшие нейросети 2025

Время на прочтение12 мин
Количество просмотров5.8K

Рынок потребительских GenAI-приложений стабилизируется: в свежем топ-100 от a16z всего 11 новичков в вебе против 17 в прошлом отчёте. ChatGPT всё ещё лидирует, но Google сокращает разрыв с Gemini, а Grok от X показывает взрывной рост.

Анализ данных Similarweb и Sensor Tower выявляет ключевые тренды, включая доминирование китайских видеомоделей и платформ для «vibe coding».

Читать далее

Как OpenAI передаёт ИИ «голос общества»: итоги коллективного эксперимента

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров780

OpenAI представила результаты масштабного исследования, в котором более тысячи человек со всего мира оценивали поведение языковых моделей в этически сложных ситуациях. Это часть программы по так называемой «коллективной настройке» (collective alignment), цель которой — приблизить ответы ИИ к общественным ожиданиям.

Читать далее

Записки с медицинской ИИ-фабрики

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров709

Мы обучаем медицине большую языковую модель GigaChat и создаём агентов для здравоохранения на её основе. Наша модель уже сдала множество экзаменов и даже устроилась на работу. Как и в других сферах ИИ, в медицине мы делаем то, что раньше было фантастикой, а теперь быстро входит в практику. Давайте я вам об этом расскажу.

Читать далее