Все потоки
Поиск
Написать публикацию
Обновить
1095.76

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Записки с медицинской ИИ-фабрики

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.2K

Мы обучаем медицине большую языковую модель GigaChat и создаём агентов для здравоохранения на её основе. Наша модель уже сдала множество экзаменов и даже устроилась на работу. Как и в других сферах ИИ, в медицине мы делаем то, что раньше было фантастикой, а теперь быстро входит в практику. Давайте я вам об этом расскажу.

Читать далее

Все LLM в одном окне: как мы сделали AI-сервис Daisy

Время на прочтение5 мин
Количество просмотров5.7K

Знакомьтесь, Daisy — наш сервис для быстрого доступа ко всем передовым LLM. Он вырос из инициативы друзей, которым хотелось разобраться, какие пользовательские сценарии работают в GenAI и как сделать удобный AI-based UX. Начав с внутреннего исследования, мы открыли доступ к сервису для внешнего мира и увидели, что им начали активно пользоваться.

За полгода у Daisy — 300 тыс. пользователей, 5 тыс. DAU и более 3,5 млн обращений к моделям. Рассказываем, как мы пошли дальше простого доступа к LLM через API — и сделали полноценный AI-сервис со своим подходом к архитектуре и взаимодействию с пользователями.

Читать далее

Тест-драйв Nano Banana (Gemini 2.5 Flash Image): новый фотошоп и революция в редактировании изображений от Google

Время на прочтение4 мин
Количество просмотров10K

Вчера вышла модель Gemini 2.5 Flash Image (промо название Nano Banana), которая, возможно, изменит мир работы с изображениями так, как это сделал своим появлением фотошоп. На превью — краткий пример возможностей, в посте — полная версия гифки и много классных экспериментов на все виды редактирования картинок, посмотрим с чем моделька справляется хорошо, а с чем не очень.

В заголовке написано «революция», «новый фотошоп» — это, возможно, все же преувеличение. Или нет. Штука очень крутая, залипал с ней до самого утра.

Давайте смотреть.

Читать далее

Процедурная память: как она упрощает и удешевляет работу ИИ-агентов

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.2K

Новая методика, разработанная учёными из Чжэцзянского университета и Alibaba Group, наделяет агентов больших языковых моделей (LLM) динамической памятью, делая их более эффективными и результативными при решении сложных задач. Этот подход, получивший название Memp, обеспечивает агентов «процедурной памятью», которая непрерывно обновляется по мере накопления опыта — подобно тому, как люди учатся через практику.

Memp формирует фреймворк для обучения в течение всей «жизни» агента, благодаря чему ему не приходится каждый раз начинать с нуля при работе с новой задачей. Вместо этого он становится всё более опытным и продуктивным, встречаясь с новыми ситуациями в реальной среде, что особенно важно для надёжной автоматизации в бизнесе.

Читать далее

ElizaOS v2: из мемного AI-фонда в полноценную систему для агентов

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров856

Помните ai16z, тот самый “хедж-фонд на ИИ” с отсылкой к Andreessen Horowitz? Так вот, из шутки он вырос в ElizaOS v2 — open-source фреймворк, который реально позволяет собирать автономных агентов.

Сегодня это уже не набор скриптов, а полноценная операционная система для цифровых компаньонов: с собственной памятью, мозгом (LLM) и возможностью работать напрямую с Web3 и внешними сервисами. Короче, из бот-игрушки он превратился в инструмент для серьёзных автономных агентов в Web3. В этой статье я разберу архитектуру ElizaOS v2, покажу ключевые компоненты и объясню, зачем она нужна нам, разработчикам.

Читать далее

Детальный гайд по выбору нейросети для Deep Research. Сравниваем ChatGPT, Gemini, Perplexity, Grok, Claude

Время на прочтение21 мин
Количество просмотров12K

AI-агенты экономят до 90 % времени на исследованиях, но по умолчанию выдают отчёты с сомнительными источниками и слабой логикой.

Чтобы получить результат уровня McKinsey, нужно управлять процессом: от постановки цели и контекста до контроля методологии и формата вывода.

Сравниваем ChatGPT, Gemini, Perplexity, Grok, Claude и разбираем шаги по подготовке промпта

Читать далее

Экономика результатов: Настоящая революция AI-агентов, которую все упускают

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров6K

За хайпом вокруг AI‑агентов скрывается фундаментальный сдвиг — переход от «экономики инструментов» к «экономике результатов». Эта статья представляет фреймворк «Трех горизонтов» для оценки бизнес‑амбиций и помогает технологическим лидерам сделать стратегический выбор: стать «Мастером», оптимизирующим процессы, или «Архитектором», строящим новые бизнес‑модели.

Читать далее

Как построить мультиагентную систему, которая реально работает без магии и костылей

Время на прочтение4 мин
Количество просмотров3.2K

LLM уже умеют рассуждать, но ценность раскрывается, когда они выполняют действия в реальных задачах: ходят в веб, считают, вызывают сервисы. Там начинается хаос интерфейсов и мучение с отладкой. AgentScope 1.0 предлагает цельную систему для практичных агентов: единые сообщения, инструменты и память, параллельное исполнение и продакшн‑рантайм. В статье разбираемся в том, как этот конструктор упорядочивает мультиагентные сценарии и ускоряет путь от идеи к работающему сервису.

Читать далее

Трекинг объектов по видео: как мы повышали точность, снижали ресурсоемкость, и к каким изменениям в продукте это привело

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.2K

Привет! Мы в Macroscop разрабатываем ПО для систем видеонаблюдения, которое умеет распознавать автономера, чекать спецодежду на рабочих, детектировать по видео задымленность и возгорания и решать еще около 20 задач, касающихся анализа видео.
Один из фокусов нашей команды - разработка собственной видеоаналитики, а также постоянное ее улучшение, выражающееся в росте точности, функциональности и производительности. 

Пару месяцев назад мы выпустили новую версию ПО, в которой в том числе значительно обновился нейросетевой модуль трекинга, отслеживающий траектории перемещения объектов, пересечение контрольных линий и длительное пребывание в охраняемых зонах.
Необходимость модернизации трекинга назрела, потому что за годы, прошедшие с момента разработки предыдущей версии, к нему накопился ряд пожеланий. Часть из них касалась повышения точности работы, часть - производительности модуля.
Возникла задача, обычно вызывающая холодный пот у разработчика: сделать так, чтобы трекинг работал точнее и при этом - быстрее.

К счастью, причины указанных проблем скрывались в разных частях алгоритма трекинга и были в большой степени независимы друг от друга. В результате нам удалось добиться повышения точности модуля при одновременном снижении затрат вычислительных ресурсов. А как мы это сделали- расскажем дальше.

Все смешалось – люди, кони кошки...

Первая сложность, связанная с точностью, лежала внутри обученного нами детектора-классификатора (YOLO), который обнаруживает в кадре объекты интересующих нас классов: транспорт разных типов, люди, животные. Выражалась она довольно специфическим образом: некоторые животные, особенно кошки и собаки, в определенных ракурсах (вид со спины и видны задние лапы, направленные параллельно туловищу) классифицировались как люди.

Как мы перестали путать кошек и людей

Следи за собой. Риски общения с ИИ

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров9.2K

Вопрос: сведет ли ИИ вас с ума? Хорошая новость — скорее всего нет.

За последние пять лет ИИ прошел путь от интересных экспериментов избранных инженеров и ученых, до фактически универсального помощника в каждом доме и офисе. 

Но появился и всерьез обсуждается незаявленный побочный эффект — психокогнитивная зависимость.

Эту статью я написал на основе личного опыта и опыта общения с увлеченными пользователями ИИ. Большая часть указанных рисков подтверждается научными исследованиями.

Читать далее

AI-агенты: low-code путь к автоматизации бизнеса без программистов

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.3K

Всем привет!

В последнее десятилетие бизнес развернулся в сторону автоматизации и цифровизации, активно стал внедрять ERP, BPM, OLAP-системы и многое другое в целях повышения эффективности, прозрачности и улучшения своего P&L.

С момента массового бума ChatGPT в 2022 году бизнес решил активно исследовать и эту область– по данным отчета McKinsey не менее 78% компаний уже сейчас используют генеративный интеллект (GenAI) как минимум в одном своем бизнес-процессе. Для России по разным источникам этот показатель на уровне ~37%.

Новый тренд – создание автономных AI агентов, способных дать буст в повышении эффективности и дополнительный доход для бизнеса. Но как их делать, где применять и есть ли смысл, особенно в период высоких ставок, где все усилия направлены на поддержание ROI, а иногда и на выживание? Об этом и хотел поговорить сегодня, разобрав конструкторы AI агентов – платформы, которые без особых знаний в кодинге позволяют создавать агентов за пару часов и внедрять в свои процессы.

Для кого эта статья – в основном ориентир на руководителей и представителей разного бизнеса, т.к. речь именно о том, зачем использовать конструкторы AI агентов и чем они отличаются от классического написания агентов.

Меня зовут Павел, вместе с командой делаем AI трансформацию в одном из ведущих российских банков, ранее работал в компании большой консалтинговой тройки, а также внедрял цифровые решения в других компаниях.

Как я уже упоминал выше 78% компаний уже внедрили GenAI хотя бы в один свой процесс – но где именно подавляющее большинство компаний нашли применение большим языковым моделям? В большинстве своем, GenAI решение в бизнесе AS IS – это помощник (co-pilot) сотрудника или клиента, при этом не всегда проводится дообучение / адаптация модели под реалии непосредственно компании. А на сколько это эффективно?

Читать далее

Преимущества BPMN AI-агентов

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.3K

Есть множество инструментов для создания AI-агентов, и в основе им нужно три вещи. Во-первых, им нужно понимать свою основную цель и правила, в рамках которых они должны работать. Например, вы можете создать агента и сказать ему: «Ты здесь, чтобы помогать клиентам с общими запросами о существующих услугах банка». Во-вторых, нам нужен промпт — это запрос к агенту, который агент может попытаться выполнить. И наконец, нужен набор инструментов — это действия и системы, к которым агент имеет доступ, чтобы исполнить запрос.

Большинство конструкторов агентов объединяют эти три требования в одну статическую, синхронную систему, но в Camunda мы решили этого не делать. Мы обнаружили, что это создаёт слишком много ограничений для применения, не масштабируется и сложно поддерживается. Чтобы преодолеть эти ограничения, мы придумали концепцию, которая позволяет разделить эти требования и полностью визуализировать агента так, чтобы открыть его для гораздо большего числа сценариев использования — не только на техническом уровне, но и в такой форме, которая снимает многие опасения у людей, добавляющих AI-агентов в свои основные процессы.

Читать далее

Воспроизводимый рейтинг: можно ли с помощью краудсорсинга предсказать выбор пользователей LLM?

Время на прочтение7 мин
Количество просмотров526

Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч реальных пользователей на нашем сайте LLM Arena

Причём не в жёсткой парадигме «оцени по инструкции», а приближаясь к реальному user preference, когда пользователь выбирает то, что ему субъективно больше нравится.

TL/DR: 

* Мы можем за 3 дня воспроизвести пользовательский рейтинг LLM с точностью 90%+;

* У нас есть отобранная команда аннотаторов и автоматический фильтр качества;

* Мы научились фильтровать фрод и мусорные промпты лучше, чем стандартные крауд-платформы;;

* Теперь мы можем быстро тестировать новые модели и выдавать предрейтинг до массового запуска.

Читать далее

Ближайшие события

Nano Banana от Google: генерация и редактирование изображений на новой архитектуре Gemini 2.5

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров33K

26 августа 2025 года Google представила новую preview-модель под кодовым названием Nano Banana — это часть экосистемы Gemini 2.5 Flash Image, ориентированной на генерацию и редактирование изображений с помощью текстовых и мультимодальных запросов. Несмотря на шутливое название, перед нами — серьёзный инструмент с претензией на роль нового стандарта в визуальном ИИ.

Читать далее

NVIDIA RTX 6000 Blackwell Server Edition: тесты, сравнение с Workstation и RTX 5090, особенности охлаждения

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.6K

Разбираем RTX 6000 Blackwell Server Edition: чем она отличается от Workstation и Max-Q, как работает пассивное охлаждение в серверах, результаты тестов в инференсе LLM и генерации видео, а также сравнение с RTX 5090, A5000 и H100.

Читать далее

Собираем свою систему оценки общения операторов КЦ и получаем отчёты в Telegram

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров751

Привет, Хабр! Сегодня покажем, как буквально за пару вечеров собрать систему, которая расшифровывает звонки, анализирует речь операторов и присылает руководителю отчёт в Telegram.

Например, в кол-центре с 15 операторами такая сводка поможет руководителю быстро понять, кто перегружен, где чаще звучит негатив, а кто просто слишком много говорит. Не надо слушать записи — отчёт сам всё рассказывает.

📊 Отчёт за 19 июля
🎧 Оператор дня: Иван Иванов (emotionScore: 0.42)
🥵 Больше всего негатива: Юлия Тестова (33%)
🗣️ Средняя скорость речи: 132 слов/мин
🤯 Самый «говорящий»: Андрей Максимов (74% времени)
🚨 Перебиваний в среднем: 2,7 на звонок

Читать далее

Как дообучать LLM на лету с помощью памяти вместо файнтюнинга

Время на прочтение4 мин
Количество просмотров6.4K

Реальные агентные задачи требуют множества шагов, вызова инструментов и гибкой памяти. Исследователи нашли возможность улучшать агента без файнтюнинга весов языковой модели: предлагается хранить удачные и неудачные кейсы и опираться на них при планировании. В итоге получились шикарные метрики на бенчмарках GAIA, SimpleQA и Human Last Exam. Разбираемся, как это работает.

Читать далее

LLM-агенты против ручного ресерча: кейс Bioptic в биофарме

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров959

При разработке новых лекарств важно вовремя оценить конкурентную среду – какие препараты уже существуют или находятся в разработке для той же болезни. Такой анализ конкурентов обычно входит в due diligence проекта: инвесторы и фармкомпании вручную собирают данные из разных источников о всех потенциальных конкурентах целевого препарата. 

Команда стартапа Bioptic (сооснователь — Андрей Дороничев) предложила автоматизировать эту рутинную работу с помощью агентной AI‑системы на базе больших языковых моделей (LLM).

Всем привет. Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO онлайн-университета zerocoder.ru. Сегодня узнал о еще одном важном шаге в деле ускорения анализа и сбора информации с помощью ИИ. На этом примере — в медицине.

Читать

ИИ и бессмертие: может ли алгоритм наследовать личность?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров964

Представьте будущее, где после вашей смерти близкие продолжают общаться с цифровой версией вас — она говорит вашим голосом, использует ваши шутки и хранит ваши воспоминания. Это не фантазия и не мистика, а результат работы искусственного интеллекта, обученного на ваших текстах, записях и сообщениях.

Возникает вопрос: если алгоритм воспроизводит мою манеру речи, мои мысли и воспоминания — это всё ещё я или лишь искусная копия?

Читать далее

Новый релиз публичного детектора голоса Silero VAD v6

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров3.5K

На Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут). А вот что стало лучше в этот раз:

Хочу узнать!

Вклад авторов