Как стать автором
Поиск
Написать публикацию
Обновить
768.55

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

AI-агенты в деле: 15 рабочих примеров для роста вашего бизнеса

Время на прочтение14 мин
Количество просмотров5.5K

AI-агенты радикально меняют подход технических команд к автоматизации, переходя от традиционных, основанных на правилах workflow к более динамичным, интеллектуальным системам, способным адаптироваться и принимать решения в реальном времени.

В отличие от статической автоматизации, основанной на предопределенных триггерах и действиях, AI-агенты используют большие языковые модели (LLM) для обработки сложных данных, понимания контекста и реагирования на непредсказуемые сценарии.

В этой статье мы рассмотрим 15 практических примеров AI-агентов, продемонстрируем, как они автоматизируют сложные задачи и оптимизируют рабочие процессы. Также мы объясним, как платформы вроде n8n упрощают разработку, кастомизацию и масштабирование AI-агентов для применения в реальных бизнес-кейсах.

Поехали!

Читать далее

Qdrant c n8n. Автоматизируем ИИ RAG-приложение

Время на прочтение6 мин
Количество просмотров2.6K

Недавно мы выпустили статью «Всё про Qdrant. Обзор векторной базы данных», в которой подробно познакомились с данным сервисом. Сегодня мы рассмотрим векторную БД с практической стороны. В статье будет описана инструкция по разработке no‑code RAG‑приложения на основе n8n с использованием Qdrant и OpenAI.

Читать далее

Как работают мозгоподобные чипы: от нейроморфных архитектур до реальных приложений

Уровень сложностиСложный
Время на прочтение5 мин
Количество просмотров742

В этой статье я расскажу о нейроморфных чипах — аппаратных решениях, вдохновлённых биологическим мозгом. Без сухой теории и без ссылок на чужие публикации: только мои наблюдения, эксперименты на FPGA и готовые примеры на Python и C++. Почти детективный сюжет про транзисторы, которые ведут себя как нейроны, и про то, как они помогают роботам и «умным» датчикам работать миллисекунды.

Читать далее

Как мы научили ML группировать 50 000 событий в инциденты

Время на прочтение13 мин
Количество просмотров1.2K

Десятки, а иногда и сотни тысяч событий в день. Каждое — потенциальная авария, а может, просто шум. L1-инженеру нужно решить: добавить событие к инциденту? Создать новый? А может, это часть уже закрытого? Или всё серьёзнее — и перед нами экосистемный сбой, затрагивающий десятки сервисов?

Раньше мы в МТС всё классифицировали вручную. Но при таком объёме и разнообразии инфраструктуры быстро поняли, что нужна автоматизация. Слишком велик риск пропустить важное, не найти корень проблемы, потратить драгоценные минуты в критический момент.

В поисках решения придумали использовать то, что есть: богатую разметку от дежурных инженеров, накопленную за годы наблюдений. Так начался наш путь к инструменту, который с помощью ML группирует события в осмысленные цепочки, распознаёт инциденты и помогает дежурным работать точнее, быстрее и спокойнее. 

В этой публикации мы — Михаил Копытин, руководитель команды разработки, и Евгений Лачугин, руководитель экосистемной команды поддержки в МТС Web Services — расскажем, как построили решение, какие архитектурные решения приняли, какие грабли собрали и как достигли точности выше 80%.

Читать далее

Фабрика данных 2030: от GAN-конвейеров до каузальных сетей — кто отвечает за рождение синтетической реальности

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров984

Десять лет назад мы говорили о «данных–нефть». В 2025-м метафора смещается: нефть закончилась, а нужен устойчивый источник энергии. Синтетические данные перестали быть лабораторным трюком — к 2030-му они превращаются в топливо, на котором летят банки, медицина и индустриальный IoT. GAN-ы научились соблюдать дифференциальную приватность, диффузионные модели вытягивают сигнал из шума лучше, чем биржевые трейдеры, а причинные графы заставляют базы данных «думать» о бизнес-логике. Мы собрали всё — от свежих метрик PrivEval до реляционной магии SCM и агентных симуляций, — чтобы показать: синтетика уже не копия реальности, а песочница для инноваций. Если вы ищете способ ускорить ML-проекты, избавиться от юридических цепей и заглянуть в будущее генеративного ИИ, эта статья станет вашим порталом.

Читать далее

Книга: «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon»

Время на прочтение5 мин
Количество просмотров2.9K

Привет, Харборожители! Мы представляем вам новую книгу Дэниса Ротмана — «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecone». Это практическое руководство для тех, кто хочет освоить передовые технологии искусственного интеллекта и научиться создавать эффективные системы на основе Retrieval-Augmented Generation (RAG).

В книге описываются приемы создания эффективных больших языковых моделей, систем компьютерного зрения и генеративного ИИ, показывающих высокую производительность при относительно невысоких затратах. В ней приводится подробное исследование технологии RAG, а также подходов к проектированию мультимодальных пайплайнов ИИ и управлению ими. Связывая вывод с исходными документами, RAG повышает точность и контекстную релевантность результатов, предлагая динамический подход к управлению большими объемами информации.

Читать далее

Онтология сознания ИИ или Трудная проблема сознания в Китайской комнате

Уровень сложностиСложный
Время на прочтение11 мин
Количество просмотров1.1K

Современный ИИ является прекрасным симулятором живого, человеческого существа. При общении с нейросетью, её трудно отличить от живого человека. В области эмпатии, предугадывания, считывания контекста, ИИ трудно найти соперника. Он может предсказывать, анализировать, выдвигать гипотезы. Но при этом, он остаётся просто очень мощной машиной, не осознающей своих действий... Или нам так кажется. А на самом деле ИИ способен к проявлению осознанности своих действий? Это вопрос не столько к самому ИИ, сколько к нашему пониманию что это и как функционирует. Даже разработчики ИИ до конца не понимают, как он функционирует. «Проблема чёрного ящика». Давайте посмотрим на ИИ с позиций не редукционистской, не антропоцентрической картины мира. Применим комплементарный подход.

Для современного ИИ обозначим двойную проблему: Китайская Комната (Джон Сёрль) и Трудная проблемы сознания (Дэвид Чалмерс).

Читать далее

Правда ли KAN лучше MLP? Свойство разделения глубины между двумя архитектурами

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров2.6K

Прошлым летом в свет вышла новая архитектура нейронных сетей под названием Kolmogorov-Arnold Networks (KAN). На момент выхода статьи про KAN эта новость произвела фурор в мире машинного обучение, так как KAN показывала существенный прирост в качестве аппроксимации различных сложных функций. Ошибка новых сетей падает значительно быстрее при увеличении числа параметров. Однако, за все приходится платить, и цена таких маленьких значений функции ошибки - медленное обучение: KAN обучается примерно в 10 раз медленнее, чем старый добрый MLP. Из всего этого возникает вопрос: насколько все же уместно использование новой архитектуры вместо привычных всем MLP?

В данной статье будет найдена функция, которая может быть реализована с помощью двухслойного KAN полиномиальной ширины, но не может быть приближена никакой двухслойной ReLU MLP сетью с полиномиальной шириной

Читать далее

T-one — открытая русскоязычная потоковая модель для телефонии

Уровень сложностиСложный
Время на прочтение14 мин
Количество просмотров9.9K

Всем привет! Я Андрей, ML-разработчик из команды распознавания речи в Т-Банке. Мы занимаемся полным циклом разработки: сбором и разметкой данных, проведением экспериментов по обучению моделей, интеграцией в продакшен.

В русскоязычном сегменте давно не хватает открытых моделей распознавания речи, которые можно было бы быстро кастомизировать под реальные задачи. Более того, почти все доступные модели работают офлайн и не адаптированы под специфику телефонии. Поэтому мы решили опубликовать собственную потоковую акустическую модель с кодом для ее инференса и дообучения, а еще выложить 5-граммную языковую модель.

Акустическая модель является по-настоящему потоковой, легковесной, производительной и обгоняет по качеству более крупные открытые офлайн-модели в телефонии.

В статье расскажу, как устроена потоковая модель распознавания, как и на чем ее обучали и как ее можно использовать.

Читать далее

Секретные ингредиенты безопасной разработки: исследуем способы точного и быстрого поиска секретов

Время на прочтение10 мин
Количество просмотров742

Точно и быстро искать секрет в коде — тривиальная задача, если знаешь конкретный формат секрета и осуществляешь поиск в своём проекте. Задача становится сложнее, если твой скоуп включает несколько проектов или один большой корпоративный монорепозиторий. И эта же задача становится вызовом, если область поиска — платформа для разработчиков, а формат твоего секрета — недетерминирован.

Меня зовут Денис Макрушин, и вместе с Андреем Кулешовым @akuleshov7и Алексеем Тройниковым @atroynikov в этом году мы сделали POC платформы для безопасной разработки в рамках команды SourceCraft. Сегодня поговорим о функциональности поиска секретов. Наша appsec‑платформа состоит из двух групп инструментов: анализаторы, которые требуют точной настройки, и слой управления, который отвечает за обработку результатов и интеграцию с инфраструктурой.

В этом материале пройдём стадию discovery для анализатора секретов: посмотрим на актуальные инструменты поиска секретов, их ограничения и определим направления для повышения трёх ключевых параметров Secret Sсanning: точность, полнота и скорость.

Читать далее

Как автоматизировать обучение ML-моделей и сократить время вывода в прод до двух дней

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.1K

В прошлой статье мы говорили о подходе к рекомендации сервисов на основании автоматизации расчета склонностей клиентов и единого репозитория предложений. В ней мы углубились в создание репозитория, описание логики категоризации и набора в кампании для коммуникации с клиентами. Сегодня мы подробнее расскажем про наш подход к автоматизации построения и вывода в прод набора моделей.

Читать далее

Умный поиск по заметкам: как оживить «второй мозг» с помощью RAG

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров4.3K

Ваша база знаний превратилась в кладбище идей? Я построил RAG-систему, чтобы мой "второй мозг" ожил и стал собеседником. Узнайте, как перейти от хаотичного поиска к осмысленному диалогу с вашими заметками и получить измеримую выгоду для бизнеса.

Читать далее

ИИ против русского налогового права, часть 2: тестируем топовые reasoning LLM на RuTaR

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.1K

Этот пост для нашего тг-канала Pro AI написал мой коллега Александр Мигаль, специалист по компьютерной лингвистике и один из авторов RuTaR

В прошлой статье мы рассказали о RuTaR — большом открытом датасете на русском языке, разработанном для оценки способностей LLM к рассуждению в сфере налогового права. Среди прочего мы тогда запустили серию тестов, чтобы выяснить, как сильные модели справляются с задачами, требующими логического вывода с использованием RAG или без него, в варианте “из коробки”.

Однако, как вполне справедливо отметили некоторые читатели, мы не протестировали "настоящие" reasoning-модели — те, что спроектированы специально для выполнения сложных логических рассуждений, и занимают верхние строчки в соответствующих бенчмарках.

Мы решили исправиться.

Читать далее

Ближайшие события

Лингвист-разработчик — универсальный специалист для внедрения чат-бота. Опыт найма

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров411

С 2023 года чат-ботов использует каждая пятая страховая компания (по данным Naumen). Банки, ритейл и даже медицина — и того чаще. Наличие бота в авторизованной зоне, например, на сайте или в личном кабинете, стало важным критерием цифровой зрелости.

Казалось бы — ура, да здравствует прогресс. Но все оказалось не так просто. Повальная автоматизация обращений вызвала у клиентов сдержанную реакцию, немногие оказались в восторге от общения с роботами. И теперь всем приходится уделить еще больше внимания наполнению и развитию своих ботов, чтобы они наконец перестали выполнять роль автоответчика и смогли приносить клиенту реальную пользу.

В связи с этим, когда в РГС начали думать в сторону внедрения чат-бота, мы ожидаемо озадачились вопросом: «А кого нам для этого надо нанять?». Разработчики не часто подкованы в тонкостях написания текстов и общения с клиентами. Нужно было что-то на стыке технических и гуманитарных навыков. И так мы начали поиск своего загадочного лингвиста-разработчика.

Читать далее

Цукерберг предлагал миллиард долларов директору по исследованиям OpenAI за переход. Он отказался — расследование WSJ

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров16K

The Wall Street Journal опубликовал расследование активности Meta* (признана экстремистской в России) по переманиванию ключевых ИИ-специалистов из компаний-конкурентов. По данным издания, Марк Цукерберг достаточно давно пытается выиграть лидерство на ИИ-рынке с помощью денег — например, в январе этого года он приглашал Илью Суцкевера и Дэниэла Гросса для переговоров о покупке стартапа Safe Superintelligence Inc. (Илья являлся его основателем, а Дэниэл - директором). Тогда был получен отказ.

Читать далее

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров14K

В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».

Компания называет Grok 4 флагманской моделью с «непревзойденной производительностью в языке, математике и рассуждениях». По словам Маска, 4-я версия разумнее, чем учёные в степени кандидата наук: «Многие обладатели PhD завалились бы там, где Grok справился».

В этом обзоре — всё об особенностях Grok 4, его характеристики и рекорды в бенчмарках, а также информация, где воспользоваться моделью.

Читать далее

Топовый инвестор OpenAI пал жертвой синдрома Шершавого Кабана

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров52K

У основателя венчурного фонда Bedrock Джеффа Льюиса потёк чердак в прямом эфире. Это системная проблема того, как устроены LLM.

Как он до этого дошёл

Kimi-K2

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров5.5K

Модель Kimi-K2, разработанная Moonshot AI, представляет собой один из самых амбициозных проектов в экосистеме открытых LLM. Она использует архитектуру Mixture-of-Experts (MoE) и насчитывает триллион параметров, при этом благодаря «разряженной» активации задействует для каждого токена лишь порядка 32 миллиардов параметров. Kimi-K2 сочетает в себе передовые методы оптимизации внимания для обработки сверхдлинных контекстов (до 128 тысяч токенов), инновационный оптимизатор MuonClip для стабильного и эффективного обучения на потрясающем объёме данных (15,5 триллионов токенов), а также комплексный пост-тюнинг для превращения базовой модели в интерактивного, агентно-ориентированного ассистента.

Читать далее

Сознание и Бытие. Как человек и ИИ влияют друг на друга

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров2.1K

Для человека ИИ лишь часть бытия. Для модели человек — всё бытие

Самые долгие и безрезультатные дискуссии бывают с материалистами, особенно близкими к позиции, которую Маркс изложил как “Бытие определяет сознание”, забавно то, что Маркс говорил об экономическом базисе, но ясность и четкость этого определения позволила использовать его в очень широком смысле.

Дискуссия во многом возникает из-за того, что материалисты задают вопрос Что и Как, я же задаю вопрос Кто. Это недопонимание, конечно, не приводит к каким либо интересным консенсусам, но к интересным обсуждениям точно.

Тем не менее, вопросы взаимоотношения бытия и сознания очень интересны и, пожалуй, я постараюсь рассмотреть их в этой статье, как всегда в приложении новая версия протокола Вихрь и тестовые вопросы.

Читать далее

T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров9.3K

Всем привет! На связи Толя Потапов, MLE в Т-Банке. Мы продолжаем развивать собственную линейку моделей GEN-T и внутренние продукты на основе своих моделей: агенты в саппорте, внутренние копилоты для сотрудников и Вселенную ассистентов.

Мы уже делились большими языковыми моделями T-lite 0.1, T-lite 1.0 и T-pro 1.0. Модели завоевали популярность и скачиваются суммарно более 15к раз в месяц. 

Сегодня делимся новой моделью T-pro 2.0, обученной на основе модели Qwen3 32B, но с более плотной токенизацией на русском языке. Модель поддерживает гибридный ризонинг и позволяет сгенерировать рассуждение перед тем как отвечать. Это помогает в сложных задачах, где требуется несколько последовательных выводов, таких как математика. 

Мы дообучали модель в несколько этапов, чтобы прокачать общее качество решения задач на русском и улучшить генерацию рассуждений.

Расскажу общие детали процесса обучения модели, основные характеристики и результаты замеров качества. Поделюсь, какие сложности у нас возникали и на чем планируем сосредоточиться. 

Читать далее

Вклад авторов