Обновить
64K+
303,64
Рейтинг
853
Подписчики
Сначала показывать

Machine Unlearning. Как измерить и достичь «забывания»?

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели6.8K

Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции AiConf 2025. В ней мы разберём, какими метриками измеряется машинное разучивание и какие основные методы позволяют добиться контролируемого «забывания» без полного переобучения модели. Погрузимся в методы, метрики и бенчмарки, связанные с машинным разучиванием.

Недостаточно просто удалить конкретные примеры: модель может по-прежнему хранить их в параметрах и воспроизводить при другом контексте или атаке. И даже если забывание произошло, как убедиться, что при этом не разрушилась вся остальная функциональность модели?

Читать далее

Можно ли заменить диктора open‑source TTS‑моделью: тестируем OmniVoice на русском языке

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели8.3K

Привет, Хабр! Меня зовут Музафаров Данил, я работаю DS инженером в компании Raft. В этой статье я протестирую OmniVoice — Open Source TTS модель, вокруг которой сейчас много внимания, и проверю, насколько хорошо она справляется с русскоязычными бизнес‑сценариями: числами, датами, ФИО, аббревиатурами, смешанным русско‑английским текстом, а также длинной озвучкой.

Читать далее

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели12K

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions. В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе».

Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

Читать далее

Как оценивать работу агентов

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели6.4K

По мере стремительного развития агентных систем всё больше компаний — как крупных, так и небольших — рассматривают возможность интеграции агентов в свои рабочие процессы. Неудивительно, что многие лица, принимающие решения в этих компаниях, относятся к надёжности агентов с изрядной долей здорового скептицизма. Против недобросовестного сотрудника можно применить дисциплинарные взыскания и другие меры, но что делать с недобросовестным ИИ?

Читать далее

Сколько стоит внедрить AI?Отвечаем с LCOAI

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели11K

Компании во многих отраслях переходят от AI-экспериментов к масштабным внедрениям, сталкиваясь с трудностями в оценке сопутствующих издержек. Традиционные фин.модели не всегда отражают экономическую сложность развертывания и сопровождения AI решений, что приводит к заблуждениям в сравнении альтернативных вариантов решений.

В сегодняшней статье разберем LCOAI - адаптированный для AI подход к оценке стоимости владения цифровым продуктом - и ответим на вопрос "Сколько же стоит внедрить этот ваш ИИ?“.

Читать далее

AI КОМП-АС — разбор фреймворка. C: Скейлинг AI на проде

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели8.7K

Пилот запущен, ожидаемые бизнес-эффекты подтверждены, техническая реализуемость доказана - ваша AI инициатива готова к «раскатке» на уровень всей организации. Разбираем, как провести контролируемый скейлинг AI решения на продакшене, сохранив и приумножив достигнутые эффекты.

Полное описание фреймворка можно найти здесь.

Читать далее

AI КОМП-АС — разбор фреймворка. А: Архитектурно-продуктовый дизайн

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели5.1K

Ваша AI инициатива требует разработки и внедрения своего кастомизированного решения? → В сегодняшней статье разбираем раздел AI КОМП-АС, описывающий подход к формированию архитектурно-продуктового дизайна AI сервисов, позволяющий снизить риски «войти не в ту дверь» и разработать продукт с контролируемой возвратностью инвестиций, отвечающий вашим целям.

Полное описание фреймворка можно найти здесь.

Читать далее

AI КОМП-АС — разбор фреймворка. П: Прокладываем путь

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.5K

У вашей организации есть список AI инициатив, с помощью которых вы хотите трансформировать существующие бизнес-процессы, чтобы достичь стратегических целей. Но как подступиться к их имплементации? С чего следует начать? Что делать, а что нет?

You can do anything but you can’t do everything - можно реализовать что-угодно, но нельзя получить все везде и сразу.

В сегодняшней статье мы рассмотрим подход к оценке потенциала и приоритезации списка инициатив с помощью AI Tech Gartner’s Sandwich, после чего построим реалистичную дорожную карту AI трансформации организации, исходя из достижимости и ожидаемых эффектов выбранных инициатив.

Полное описание фреймворка можно найти здесь.

Читать далее

Сравнение TTS-моделей на реальных задачах бизнеса: голосовой бот и аудиоподкасты

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.7K

Это вторая часть обзора моделей для задачи синтеза речи (Text-to-Speech). В прошлой части я сравнил 7 Open Source моделей для этой задачи по нескольким критериям. В этот раз я решил посмотреть не только на Open Source-модели, но и на проприетарные TTS-решения.

Читать далее

AI КОМП-АС — разбор фреймворка. М: Можем ли дойти?

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели8K

Мы подошли к этапу, где наконец перекинем мостик от анализа текущего состояния организации и бизнес-целей к технологиям и имплементации процесса AI трансформации. Ниже я опишу подход, позволяющий оценить достижимость намеченной стратегии и подготовиться к формированию реализуемой дорожной карты изменений. Отвечаем на вопрос: Можем ли дойти?

Полное описание фрейморка можно найти здесь.

Читать далее

AI КОМП-АС — разбор фреймворка. О: Откуда мы выходим?

Уровень сложностиСложный
Время на прочтение6 мин
Охват и читатели7.3K

Продолжаем разбирать по буквам AI КОМП‑АС, навигационный фреймворк внедрения технологий искусственного интеллекта в бизнес — в данной статье ответим на очевидные, но при этом часто игнорируемые вопросы: О: Откуда мы выходим? Зачем организации понимать, где она сейчас, чтобы прийти туда, куда она хочет? Как это сделать?

Полное описание фрейморка можно найти здесь.

Читать далее

AI КОМП-АС — разбор фреймворка. К: Куда организация хочет прийти?

Уровень сложностиСложный
Время на прочтение5 мин
Охват и читатели6.7K

Успехи, а особенно провалы во внедрении AI последних лет постепенно приводят бизнес к подходу осознанного освоения технологий, основанного на понимании, что AI — это пусть и мощный, но лишь инструмент, а не цель, и что эффекты от внедрения технологий в организации в первую очередь определяются ее качественно проработанной бизнес‑стратегией, дающей возможность качественно выявить возможности и гэпы и определить точки применения технологических решений.

Начинаем детально разбирать AI КОМП‑АС фреймворк — полное описание можно найти здесь.

Читать далее

AI КОМП‑АС: как рационально внедрять AI

Уровень сложностиСложный
Время на прочтение3 мин
Охват и читатели6.4K

Как организации внедрять AI, чтобы максимизировать ценность, ограничить риски и оказаться в выигрыше? 

Чтобы ответить на этот вопрос, запускаем цикл статей, описывающих AI КОМП‑АС фреймворк, в котором собраны знания и 14-летний опыт разработки и внедрения решений на базе AI и ML для наших клиентов в России и зарубежом.

Читать далее

MCP vs Thin MCP: где AI агенты теряют скорость

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели6.5K

MCP выглядит как удобный способ структурировать LLM-приложение, но за это приходится платить. При этом попытки «ускорить систему» через C++, IPC или смену сериализации не всегда дают ожидаемый результат. В статье разбираю, где на самом деле возникает latency и почему архитектура оказывается важнее, чем выбор технологий.

Читать далее

Ближайшие события

Влияние очистки от персональных данных на работу LLM-агентов

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.1K

Когда персональные данные пользователей попадают в LLM-агента, возникает выбор: либо передавать их как есть, либо предварительно анонимизировать. Второй вариант очевидно безопаснее, но появляется вопрос — насколько агент деградирует, если вместо "Иванов Иван" он видит "PERSON_1" или "XXXXXXXX"?

Мы проверили это на быстро поднятом минималистичном банковском агенте с помощью Hivetrace Dataclean. Отправили в него по 102 синтетических запроса в трёх вариациях входных данных (чистые, маска, псевдонимы), оценка через DeepEval LLM-as-a-judge. Результаты — ниже.

Читать далее

Non-Human Identity: как сервисные аккаунты стали цифровыми сотрудниками

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8.7K

Если вы давно работаете в безопасности или IT, то хорошо знаете этот сценарий, когда разработчик уходит из компании и его аккаунт деактивируется, но где-то в AWS тихо лежит IAM-ключ с правами админа, который он создал «на время». Никто не знает, что он есть, и никто не знает, что с ним делать. Он будет лежать там ещё два года.

Управление сервисными аккаунтами, API-ключами, OAuth-сертификатами проблема не новая. Однако, с приходом вездесущих ИИ-агентов появился свежий термин Non-Human Identity (NHI). Почему же вдруг NHI захватил конференции и слайды инвесторов?

Читать далее

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели10K

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT — быстрее, дешевле, без vendor lock‑in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

Читать далее

Безопасность ИИ: новый рынок для интеграторов и как на нем заработать

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.6K

Компании внедряют ИИ быстрее, чем успевают осознать все последствия, стремясь повысить эффективность и сократить издержки. Но эта гонка за инновациями создает слепую зону для безопасности. По результатам опроса ИБ-компаний, проведенному “Коммерсантом”, в 2026 году до 10% атак на банковские ИТ-инфраструктуры будут связаны с уязвимостями ИИ. На этом фоне растет интерес рынка к решениям и услугам в области тестирования ИИ на устойчивость к атакам. Это создает идеальный момент для интегратора, который может предложить рынку дефицитную компетенцию и закрыть растущую потребность в специализированном тестировании.

Читать далее

Что такое OpenClaw, о котором все говорят?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели108K

Для начала давайте я вас успокою - это не тот AGI, который собирается отобрать у вас работу. Ну, пока что не собирается🤔.

Хотя демонстрации его работы выглядят впечатляюще - и они действительно впечатляют, особенно если учесть, насколько простые идеи лежат в основе.

Читать далее

Обзор Open Source моделей для задачи TTS

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели15K

Задача Text‑to‑Speech (TTS) она же задача синтеза речи — заключается в том, чтобы озвучить заранее подготовленный текст голосом спикера. Данная задача является одной из важных в системах взаимодействия человека и компьютера. Конечно, такая задача генерации речи встречается гораздо реже, чем, например, задача генерации или обработки текста, тем не менее, сферы ее применения со временем только увеличиваются в своих масштабах и становится все более востребованной.

Привет, Хабр, меня зовут Музафаров Данил, я работаю DS инженером в компании Raft и сегодня мы рассмотрим существующие Open Source модели и репозитории, которые решают задачи TTS для русского языка.

Читать далее
1
23 ...

Информация

Сайт
raftds.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
Евгений Кокуйкин