Обновить
64K+
Raft
AI решения для бизнеса
118,06
Рейтинг
546
Подписчики
Сначала показывать

Non-Human Identity: как сервисные аккаунты стали цифровыми сотрудниками

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8.1K

Если вы давно работаете в безопасности или IT, то хорошо знаете этот сценарий, когда разработчик уходит из компании и его аккаунт деактивируется, но где-то в AWS тихо лежит IAM-ключ с правами админа, который он создал «на время». Никто не знает, что он есть, и никто не знает, что с ним делать. Он будет лежать там ещё два года.

Управление сервисными аккаунтами, API-ключами, OAuth-сертификатами проблема не новая. Однако, с приходом вездесущих ИИ-агентов появился свежий термин Non-Human Identity (NHI). Почему же вдруг NHI захватил конференции и слайды инвесторов?

Читать далее

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели9.7K

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT — быстрее, дешевле, без vendor lock‑in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

Читать далее

Безопасность ИИ: новый рынок для интеграторов и как на нем заработать

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.4K

Компании внедряют ИИ быстрее, чем успевают осознать все последствия, стремясь повысить эффективность и сократить издержки. Но эта гонка за инновациями создает слепую зону для безопасности. По результатам опроса ИБ-компаний, проведенному “Коммерсантом”, в 2026 году до 10% атак на банковские ИТ-инфраструктуры будут связаны с уязвимостями ИИ. На этом фоне растет интерес рынка к решениям и услугам в области тестирования ИИ на устойчивость к атакам. Это создает идеальный момент для интегратора, который может предложить рынку дефицитную компетенцию и закрыть растущую потребность в специализированном тестировании.

Читать далее

Что такое OpenClaw, о котором все говорят?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели60K

Для начала давайте я вас успокою - это не тот AGI, который собирается отобрать у вас работу. Ну, пока что не собирается🤔.

Хотя демонстрации его работы выглядят впечатляюще - и они действительно впечатляют, особенно если учесть, насколько простые идеи лежат в основе.

Читать далее

Обзор Open Source моделей для задачи TTS

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели14K

Задача Text‑to‑Speech (TTS) она же задача синтеза речи — заключается в том, чтобы озвучить заранее подготовленный текст голосом спикера. Данная задача является одной из важных в системах взаимодействия человека и компьютера. Конечно, такая задача генерации речи встречается гораздо реже, чем, например, задача генерации или обработки текста, тем не менее, сферы ее применения со временем только увеличиваются в своих масштабах и становится все более востребованной.

Привет, Хабр, меня зовут Музафаров Данил, я работаю DS инженером в компании Raft и сегодня мы рассмотрим существующие Open Source модели и репозитории, которые решают задачи TTS для русского языка.

Читать далее

GraphRAG: 8 способов укротить расширенный контекст у LLM

Уровень сложностиСложный
Время на прочтение24 мин
Охват и читатели5.6K

В 22% случаев онкологи не могут назначить лечение из-за рисков, связанных с хроническими заболеваниями. Сегодня разбираем кейс, в котором ИИ помогает врачам решать сложнейшие когнитивные задачи, связанные с лечением различных видов рака. Рассказываем про методологию GraphRAG, разбираем, как устроены и работают решения из кейса и проводим сравнительный анализ всех способов решить эту сложнейшую задачу.

Привет, Хабр! Это Андрей Носов, AI-архитектор из Raft. Я проектирую и создаю системы, которые должны стоять годами — сегодня речь пойдёт именно о них. В этой статье по мотивам моего доклада на AI Сonf 2025 я расскажу, как превратить стандартные RAG-системы из простых источников знаний в управляемый инструмент, способный справиться со сложным контекстом. Вас ждёт не просто технический обзор, а практическое руководство, где мы пойдём от прода к проду.

Читать далее

NER не про токены: почему span важнее BIO

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.1K

NER часто воспринимают как задачу классификации токенов: BIO-теги, последовательности меток, декодирование. Такой взгляд удобен с точки зрения моделей, но плохо отражает то, как NER работает в реальных системах.

Сущности - это не токены, а фрагменты текста. Результаты работы NER-систем, как правило, представлены в виде спанов - с явными границами начала и конца (start / end) и типами сущностей.

В этой статье мы разберём два уровня разметки в NER: span-level и token-level
и покажем, какую роль каждый из них играет в практических пайплайнах.

Читать далее

Можно ли доверить важные документы open-source LLM: эксперимент Рег.облака и Raft

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели8.4K

Привет, Хабр! На связи команды Рег.облака и Raft.

За последние годы автоматизация работы с юридическими документами прошла несколько этапов: регулярные выражения, классический NLP, первые нейросетевые модели. Почти всегда результат упирался в одно и то же — либо качество оказывалось недостаточным для бизнеса, либо сопровождение и доработки делали решение слишком дорогим.

В начале декабря Рег.облако выделило грант команде Raft на использование облачных серверов с GPU A100 80 ГБ. Задача эксперимента — проверить, как современные open-source LLM работают с длинными юридическими документами и можно ли использовать их для промышленного извлечения бизнес-критичных данных.

В этой статье мы разбираем результаты эксперимента: с какими ограничениями столкнулись, какие инженерные решения оказались критичными и к каким метрикам в итоге пришли.

Читать далее

Machine Unlearning. Часть 1: Почему моделям нужно уметь забывать

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели8K

Большие языковые модели (LLM) сегодня умеют невероятно много — от генерации текста до сложного анализа данных. Но что происходит, если часть информации, на которой они обучались, нужно удалить? Просто убрать лишние данные и переобучить модель может быть слишком накладно и дорого.

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о достаточно новом направлении машинного разучивания (Machine Unlearning), которое позволяет моделям “забывать” не нужные знания без полного их переобучения.

Читать далее

Подземелье c LLM-экспертами: используем PocketFlow и MCP для объяснения настолок

Уровень сложностиСредний
Время на прочтение29 мин
Охват и читатели9.7K

Всем привет! Меня зовут Артем, я Data Scientist компании RAFT. Сегодня я расскажу об своем pet проекте по объяснению правил для настольных игр. Цель данного проекта — понять, как можно собрать RAG агента без использования больших библиотек.

Читать далее

Обзор состояния AI за 2025 год и прогнозы на будущее

Уровень сложностиПростой
Время на прочтение18 мин
Охват и читатели9.3K

Год почти прошел и пришло время сделать обзор State of AI на этот год и прогнозы на следующий. За основу были взяты разношерстные источники со всего мира: отчеты MIT, PwC, OpenAi, Open Router и тп.

В корпоративном ландшафте искусственного интеллекта наблюдается огромный разрыв: организации широко используют инструменты ИИ, но лишь немногие получают измеримую отдачу. Фактически 95% не получают ровным счетом ничего - дырку от бублика, несмотря на огромные вложенные деньги.

Читать далее

Инструментарий вайбкодера: Supabase, Vercel и Railway

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели11K

Supabase — это краеугольный камень многих low-code и no-code платформ (Lovable — хороший тому пример) и он получил широкое распространение с приходом эпохи vibe-coding. Не просто так - им (супер)легко пользоваться как AI-кодинг агентам, так и углеродным формам жизни.

В некотором смысле он убирает необходимость иметь отдельного девопс / админа / администратора БД. Для стартапа преимущества очевидны: свободного времени и рук почти никогда не бывает. И, если честно, кому вообще хочется этим заниматься? Гораздо приятнее потратить это время более продуктивно - например, на думскроллинг в Twitter.

Читать далее

Построение AI агентов в медицине

Время на прочтение10 мин
Охват и читатели8K

Любой, кто пробовал создать ИИ‑ассистента для регулируемых областей вроде здравоохранения, знает — это не просто. Нужно балансировать между полезностью/гибкостью и политикой «не навреди». Особенно сложно, когда пытаешься запихнуть такие разные и конфликтующие поведения в одну модель.

Читать далее

Как мир регулирует ИИ

Время на прочтение9 мин
Охват и читатели9.2K

К 2025 году в мире искусственного интеллекта уже больше нормативных документов, чем рабочих моделей. США публикуют руководства для безопасного использования LLM, Европа принимает AI Act, в ОАЭ и Сингапуре появляются свои принципы ответственного ИИ. Россия тоже не стоит в стороне и нормативные требования активно у нас разрабатываются.

Уже действующие и готовящиеся нормы ЕС, США, Китая и России требуют от ИБ не просто контроля моделей, но и полноформатного аудита, документирования и управления реальными угрозами.

Мы в HiveTrace внимательно следим за этой эволюцией из практической необходимости: от того, как быстро и в каком направлении будет развиваться регуляторика, зависит, какие функции мы добавим в продукт завтра.

Читать далее

Ближайшие события

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели15K

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений.

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex.

Читать далее

OpenSource, или как я перестал бояться и полюбил автотесты

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели9.3K

Всем привет! Меня зовут Илья. Я давно читаю habr, не так долго занимаюсь программированием и еще чуть меньше времени хочу написать здесь статью. Не то, чтобы это идея фикс (или hotfix), но лучше опубликоваться и жалеть, чем поставить в план на «когда-нибудь потом», ничего не сделать, и «получить за это премию». Таких задач у меня уже накопилось на несколько жизней вперед, поэтому, приняв волевое решение, я выделил время на графоманию.

В прошлом мне доводилось писать околонаучные статьи и вести блог про путешествия, совершенные в разных стадиях трезвости (на рецензируемые статьи ВАК про пьяные авантюры, к сожалению, не хватило грантов). Но поскольку срок давности по этим событиям давно прошел, а все самое значимое я забыл, то опишу свой недавний опыт, связанный с OpenSource. 

Идея открытого программного обеспечения мне нравится. Люди, создающие OpenSource проекты вызывают интерес, особенно, когда их продукты востребованы и конкурентноспособны. Двигать индустрию IT в свободное от работы время, вместо того, чтобы предаваться гедонизму — достойно уважения. Особенно, когда сам активно пользуешься подобными продуктами, вместо платных аналогов или ручного труда.

Читать далее

Rules File Backdoor. Как атакуют GitHub Copilot и Cursor и почему «это ваша проблема»

Время на прочтение3 мин
Охват и читатели6.5K

Продолжаем серию статей о взломах ИИ. В начале 2025 года исследователи Pillar Security обнаружили новый вектор атаки, который переворачивает представление о безопасности AI‑ассистентов вроде GitHub Copilot и Cursor. Под видом безобидных конфигурационных файлов — тех самых, что задают ИИ правила написания кода — хакерам удалось протащить бэкдоры, вызвав цепную реакцию утечек и ошибок. Давайте разберемся, как безобидный файл с «правилами» превратился в оружие против цепочек поставок.

Читать далее

Расширяем базовый функционал n8n: от RAG до кастомного агента с MCP

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели28K

Компании и энтузиасты стремятся автоматизировать процессы, но не каждый готов писать код с нуля. Поэтому в последние годы особую популярность набрала no-code платформа n8n. С её помощью можно быстро собирать пайплайны различной сложности: от простых чат-ботов до умных ассистентов, которые управляют календарем и напоминают о задачах.  Обычно в статьях про n8n затрагивают только готовые блоки, собирают из них пайплайны автоматизации, но в то же время упоминают об ограниченности использования этой платформы. Действительно, базовых блоков в n8n может не хватать, чтобы закрыть все потребности пользователя, но сегодня я покажу, как можно обойти эти ограничения и расширить базовый функционал n8n.

Привет, Хабр! Меня зовут Музафаров Данил, я Data Scientist в компании Raft. В этом туториале я шаг за шагом покажу: как локально развернуть n8n, как добавить кастомные API и создать полноценного AI-агента с MCP tools с расширенным функционалом. Придется немного писать код, но главное, что это позволит оставить архитектуру решения на n8n, дополнив его кастомными тулами.

Читать далее

N8n: (не)реальные возможности и ограничения

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели92K

N8n сейчас у всех на слуху. Подростки создают рабочие процессы, которые автоматизируют целые отделы, а затем продают их за тысячи долларов в Twitter. Менеджеры, которые никогда не писали ни строчки кода, за ночь автоматизируют рабочие процессы всего своего отдела.

Звучит слишком хорошо, чтобы быть правдой?

Читать далее

Из зала на сцену: как, зачем и для чего выступать на конференции

Время на прочтение11 мин
Охват и читатели6K

Привет, Хабр! Меня зовут Евгений Кокуйкин. Я СЕО HiveTrace и сооснователь Raft. Занимался внедрением технологических решений в проектах Microsoft, Сбер, Diasoft, а сейчас переключился на обеспечение безопасности генеративного ИИ. Хочу рассказать о том, как созрел до того, чтобы стать докладчиком, почему подал свой первый доклад, откуда это пошло, как я участвовал в конференциях. Что от этого меняется, как помогает саморазвитию и бизнесу. Возможно, это поможет тем читателям, кто только думает подать заявку на конференцию.

Читать далее
1
23 ...

Информация

Сайт
raftds.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
Евгений Кокуйкин