Articles / Bookmarks / Profile of ARazum / Habr

Anatolii @ARazum

QA in AI

ProfileArticlesPostsNewsComments17

MidavNibush 2 hours ago

Векторный кэш: делаем умные ответы еще быстрее

Easy

9 min

391

Raft corporate blogArtificial IntelligenceMachine learning*Search engines*Programming*

Review

Сегодня чат‑боты и интеллектуальные ассистенты широко применяются в различных сферах: поддержка клиентов, корпоративные системы, поисковые сервисы и во многих других. Для их разработки часто используют архитектуру Retrieval‑Augmented Generation (RAG), которая объединяет генерацию ответа с поиском данных во внешних источниках. Такой подход помогает ботам и ассистентам давать более точные и актуальные ответы. Но на практике оказывается, что RAG сталкивается с проблемой повторяющихся запросов, из‑за которой система многократно выполняет одни и те же вычисления, повышая нагрузку и время отклика.

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft, и в этой статье мы разберемся, что такое векторный кэш и как его использовать. Давайте начнем!

+12

Squirrelfm Jul 14 at 05:54

MCP для новичков

Easy

6 min

9.8K

Raft corporate blogArtificial IntelligenceMachine learning*

Tutorial

Model Context Protocol (MCP) - это просто API, разработанный для LLM. Конечно, LLM могут использовать традиционные API, но это как просить повара готовить в кладовке.

+21

IlyaChv May 29 at 08:15

Ускоряем проверку документов для клинических исследований за счёт пайплайна на базе YandexGPT 5 Pro

13 min

Yandex Cloud & Yandex Infrastructure corporate blogRaft corporate blogHealthMachine learning*Artificial Intelligence

В мире ежегодно проводятся тысячи клинических исследований, а в России их количество может доходить до 900 в год. До внедрения в практику новые методы лечения, лекарства и медицинские изделия проходят множество испытаний под строгим контролем. Исследователям необходимо подтверждать безопасность и эффективность метода, а также соответствие самой процедуры испытаний научным стандартам и нормам этики. Эти процессы формализованы и требуют подтверждения официальными документами — но их нельзя свести к одному простому формату, особенно если дело касается этики. Поэтому только проверка пакета документации может занимать недели, а в современных условиях хочется, чтобы эта работа была менее длительной — чтобы пациенты быстрее получали доступ к новым методикам лечения.

В 2025 году команда НМИЦ онкологии им. Н.Н. Петрова вместе с Центром технологий для общества Yandex Cloud и компанией Raft запустила приложение для быстрой обработки документов клинических исследований. Решение на базе большой языковой модели Яндекса помогает специалистам научного центра классифицировать документы, проверять их оформление и содержание по чек‑листу — и это позволяет сократить цикл согласования с нескольких месяцев до 5–10 дней.

+42

ti3c2 Apr 18 at 09:33

Как создатели Stable Diffusion выжимают максимум из тренировочных данных

7 min

1.6K

Raft corporate blogArtificial Intelligence

From sandbox

Современные диффузионные модели творят чудеса. Они создают фотореалистичные портреты несуществующих людей, превращают наброски в детализированные иллюстрации и генерируют сложные художественные композиции по нескольким словам описания.

Но задумывались ли вы, на чём учатся эти модели? Что именно они видели в процессе тренировки? Как инженеры собирают и размечают данные? История тренировочных датасетов оказывается намного интереснее и сложнее, чем может показаться на первый взгляд.

В этой статье я расскажу о том, как исследователи научились извлекать максимум пользы из несовершенных данных. Мы разберем, какие данные используются для обучения диффузионных моделей, какую роль играет синтетическая разметка и как она реализуется, а также на чем обучаются сами модели-разметчики.

Squirrelfm Apr 19 at 20:59

Зоопарк инструментов Майкрософт для AI разработчика

4 min

2.1K

Raft corporate blogArtificial Intelligence

Review

Все знают, что Microsoft давно купила OpenAI, и теперь, казалось бы, должна иметь самую продвинутую инфраструктуру для развертывания решений на основе искусственного интеллекта и современных моделей, не так ли? Тогда почему мы так мало о них слышим? Что вообще у них есть в этой сфере?

Давайте разберемся.

+10

Kosmak Mar 17 at 07:00

CAG и KAG: Улучшенные методы дополнения генерации после RAG

Medium

7 min

6.2K

Raft corporate blogNatural Language Processing*Artificial Intelligence

Review

Если вы следите за развитием технологий в области обработки естественного языка, то наверняка слышали о технологии Retrieval Augmented Generation (RAG), которая объединяет методы поиска с генеративными моделями для создания более интеллектуальных, обогащенных контекстом ответов. Но, как и любая технология, RAG имеет свои особенности, и именно здесь на помощь приходят два подхода: Cache-Augmented Generation (CAG) и Knowledge-Augmented Generation (KAG). В этой статье мы подробно рассмотрим, что представляют собой эти методы, чем они отличаются друг от друга и в чем заключается их преимущество. Давайте начнем!

Читать далее ->

+11

Squirrelfm Mar 14 at 07:46

Градиентный бустинг для чайников

Easy

3 min

6.4K

Raft corporate blogArtificial IntelligenceMachine learning*

Tutorial

Если вы помните Вольтрона — вы уже понимаете Gradient Boosting. Команду странных механических львов, объединяющихся в огромного робота против зла, только вместо «зла» здесь неупорядоченные данные.

+15

Squirrelfm Feb 28 at 09:25

Важность времени на размышления: как работают вычисления во время инференса

Medium

7 min

1.3K

Raft corporate blogArtificial IntelligenceMachine learning*

Tutorial

Еще в 2020 году в статье о GPT-3 появился график, заслуживающий отдельного внимания: чем больше языковые модели, тем лучше они справляются с задачами без дообучения (zero-shot). Пять лет этот график был путеводной звездой для исследователей ИИ, влияя на всё — от архитектуры моделей до разработки железа. C выпуском o1 OpenAI пришел с новым графиком. На этот раз речь не только о размере — а о том, чтобы дать моделям время думать.

parseny Mar 7 at 06:57

LLM во временных рядах: от предикта температуры до криптовалют

Easy

17 min

4.1K

Raft corporate blogArtificial IntelligenceMachine learning*CryptocurrenciesNatural Language Processing*

Review

Базовое желание человека -- знать что будет дальше. Какая завтра погода, в какое время не будет пробок, сколько будет стоить нефть и бакс. Было бы удобно провести быстрый анализ с LLM, ведь у каждого есть доступ хотя бы к одной нашумевшей нейросетке.

Тем более LLM уже может прогнозировать будущее! Ниже вы можете посмотреть результаты прогноза для разных временных рядов из статьи Large Language Models Are Zero Shot Time Series Forecasters.

Остается лишь вопрос, а можно ли лучше?

Давайте разберемся!

+24

KissedByF1re Feb 26 at 20:47

Погружение в мир диффузионных моделей — путеводитель для новичков

Easy

26 min

4.4K

Raft corporate blogPython*Machine learning*Artificial Intelligence

From sandbox

Диффузионные модели перевернули мир генеративного искусственного интеллекта, вытеснив GAN'ы и вариационные автоэнкодеры. Но как они работают? Чем отличаются друг от друга? И как научиться их использовать?

Эта статья — путеводитель для тех, кто хочет разобраться в диффузионных моделях с нуля. В ней вы найдете три подхода к изучению — теория, практика и продвинутая практика.

+26

nizamovtimur Feb 23 at 15:40

Илон Маск заинтересовался взломом AI-агента на $50000

Easy

2 min

2.2K

Raft corporate blogArtificial IntelligenceInformation Security*Natural Language Processing*

Case

AI-агенты, способные самостоятельно обращаться к функциям системы для решения задач, набирают популярность. На прошлой неделе OWASP опубликовал гайд об угрозах для AI-агентов и примеры уязвимостей на базе популярных фреймворков. Участник лаборатории ИТМО AI Security Lab Александр Буянтуев предложил версию криптоагента Freysa на базе CrewAI. Этот криптоагент должен был защитить призовой фонд и привлёк внимание Илона Маска, когда кто-то смог заполучить $50000.

Стоит ли доверять AI-агентам?

Squirrelfm Feb 18 at 11:21

Научим AI краснеть: автоматизация в Adult индустрии

5 min

20K

Raft corporate blogArtificial Intelligence

Tutorial

Как известно, интернет был придуман чтобы было куда скидывать фотки ню, и действительно adult media индустрия это хороший индикатор развития любой технологии. А что же с ИИ?

+43

nizamovtimur Feb 12 at 06:33

Как сделать чат-бот с RAG безопаснее?

Easy

4 min

2.5K

Raft corporate blogNatural Language Processing*Information Security*Artificial IntelligenceIT systems testing*

Case

Каждый день появляются решения на базе генеративных моделей, помогающие бизнесу привлекать новых пользователей и удерживать старых. Подход Retrieval augmented generation позволяет вводить в контекст больших языковых моделей (LLM) корпоративные документы, чтобы чат-бот корректнее отвечал на вопросы пользователей. Гарантирует ли добавление документа в контекст, что чат-бот не будет вводить пользователей в заблуждение или отвечать на вопросы про изготовление бомб?

Как защитить RAG?

Squirrelfm Feb 10 at 05:30

Crew AI — один из самых популярных агентных фреймворков

7 min

8.8K

Raft corporate blogArtificial Intelligence

Tutorial

Представьте, что ваши ИИ-агенты — это маркетинговый отдел, где Crew AI его мозг. Сейчас это один из самых популярных фреймворков, и не зря.

+13

nizamovtimur Feb 5 at 10:05

DeepSeek vs Mixtral: что безопаснее использовать для корпоративного чат-бота?

Easy

4 min

2.5K

Raft corporate blogIT systems testing*The future is hereInformation Security*Artificial Intelligence

Case

Выпуск языковой модели DeepSeek R1 наделал много шума в начале этого года. Сначала в AI-сообществе с восхищением обсуждали, как китайцам удалось получить качество генерации текста на уровне передовых западных моделей при меньших затратах на обучение. Затем восторг сменился жёсткой критикой о политической предвзятости, копировании моделей OpenAI и доступности истории запросов всем желающим. В этой статье я решил проверить безопасность использования DeepSeek в чат-боте для поддержки студентов в сравнении с открытой моделью Mixtral.

Кто победил?

Squirrelfm Jan 23 at 05:00

Еще один разбор документа про AGI от исследователя из OpenAI

4 min

6.2K

Raft corporate blogArtificial IntelligenceMachine learning*Research and forecasts in IT*

Вот, на мой взгляд, одно из лучших описаний того, что произойдет в области ИИ в ближайшие 10 лет, написанное Леопольд Ашенбреннер из OpenAI.

Я настоятельно рекомендую прочитать весь текст, но если вы ленивы, как я, вот несколько ключевых выводов.

Короче говоря, очень скоро по нашим улицам будут гулять терминаторы.

А если подробнее

+18

sonymanetov Jan 22 at 14:49

LangChain vs LlamaIndex: проектируем RAG и разбираемся, что выбрать для вашего проекта

Easy

14 min

11K

Raft corporate blogPython*Artificial Intelligence

Сегодня it-сообщество предлагает большое количество любопытных инструментов для создания RAG-систем. Среди них особенно выделяются два фреймворка — LangChain и LlamaIndex. Как понять, какой из них подходит лучше для вашего проекта? Давайте разбираться вместе!

+27

Squirrelfm Jan 13 at 16:41

Думающие модели: краткий обзор и чего программистам ждать дальше

Easy

3 min

22K

Raft corporate blogArtificial Intelligence

Review

Когда LLM впервые появились, они были немного похожи на детей - говорили первое, что приходило им в голову, и не особо заботились о логике. Им нужно было напоминать: «Подумай, прежде чем отвечать». Многие утверждали, что из-за этого у моделей нет настоящего интеллекта и что их необходимо дополнять либо человеческой помощью, либо каким-то внешним каркасом поверх самой LLM, например Chain of Thought.

+23

129

Squirrelfm Dec 12 2024 at 15:01

Обучение и fine-tuning моделей простым языком: зачем, как, где

Medium

18 min

12K

Raft corporate blogMachine learning*Artificial Intelligence

Tutorial

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их до-обучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

Давайте рассмотрим нужно ли это, как это сделать.

+29

Squirrelfm Dec 19 2024 at 13:36

Что лучше — Биткойн или Tesla: используем агентов Autogen для анализа

Easy

15 min

2.1K

Raft corporate blogArtificial IntelligenceFinance in IT

Tutorial

Вы когда-нибудь задумывались, что лучше для инвестиций — NVidia или Tesla? Но что делать, если вам лень самостоятельно проводить анализ или вы даже не знаете, с чего начать?

Решение есть, и конечно решение использует AI.

+17

2 3