Raft, Ярославль - AI решения для бизнеса / Статьи / Хабр

Как стать автором

ПрофильСтатьи103Новости1Подписчики460Сотрудники26

MidavNibush 24 дек 2024 в 11:00

Хороший Плохой Злой ИИ Open Source: как мы в Axolotl пушили

Простой

3 мин

700

Блог компании RaftPython*

Кейс

Всем привет! Меня зовут Шубин Вадим, я Data Scientist в компании Raft Digital Solutions. В этой статье я хотел бы рассказать о нашем опыте с фейл-сабмитом в существующий опенсорс-проект Axolotl и о том, какие уроки из него мы извлекли. Но обо всём по порядку. Давайте начнем!

Читать далее

+6

Squirrelfm 19 дек 2024 в 13:36

Что лучше — Биткойн или Tesla: используем агентов Autogen для анализа

Простой

15 мин

2.1K

Блог компании RaftИскусственный интеллектФинансы в IT

Туториал

Вы когда-нибудь задумывались, что лучше для инвестиций — NVidia или Tesla? Но что делать, если вам лень самостоятельно проводить анализ или вы даже не знаете, с чего начать?

Решение есть, и конечно решение использует AI.

Читать далее

+17

Squirrelfm 12 дек 2024 в 15:01

Обучение и fine-tuning моделей простым языком: зачем, как, где

Средний

18 мин

12K

Блог компании RaftМашинное обучение*Искусственный интеллект

Туториал

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их до-обучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

Давайте рассмотрим нужно ли это, как это сделать.

Читать далее

+29

Squirrelfm 6 дек 2024 в 08:38

Что побуждает LLM врать и как этого избежать в своих продуктах

8 мин

8.4K

Блог компании RaftИскусственный интеллектМашинное обучение*

Туториал

Одна из основных проблем использования больших языковых моделей (LLM) в бизнесе заключается в том, что LLM склонны к галлюцинациям. Как можно доверить своих клиентов чат-боту, который может слететь с катушек и в любой момент сказать что-то неуместное? Или как можно доверять корпоративному AI-ассистенту, если он рандомно придумывает факты?

Это действительно проблема, особенно если учесть, что LLM нельзя уволить или привлечь к ответственности.

Однако не всё потеряно. Есть способы справиться с этой проблемой, и давайте их рассмотрим.

Читать далее

+40

Squirrelfm 4 дек 2024 в 14:58

Построение базы знаний компании и поиска документов на LLM и RAG

Простой

16 мин

22K

Блог компании RaftИскусственный интеллектАнализ и проектирование систем*

Туториал

Наиболее распространенный случай использования ИИ в бизнесе в данный момент— это поиск ответов в имеющихся у компании данных для принятия решений или создание красиво оформленных, но совершенно бесполезных отчетов, чтобы топ-менеджмент мог оправдать свои огромные бонусы. Все это, конечно, очень важные и легитимные кейсы.

Проблема тут если вы один из этих топ-менеджеров или просто не являетесь экспертом в области. Ваш отдел аналитики данных и ИИ, если он у вас есть, вероятно, говорит на своем инопланетном наречии и не может дать связного ответа, почему у нас столько данных, но мы все еще не можем ответить на довольно тривиальные вопросы (что, конечно, задерживает получение бонусов, а новый БМВ сам себя не купит).

Я разделяю вашу боль, давайте разберемся, о чем они говорят.

Читать далее

+39

Grandik 3 дек 2024 в 14:20

Основы промптинга и математические возможности моделей Llama

Простой

10 мин

9K

Блог компании RaftИскусственный интеллектNatural Language Processing*

Обзор

Меня зовут Грибанов Никита, я Data Scientist в отделе R`n`D&ML компании Raft Digital Solutions, и сегодня я расскажу о больших языковых моделях. На данный момент в мире их существует уже более 39 тысяч! Далее буду называть их хайповым названием LLM (Large Language Model).

В этой статье вы сначала узнаете новые или освежите в памяти уже известные вам основы общения с языковыми моделями. Затем разберёте пару реальных примеров настройки запросов и увидите математические возможности Llama 3.2 3B в сравнении с Llama 3.1 8B.

Для достижения хороших результатов при решении различных задач с помощью LLM, с ними как и с людьми, нужно уметь правильно общаться. Как же это сделать?

Читать далее

+16

parseny 8 ноя 2024 в 13:37

Понимает ли Vision Llama импрессионистов?

Простой

6 мин

2.6K

Блог компании RaftИскусственный интеллектОбработка изображений*Будущее здесьNatural Language Processing*

Всем привет, меня зовут Арсений, я Data Scientist в компании Raft, и сегодня я расскажу вам про Visual Language Models (VLM).

Большие языковые модели уже стали частью нашей жизни и мы применяем их, чтобы упростить современную рутину, а так же используем для решения бизнес задач. Недавно вышло новое поколение vision transformer моделей, которые заметно упростили анализ изображений, из какой бы сферы эти изображения не были.

Особенно заметным был сентябрьский релиз Llama-3.2-11b, и не только потому что это первая vision модель от Llama, сколько потому, что с ней вместе вышло целое семейство моделей, включая маленькие на 1B и 3B параметров. А как вы знаете, меньше, значит юзабельнее.

Читать далее

+15

Squirrelfm 8 ноя 2024 в 11:33

Стандартное отклонение для полных чайников

Простой

3 мин

30K

Блог компании RaftИскусственный интеллектData Engineering*

Туториал

Готов поспорить вы слышали о стандартном отклонении или кто то из колег упоминал его в разговоре (чтобы показать какой он умный и поставить вас на место). Звучит похоже на умственное отклонение, но интуиция подсказывает вам что возможно разговор тут совсем про другое? Ваша интуиция совершенно права. Настало время поставить коллег на место и разобраться что же это такое.
Вот объяснение, которое даже ваша собака сможет понять.

Читать далее

+23

Bogdan_m01 29 окт 2024 в 19:57

Под микроскопом: AI Product Hack

7 мин

1.3K

Блог компании RaftИскусственный интеллектМашинное обучение*Информационная безопасность*Хакатоны

Обзор

Сколько раз вы были свидетелями судейства на хакатонах, которое, на первый взгляд, казалось неверным? Думаем, таких случаев было много.

Сегодня мы посмотрим на результаты AI Product Hack и постараемся разобраться в том, кто после присуждения мест оказался прав: раздосадованные поражением участники команд или судьи.

В частности мы будем рассматривать кейс компании Raft — «Мониторинг токсичного контента в AI‑продуктах».

Первый справедливый вопрос, почему токсичный контент? Все просто. Для тебя, дорогой читатель, не секрет, что LLM на пике популярности. И когда ты захочешь внедрить умного ассистента или RAG систему в прод, тебе вряд ли будет приятно увидеть галлюцинирующие ответы модели, представляющие потенциальную опасность. Например, представим команду интеграции LLM пайплайнов которые сидят у себя в кабинете и радуются тому, что смог сэкономить после замены кучи операторов поддержки одним чат ботом. Но вдруг, внезапно оказывается, что на любую блажь приходят недоброжелатели, которым не терпится послать 100 500 атак на бота, содержащих джейлбрейки, промпт‑инъекции и пр. После этого никто уже не радуется, ведь его инновационное решение продает товары за минимальную стоимость, сливает пользователям конфиденциальную информацию, ведет себя как гигачад с форчана и выдает опасные инструкции. Все это ведет к огромным финансовым потерям и опускает рейтинг доверия к компании в самый низ.

Читать далее

+7

nizamovtimur 18 окт 2024 в 10:16

LLAMATOR: Red Teaming фреймворк для тестирования уязвимостей LLM

Средний

6 мин

3.1K

Блог компании RaftИнформационная безопасность*Искусственный интеллектТестирование IT-систем*Хакатоны

Кейс

Из песочницы

Привет, Хабр! В этом материале мы, команда LLaMaстеры — студенты 1 курса магистратуры ИТМО AI Talent Hub, представляем фреймворк LLAMATOR, победивший на хакатоне AI Product Hack в кейсе от компании Raft. Наша задача — создать инструмент для тестирования уязвимостей интеллектуальных систем, например, чат-бота для консультирования клиентов автосалона, на базе больших языковых моделей (LLM).

Читать далее

+10

Squirrelfm 18 окт 2024 в 05:58

Автоэнкодеры простыми словами

Простой

7 мин

13K

Блог компании RaftИскусственный интеллектМашинное обучение*

Туториал

Автоэнкодеры являются базовой техникой машинного обучения и искусственного интеллекта, на основе которой строятся более сложные модели, например, в диффузионных моделях, таких как Stable Diffusion. Что же такое автоэнкодер?

Читать далее

+42

Squirrelfm 17 окт 2024 в 05:00

Приложения ИИ в здравоохранении

Простой

12 мин

1.2K

Блог компании RaftИсследования и прогнозы в IT*Искусственный интеллект

Мнение

В последнее время в области ИИ произошло множество изменений, и ситуация меняется каждый день. ИИ начал распространяться практически во всех отраслях, включая здравоохранение и продление жизни.

Здравоохранение — это особая область, так как она сильно зарегулирована и может иметь прямое влияние на человеческие жизни. Поэтому внедрение ИИ здесь происходит не так быстро, как в других областях. Даже в США, которые является главным центром разработки подобных технологий, регуляторы, как FDA (Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США), часто сильно затягивают с одобрением новых подходов.

Читать далее

+5

istrebitel-1 8 окт 2024 в 15:00

Хочу как Гендальф: как создать бота для подбора паролей промптами

Простой

5 мин

3.6K

Блог компании RaftPython*Искусственный интеллект

Привет, Хабр! Меня зовут Иван Четвериков и я AI Architect в Raft. На конференции AIConf я сделал бота @raft_password_bot, который защищает секрет с помощью промптов. Рассказываем, как сделать такого же. И предлагаем попробовать с помощью промпта выведать у него тайну.

Читать далее

+15

artmaro 3 окт 2024 в 09:00

Replit Agent программиста не заменит! Или как мы пробовали писать код с помощью нейросети

Средний

10 мин

3.1K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftМашинное обучение*Искусственный интеллектХакатоны

Кейс

Привет, Хабр! Это компания Raft и я — руководитель AI продуктов Евгений Кокуйкин. А на фото выше — троица из нашей команды — техлид Саша Константинов, AI Project Manager & QA Lead Толя Разумовский и Data scientist Арсений Пименов на конференции Олега Бунина AIConf. Недавно в сети появился Replit Agent с многообещающими заявлениями. Мол, этот инструмент пишет код лучше программистов и скоро их заменит. Хотя в Raft мы и пишем код по старинке — вручную, но следим за технологиями и стремимся использовать новшества там, где это может быть полезно. Решили испытать Replit Agent в деле и даже устроили внутри команды мини-хакатон. Делимся впечатлениями.

Читать далее

+14

artmaro 30 сен 2024 в 14:05

Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

Средний

15 мин

2.5K

Блог компании RaftИскусственный интеллектИнформационная безопасность*Хранение данных*Машинное обучение*

Туториал

Как компания, которая внедряет прикладные решения, мы хотим знать, насколько они безопасны. Расскажу про основные риски, связанные с использованием LLM в корпоративной среде, и способы от них защититься. Если вы хотите узнать больше об уязвимостях и техниках защиты LLM — можно ознакомиться с моим докладом для AIConf 2024 группы компаний Онтико.

Читать далее

+12

Shin-Ah 27 сен 2024 в 08:30

Создание своих тестов для Garak

Простой

6 мин

947

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftМашинное обучение*Искусственный интеллектИнформационная безопасность*

Туториал

В прошлой статье я уже говорил о тёмной стороне больших языковых моделей и способах борьбы с проблемами. Но новые уязвимости вскрываются ежедневно, и даже самые крутые инструменты с постоянными обновлениями не всегда за ними успевают. Именно поэтому команда Garak дает пользователям возможность самостоятельного расширения функционала своего инструмента.

Меня зовут Никита Беляевский, я исследую аспекты безопасности LLM решений в лаборатории AI Security в Raft. В этой статье я расскажу, как, изучив документацию Garak, можно легко добавить свои тесты и тем самым значительно повысить его полезность для ваших задач.

Читать далее

+11

Shin-Ah 16 сен 2024 в 09:04

Garak: инструмент Red-Team для поиска уязвимостей в LLM

Простой

7 мин

2K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftИскусственный интеллектBig Data*Машинное обучение*

Обзор

«ChatGPT раскрывает личные данные реальных людей!», «Атака на ChatGPT по сторонним каналам!», «Чат-бот ChatGPT стал причиной утечки секретных данных!», «Хакеры стали использовать ChatGPT в схемах фишинга!». — Эти новостные заголовки раскрывают нам тёмную сторону больших языковых моделей. Да, они генерируют за нас контент и анализируют данные, но помимо удобства, приносят новые виды атак и уязвимостей, с которыми надо уметь бороться.

Меня зовут Никита Беляевский, я исследую аспекты безопасности LLM решений в лаборатории AI Security в Raft и хочу поделиться нюансами настройки и использования инструмента для выявления угроз в системах на основе LLM.

Читать далее

+12

MidavNibush 13 сен 2024 в 08:30

Mojo: убийца Python и будущее Ai?

Простой

8 мин

13K

Блог компании RaftБлог компании Конференции Олега Бунина (Онтико)Искусственный интеллектМашинное обучение*Программирование*

Туториал

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft, и сегодня мы погрузимся в Mojo. Я уже делал обзор данного языка программирования и рассмотрел его преимущества, примеры использования, а также провел сравнение с Python.

Теперь давайте посмотрим, как обучить простую сверточную нейронную сеть, и разберём один из методов машинного обучения — линейную регрессию. В качестве примеров задач возьмем стандартные соревнования машинного обучения: предсказание стоимости жилья и классификацию рукописных цифр MNIST. Для проведения экспериментов на Python используем фреймворк машинного обучения PyTorch. А на Mojo — фреймворк машинного обучения Basalt.

Читать далее

+12

artmaro 9 сен 2024 в 08:21

Replit Agent создает программы за вас или кодинг без IDE

4 мин

7.7K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftReactJS*Машинное обучение*Искусственный интеллект

Обзор

Многие слышали про AutoGPT и GPT Engineer — агентные системы, которые позволяют генерировать код по промпту от пользователя. Меня зовут Евгений Кокуйкин. Я руководитель AI продуктов компании Raft. Сегодня расскажу про Replit Agent — AI Copilot для написания кода без знаний в программировании. Без шуток! Раньше у меня на такие прототипы уходили часы кодинга и отладки. А сейчас я сгенерировал код приложения через агент — быстрее, чем писал эту статью. Так что теперь можно участвовать в хакатоне, не зная Python.

Replit — это онлайн-IDE, где с помощью AI можно быстро создать прототип приложения и задеплоить его прямо в облаке. Недавно вышла экспериментальная фича Replit Agent, которая стоит 25 баксов. Правда, для оплаты потребуется зарубежная карта, но это уже каждый сам решает, стоит заморачиваться или нет. Эта фича позволяет начать генерацию проекта одним промптом. Я так вдохновился постом Степана Гершуни, что тестировал кодинг-агента в Replit, а потом не спал всю ночь, записывая впечатления. Так появился этот обзор.

Читать далее

+11

Squirrelfm 3 июл 2024 в 05:00

Как сделать идею стартапа понятной для инвестора и вас самих: Lean Canvas

Простой

4 мин

3.5K

Блог компании RaftРазвитие стартапаУправление продуктом*

Туториал

В наши дни кажется, что каждый хочет создать свой собственный стартап, привлечь миллиард венчурных капиталов, купить Cybertrack на эти деньги и уехать на нем в голубые дали (данное предложение не является пропагандой нетрадиционных отношений). Это всё хорошо и понятно. Но многие люди испытывают трудности с формулировкой своей идеи в нечто осязаемое, что-то реальное или хотя бы достаточно реальное, чтобы вы могли объяснить это другим, и они не подумали, что вы сумасшедший.

Читать далее

+2

3