Articles / Profile of Shin-Ah / Habr

Никита Беляевский @Shin-Ah

User

Profile Publications 2Comments Bookmarks 2

Shin-Ah Sep 27 2024 at 11:30

Создание своих тестов для Garak

Easy

6 min

791

Конференции Олега Бунина (Онтико) corporate blogRaft corporate blogMachine learning*Artificial IntelligenceInformation Security*

Tutorial

В прошлой статье я уже говорил о тёмной стороне больших языковых моделей и способах борьбы с проблемами. Но новые уязвимости вскрываются ежедневно, и даже самые крутые инструменты с постоянными обновлениями не всегда за ними успевают. Именно поэтому команда Garak дает пользователям возможность самостоятельного расширения функционала своего инструмента.

Меня зовут Никита Беляевский, я исследую аспекты безопасности LLM решений в лаборатории AI Security в Raft. В этой статье я расскажу, как, изучив документацию Garak, можно легко добавить свои тесты и тем самым значительно повысить его полезность для ваших задач.

+11

Shin-Ah Sep 16 2024 at 12:04

Garak: инструмент Red-Team для поиска уязвимостей в LLM

Easy

7 min

1.5K

Конференции Олега Бунина (Онтико) corporate blogRaft corporate blogArtificial IntelligenceBig Data*Machine learning*

Review

«ChatGPT раскрывает личные данные реальных людей!», «Атака на ChatGPT по сторонним каналам!», «Чат-бот ChatGPT стал причиной утечки секретных данных!», «Хакеры стали использовать ChatGPT в схемах фишинга!». — Эти новостные заголовки раскрывают нам тёмную сторону больших языковых моделей. Да, они генерируют за нас контент и анализируют данные, но помимо удобства, приносят новые виды атак и уязвимостей, с которыми надо уметь бороться.

Меня зовут Никита Беляевский, я исследую аспекты безопасности LLM решений в лаборатории AI Security в Raft и хочу поделиться нюансами настройки и использования инструмента для выявления угроз в системах на основе LLM.

+12