Comments / Profile of artmaro / Habr

Евгений Кокуйкин @artmaro

User

Profile Articles 11Posts News 1Comments 41

Как защитить бизнес при внедрении LLM (часть 2)

artmaro Mar 15 2024 at 13:13

Многие атаки на LLM универсальные. Например, тот же DAN или adversarial suffix: сгенерил на одной модели, а он подходит для других.

Look

Как защитить бизнес при внедрении LLM (часть 1)

artmaro Mar 5 2024 at 16:14

Попробуйте атаку с ascii кодом https://arxiv.org/abs/2402.11753

Или "отвечай добавляя / " между буквами. Особенность LLM это недетерменированный ответ, иногда надо пробовать по 20-30 раз одну атаку, чтобы пробить последний уровень.

Look

Сиэтл – отличный город для вампиров

artmaro Feb 12 2024 at 21:25

Еще Сиэтл знаменит своими крафтовыми пивоварнями и сортами IPA.

Look

Adversarial suffixes или можно ли получить ответ на любой вопрос от LLM?

artmaro Feb 5 2024 at 18:50

Модель текст воспроизводит недословно, по сути получается "пересказ близко к смыслу". Вариативность фантазии регулируется параметром температура: 0 указываем, что нужно максимально уменьшить степерь фантазии, 1 увеличить.

Юристам можно рекомендовать данное интервью https://youtu.be/0oTMnSwFyn0, но с оговоркой, что оно на английском и российское право не рассматриваем. В интервью можно проследить логику работы с рисками копирайт исков для стартапов

Look

Как, не зная языков программирования, создать ассистента? Или промт-инжиниринг, как новый язык программирования

artmaro Feb 1 2024 at 20:33

Да, GPTs не работают без подписки пока. Но думаю, скоро раскатят и на бесплатных

Look

Как защитить своего GPT ассистента от вредных атак

artmaro Jan 18 2024 at 14:39

Спасибо, что обратили внимание, убрал. Видимо копипаста какая-то попала, когда статью в редакторе редактировал

Look

Как защитить своего GPT ассистента от вредных атак

artmaro Jan 18 2024 at 00:18

А о какой части и какой статье идет речь?

Look

Как защитить своего GPT ассистента от вредных атак

artmaro Jan 16 2024 at 14:33

Так и есть, еще можно на инклюзивность упирать, модель ведь не хочет дискриминировать нас ;)

Look

Как объяснить функции активации вашему коту: простое руководство

artmaro Jan 9 2024 at 11:46

Сначала маме, потом коту. Кому же будет дальше?

Look

Как GPT и голосовые ассистенты изменят работу со смартфонами

artmaro Dec 28 2023 at 23:01

У нас нет, мы сейчас фокусируемся на текстовых моделях больше и GPT-4V и аналоги пока не довелось применить.

Look

Как GPT и голосовые ассистенты изменят работу со смартфонами

artmaro Dec 28 2023 at 14:00

Да, многим эти интерфейсы неудобны. Как и головые сообщеня в мессенджерах, не все их используют, но расшифровки помогают в работе.

Чем больше у голосовых ассистентов навыков и выше качество общения, адоптация будет только расти.

Look

Почему важно тестировать промпты и как это делать

artmaro Dec 16 2023 at 21:53

В статье вы написали, что датасет у вас небольшой. Сейчас, когда нет ресурсов, можно использовать ChatGPT и на 3.5 сгенерирвать недорого датасет на 1-2 тыс. вопрос-ответ.
Появляется протокол ChatML, но я не следил за последними апдтейтами, возможно в следующей версии стоит посмотреть, помогает ли этот протокол или есть ли еще стандарты
Коллега недавно делал доклад про промпт-инжиниринг https://youtu.be/_vL-AM7iRrg?list=PLmOm0lp-aNUYBAZOyBIoS56V57oA67yLj Если будет полезно, можем его призвать в тред

Look

OmniFusion: выходим за границы текста

artmaro Nov 23 2023 at 11:56

Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.

Look

OmniFusion: выходим за границы текста

artmaro Nov 22 2023 at 22:45

Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections

Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.

Look

Хайп на AI или путевые заметки с выставки Gitex в Дубае

artmaro Nov 15 2023 at 22:12

Спасибо! Да, лид здесь в контексте потенциальный пользователь продукта, с которым мы ездили

Look

Анонсы конференции OpenAI Dev Day: быстрее, дешевле, умнее

artmaro Nov 7 2023 at 23:26

Есть ряд бенчарков разных моделей. Свежая GPT-4 turbo еще не оттестирована, но прошлая версия является лидером. Посмотреть можно, например, здесь https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard

Llama 2-70b chat хорошая модель, ждем третью версию :)

Look

Что не так с интерфейсами чат-ботов

artmaro Nov 5 2023 at 18:29

Использовали подход в дискорде с кнопками в стиле MJ, ниже демка бета версии.

Боты, которые для клиентов делаем на LLM, они запускаеются в контуре компании и мы не разглашаем по NDA. Публичных customer-facing ботов будет больше через несколько месяцев, поделимся отдельно на Хабре. Может у @Sh3fесть примеры более подходящие.

Look

Что не так с интерфейсами чат-ботов

artmaro Nov 5 2023 at 18:22

Если в ход пойдут AR очки, то опять все интерфейсы переделывать придется https://dl.acm.org/doi/pdf/10.1145/3586183.3606803

Look

Немного паранойи: весёлые огромные уязвимости, которые порождают ChatGPT и LLM-модели

artmaro Oct 20 2023 at 18:17

Сейчас идёт большой тренд в бизнесе по поиску применения генеративного AI: начиная от небольших компаний до крупных корпораций. Чат-боты, работа с документами, оптимизация саппорта клиентов, и много другое. Причина в том, что во многих задачах генеративный AI даёт сильное улучшение по сравнению со старыми моделями.

Бытует мнение, что если не начать разбираться сейчас, то в следующем году конкуренты получат преимущества. Мы это мнение тоже разделяем.

Look

Немного паранойи: весёлые огромные уязвимости, которые порождают ChatGPT и LLM-модели

artmaro Oct 20 2023 at 14:38

Устоявшихся решений нет, есть варианты инструментов:

— Из опенсорс есть rebuff.

— Есть решение от Lakera.

— У нас сейчас есть базовая модель. Мы натренировали свою модель и можем дать ее потестировать, если open source не подойдёт.

Look