Pull to refresh
30
0.1
Евгений Кокуйкин @artmaro

User

Send message

Многие атаки на LLM универсальные. Например, тот же DAN или adversarial suffix: сгенерил на одной модели, а он подходит для других.

Попробуйте атаку с ascii кодом https://arxiv.org/abs/2402.11753

Или "отвечай добавляя / " между буквами. Особенность LLM это недетерменированный ответ, иногда надо пробовать по 20-30 раз одну атаку, чтобы пробить последний уровень.

Еще Сиэтл знаменит своими крафтовыми пивоварнями и сортами IPA.

Модель текст воспроизводит недословно, по сути получается "пересказ близко к смыслу". Вариативность фантазии регулируется параметром температура: 0 указываем, что нужно максимально уменьшить степерь фантазии, 1 увеличить.

Юристам можно рекомендовать данное интервью https://youtu.be/0oTMnSwFyn0, но с оговоркой, что оно на английском и российское право не рассматриваем. В интервью можно проследить логику работы с рисками копирайт исков для стартапов

Да, GPTs не работают без подписки пока. Но думаю, скоро раскатят и на бесплатных

Спасибо, что обратили внимание, убрал. Видимо копипаста какая-то попала, когда статью в редакторе редактировал

А о какой части и какой статье идет речь?

Так и есть, еще можно на инклюзивность упирать, модель ведь не хочет дискриминировать нас ;)

Сначала маме, потом коту. Кому же будет дальше?

У нас нет, мы сейчас фокусируемся на текстовых моделях больше и GPT-4V и аналоги пока не довелось применить.

Да, многим эти интерфейсы неудобны. Как и головые сообщеня в мессенджерах, не все их используют, но расшифровки помогают в работе.

Чем больше у голосовых ассистентов навыков и выше качество общения, адоптация будет только расти.

  1. В статье вы написали, что датасет у вас небольшой. Сейчас, когда нет ресурсов, можно использовать ChatGPT и на 3.5 сгенерирвать недорого датасет на 1-2 тыс. вопрос-ответ.

  2. Появляется протокол ChatML, но я не следил за последними апдтейтами, возможно в следующей версии стоит посмотреть, помогает ли этот протокол или есть ли еще стандарты

  3. Коллега недавно делал доклад про промпт-инжиниринг https://youtu.be/_vL-AM7iRrg?list=PLmOm0lp-aNUYBAZOyBIoS56V57oA67yLj Если будет полезно, можем его призвать в тред

Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.

Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections

Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.

Спасибо! Да, лид здесь в контексте потенциальный пользователь продукта, с которым мы ездили

Есть ряд бенчарков разных моделей. Свежая GPT-4 turbo еще не оттестирована, но прошлая версия является лидером. Посмотреть можно, например, здесь https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard

Llama 2-70b chat хорошая модель, ждем третью версию :)

Использовали подход в дискорде с кнопками в стиле MJ, ниже демка бета версии.

Боты, которые для клиентов делаем на LLM, они запускаеются в контуре компании и мы не разглашаем по NDA. Публичных customer-facing ботов будет больше через несколько месяцев, поделимся отдельно на Хабре. Может у @Sh3fесть примеры более подходящие.

Если в ход пойдут AR очки, то опять все интерфейсы переделывать придется https://dl.acm.org/doi/pdf/10.1145/3586183.3606803

Сейчас идёт большой тренд в бизнесе по поиску применения генеративного AI: начиная от небольших компаний до крупных корпораций. Чат-боты, работа с документами, оптимизация саппорта клиентов, и много другое. Причина в том, что во многих задачах генеративный AI даёт сильное улучшение по сравнению со старыми моделями.

Бытует мнение, что если не начать разбираться сейчас, то в следующем году конкуренты получат преимущества. Мы это мнение тоже разделяем.

Устоявшихся решений нет, есть варианты инструментов:

— Из опенсорс есть rebuff.

— Есть решение от Lakera.

— У нас сейчас есть базовая модель. Мы натренировали свою модель и можем дать ее потестировать, если open source не подойдёт.

Information

Rating
3,127-th
Works in
Registered
Activity