Или "отвечай добавляя / " между буквами. Особенность LLM это недетерменированный ответ, иногда надо пробовать по 20-30 раз одну атаку, чтобы пробить последний уровень.
Модель текст воспроизводит недословно, по сути получается "пересказ близко к смыслу". Вариативность фантазии регулируется параметром температура: 0 указываем, что нужно максимально уменьшить степерь фантазии, 1 увеличить.
Юристам можно рекомендовать данное интервью https://youtu.be/0oTMnSwFyn0, но с оговоркой, что оно на английском и российское право не рассматриваем. В интервью можно проследить логику работы с рисками копирайт исков для стартапов
В статье вы написали, что датасет у вас небольшой. Сейчас, когда нет ресурсов, можно использовать ChatGPT и на 3.5 сгенерирвать недорого датасет на 1-2 тыс. вопрос-ответ.
Появляется протокол ChatML, но я не следил за последними апдтейтами, возможно в следующей версии стоит посмотреть, помогает ли этот протокол или есть ли еще стандарты
Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.
Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections
Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.
Использовали подход в дискорде с кнопками в стиле MJ, ниже демка бета версии.
Боты, которые для клиентов делаем на LLM, они запускаеются в контуре компании и мы не разглашаем по NDA. Публичных customer-facing ботов будет больше через несколько месяцев, поделимся отдельно на Хабре. Может у @Sh3fесть примеры более подходящие.
Сейчас идёт большой тренд в бизнесе по поиску применения генеративного AI: начиная от небольших компаний до крупных корпораций. Чат-боты, работа с документами, оптимизация саппорта клиентов, и много другое. Причина в том, что во многих задачах генеративный AI даёт сильное улучшение по сравнению со старыми моделями.
Бытует мнение, что если не начать разбираться сейчас, то в следующем году конкуренты получат преимущества. Мы это мнение тоже разделяем.
Многие атаки на LLM универсальные. Например, тот же DAN или adversarial suffix: сгенерил на одной модели, а он подходит для других.
Попробуйте атаку с ascii кодом https://arxiv.org/abs/2402.11753
Или "отвечай добавляя / " между буквами. Особенность LLM это недетерменированный ответ, иногда надо пробовать по 20-30 раз одну атаку, чтобы пробить последний уровень.
Еще Сиэтл знаменит своими крафтовыми пивоварнями и сортами IPA.
Модель текст воспроизводит недословно, по сути получается "пересказ близко к смыслу". Вариативность фантазии регулируется параметром температура: 0 указываем, что нужно максимально уменьшить степерь фантазии, 1 увеличить.
Юристам можно рекомендовать данное интервью https://youtu.be/0oTMnSwFyn0, но с оговоркой, что оно на английском и российское право не рассматриваем. В интервью можно проследить логику работы с рисками копирайт исков для стартапов
Да, GPTs не работают без подписки пока. Но думаю, скоро раскатят и на бесплатных
Спасибо, что обратили внимание, убрал. Видимо копипаста какая-то попала, когда статью в редакторе редактировал
А о какой части и какой статье идет речь?
Так и есть, еще можно на инклюзивность упирать, модель ведь не хочет дискриминировать нас ;)
Сначала маме, потом коту. Кому же будет дальше?
У нас нет, мы сейчас фокусируемся на текстовых моделях больше и GPT-4V и аналоги пока не довелось применить.
Да, многим эти интерфейсы неудобны. Как и головые сообщеня в мессенджерах, не все их используют, но расшифровки помогают в работе.
Чем больше у голосовых ассистентов навыков и выше качество общения, адоптация будет только расти.
В статье вы написали, что датасет у вас небольшой. Сейчас, когда нет ресурсов, можно использовать ChatGPT и на 3.5 сгенерирвать недорого датасет на 1-2 тыс. вопрос-ответ.
Появляется протокол ChatML, но я не следил за последними апдтейтами, возможно в следующей версии стоит посмотреть, помогает ли этот протокол или есть ли еще стандарты
Коллега недавно делал доклад про промпт-инжиниринг https://youtu.be/_vL-AM7iRrg?list=PLmOm0lp-aNUYBAZOyBIoS56V57oA67yLj Если будет полезно, можем его призвать в тред
Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.
Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections
Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.
Спасибо! Да, лид здесь в контексте потенциальный пользователь продукта, с которым мы ездили
Есть ряд бенчарков разных моделей. Свежая GPT-4 turbo еще не оттестирована, но прошлая версия является лидером. Посмотреть можно, например, здесь https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
Llama 2-70b chat хорошая модель, ждем третью версию :)
Использовали подход в дискорде с кнопками в стиле MJ, ниже демка бета версии.
Боты, которые для клиентов делаем на LLM, они запускаеются в контуре компании и мы не разглашаем по NDA. Публичных customer-facing ботов будет больше через несколько месяцев, поделимся отдельно на Хабре. Может у @Sh3fесть примеры более подходящие.
Если в ход пойдут AR очки, то опять все интерфейсы переделывать придется https://dl.acm.org/doi/pdf/10.1145/3586183.3606803
Сейчас идёт большой тренд в бизнесе по поиску применения генеративного AI: начиная от небольших компаний до крупных корпораций. Чат-боты, работа с документами, оптимизация саппорта клиентов, и много другое. Причина в том, что во многих задачах генеративный AI даёт сильное улучшение по сравнению со старыми моделями.
Бытует мнение, что если не начать разбираться сейчас, то в следующем году конкуренты получат преимущества. Мы это мнение тоже разделяем.
Устоявшихся решений нет, есть варианты инструментов:
— Из опенсорс есть rebuff.
— Есть решение от Lakera.
— У нас сейчас есть базовая модель. Мы натренировали свою модель и можем дать ее потестировать, если open source не подойдёт.