В статье вы написали, что датасет у вас небольшой. Сейчас, когда нет ресурсов, можно использовать ChatGPT и на 3.5 сгенерирвать недорого датасет на 1-2 тыс. вопрос-ответ.
Появляется протокол ChatML, но я не следил за последними апдтейтами, возможно в следующей версии стоит посмотреть, помогает ли этот протокол или есть ли еще стандарты
Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.
Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections
Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.
Использовали подход в дискорде с кнопками в стиле MJ, ниже демка бета версии.
Боты, которые для клиентов делаем на LLM, они запускаеются в контуре компании и мы не разглашаем по NDA. Публичных customer-facing ботов будет больше через несколько месяцев, поделимся отдельно на Хабре. Может у @Sh3fесть примеры более подходящие.
Сейчас идёт большой тренд в бизнесе по поиску применения генеративного AI: начиная от небольших компаний до крупных корпораций. Чат-боты, работа с документами, оптимизация саппорта клиентов, и много другое. Причина в том, что во многих задачах генеративный AI даёт сильное улучшение по сравнению со старыми моделями.
Бытует мнение, что если не начать разбираться сейчас, то в следующем году конкуренты получат преимущества. Мы это мнение тоже разделяем.
В статье вы написали, что датасет у вас небольшой. Сейчас, когда нет ресурсов, можно использовать ChatGPT и на 3.5 сгенерирвать недорого датасет на 1-2 тыс. вопрос-ответ.
Появляется протокол ChatML, но я не следил за последними апдтейтами, возможно в следующей версии стоит посмотреть, помогает ли этот протокол или есть ли еще стандарты
Коллега недавно делал доклад про промпт-инжиниринг https://youtu.be/_vL-AM7iRrg?list=PLmOm0lp-aNUYBAZOyBIoS56V57oA67yLj Если будет полезно, можем его призвать в тред
Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.
Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections
Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.
Спасибо! Да, лид здесь в контексте потенциальный пользователь продукта, с которым мы ездили
Есть ряд бенчарков разных моделей. Свежая GPT-4 turbo еще не оттестирована, но прошлая версия является лидером. Посмотреть можно, например, здесь https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
Llama 2-70b chat хорошая модель, ждем третью версию :)
Использовали подход в дискорде с кнопками в стиле MJ, ниже демка бета версии.
Боты, которые для клиентов делаем на LLM, они запускаеются в контуре компании и мы не разглашаем по NDA. Публичных customer-facing ботов будет больше через несколько месяцев, поделимся отдельно на Хабре. Может у @Sh3fесть примеры более подходящие.
Если в ход пойдут AR очки, то опять все интерфейсы переделывать придется https://dl.acm.org/doi/pdf/10.1145/3586183.3606803
Сейчас идёт большой тренд в бизнесе по поиску применения генеративного AI: начиная от небольших компаний до крупных корпораций. Чат-боты, работа с документами, оптимизация саппорта клиентов, и много другое. Причина в том, что во многих задачах генеративный AI даёт сильное улучшение по сравнению со старыми моделями.
Бытует мнение, что если не начать разбираться сейчас, то в следующем году конкуренты получат преимущества. Мы это мнение тоже разделяем.
Устоявшихся решений нет, есть варианты инструментов:
— Из опенсорс есть rebuff.
— Есть решение от Lakera.
— У нас сейчас есть базовая модель. Мы натренировали свою модель и можем дать ее потестировать, если open source не подойдёт.
Спасибо!