Pull to refresh
27
2
Евгений Кокуйкин @artmaro

User

Send message
  1. В статье вы написали, что датасет у вас небольшой. Сейчас, когда нет ресурсов, можно использовать ChatGPT и на 3.5 сгенерирвать недорого датасет на 1-2 тыс. вопрос-ответ.

  2. Появляется протокол ChatML, но я не следил за последними апдтейтами, возможно в следующей версии стоит посмотреть, помогает ли этот протокол или есть ли еще стандарты

  3. Коллега недавно делал доклад про промпт-инжиниринг https://youtu.be/_vL-AM7iRrg?list=PLmOm0lp-aNUYBAZOyBIoS56V57oA67yLj Если будет полезно, можем его призвать в тред

Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.

Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections

Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.

Спасибо! Да, лид здесь в контексте потенциальный пользователь продукта, с которым мы ездили

Есть ряд бенчарков разных моделей. Свежая GPT-4 turbo еще не оттестирована, но прошлая версия является лидером. Посмотреть можно, например, здесь https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard

Llama 2-70b chat хорошая модель, ждем третью версию :)

Использовали подход в дискорде с кнопками в стиле MJ, ниже демка бета версии.

Боты, которые для клиентов делаем на LLM, они запускаеются в контуре компании и мы не разглашаем по NDA. Публичных customer-facing ботов будет больше через несколько месяцев, поделимся отдельно на Хабре. Может у @Sh3fесть примеры более подходящие.

Если в ход пойдут AR очки, то опять все интерфейсы переделывать придется https://dl.acm.org/doi/pdf/10.1145/3586183.3606803

Сейчас идёт большой тренд в бизнесе по поиску применения генеративного AI: начиная от небольших компаний до крупных корпораций. Чат-боты, работа с документами, оптимизация саппорта клиентов, и много другое. Причина в том, что во многих задачах генеративный AI даёт сильное улучшение по сравнению со старыми моделями.

Бытует мнение, что если не начать разбираться сейчас, то в следующем году конкуренты получат преимущества. Мы это мнение тоже разделяем.

Устоявшихся решений нет, есть варианты инструментов:

— Из опенсорс есть rebuff.

— Есть решение от Lakera.

— У нас сейчас есть базовая модель. Мы натренировали свою модель и можем дать ее потестировать, если open source не подойдёт.

2

Information

Rating
1,339-th
Works in
Registered
Activity