Pull to refresh

Comments 5

Круто, надеюсь проект дальше продолжит развиваться и мы получим некий GPT-4V для GigaChat ?. Расскажите, а как будет работать защита от prompt injection в таких моделях? Такого плана, например, https://www.lakera.ai/blog/visual-prompt-injections

Обратил внимание, что через месяц после релиза GPT-4V стала более устойчива к таким запросам и корректно распознает инъекции и описывает.

Спасибо! Такие атаки действительно довольно сложно победить, но можно двигаться с нескольких сторон: использование дополнительных моделей детекторов, дообучение на сложных примерах и alignment, предотвращающий потенциально опасные ответы модели.

Вы написали, что у вас в планах расширить модели на звук, 3D и видео. А почему работу с документами не приоритезируете? Кажется, что это наиболее востребованная функция с точки зрения пользователя.

Это больше вопрос сервиса вокруг модели, чем про саму модель. Так как, то что работает с документами просто текст вытаскивает из файлов и помещает в модель

Спасибо за статью!
Как я понял, на втором шаге обучения использовались только датасеты с изображениями, без использования изначальных текстовых датасетов. Пара вопросов:
1. Не снижается ли от этого результаты работы модели на обычных текстовых бенчмарках, не начинает ли она забывать то, что выучила раньше?
2. И еще вопрос, размораживаете ли вы всю сеть разом или как-то по слоям?

Sign up to leave a comment.