konodyuk 17 дек 2021 в 10:00

Управляем генерацией ruGPT-3: библиотека ruPrompts

7 мин

12K

Блог компании SberDevicesPython*Машинное обучение*Искусственный интеллектNatural Language Processing*

+22

Комментарии 13

Rybolos 17 дек 2021 в 12:53

Спасибо за библиотеку!

Есть ли смысл решать ей задачи классификации, например, а не seq2seq?

konodyuk 17 дек 2021 в 21:57

В первую очередь нам было интересно попробовать подбор затравки для генеративных задач, но, как показывают статьи, для классификации метод тоже работает хорошо. В будущем мы, возможно, добавим в библиотеку поддержку большего числа задач.

logran 17 дек 2021 в 15:41

Потрогать ruPrompts можно в Colab-ноутбуках

Нельзя. На обоих Not Found.

janvarev 17 дек 2021 в 16:25

Надо сначала установить:
!pip install ruprompts

Только что проверил, примеры работают.

logran 17 дек 2021 в 18:50

Библиотека работает. Ссылки на ноутбуки в Google Colab не работают. По ссылкам not found. Локальные библиотеки к этому отношения не имеют.

P.S не работали. Уже починили.

konodyuk 17 дек 2021 в 21:58

Спасибо за внимательность, в данный момент все ссылки на ноутбуки рабочие

Zachar_5 4 янв 2022 в 05:08

Здравтствуйте!

А можно где-нибудь по подробнее почитать про использование LSTM. Т.к. как я сейчас понимаю Вашу работу, вы размечаете части запроса подсказками, а потом помещаете теги подсказок в словарь и создаете случайные вектора встраивания, потом считаете градиенты по всей gpt, но обновляете веса только у Ваших новых тегов. И тут я не совсем понимаю, где используется LSTM, т.к. градиенты приходят с трансформеров.

konodyuk 4 янв 2022 в 12:45

Репараметризация с помощью LSTM используется как альтернатива прямому обучению эмбеддингов, соответствующих обучаемым токенам (<P>). В этом случае эмбеддинги являются не самостоятельными параметрами, а выходом LSTM. Градиенты, соответственно, прокидываются до параметров LSTM, а не останавливаются в эмбеддингах. Дополнительно почитать об этом можно было бы в статье, где использование LSTM было предложено, но там, к сожалению, этот момент описан не очень подробно.