Хорошая новость для разработчиков — мы открыли доступ к программной библиотеке PyTorch-LifeStream, которая содержит несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных датасетов.
Событийные данные могут представлять собой самые разные последовательности: истории посещений сайтов, покупок, событий в онлайн-играх и так далее. При этом сгенерированный на основе алгоритмов библиотеки эмбеддинг не будет содержать каких-либо персональных данных.
![](https://habrastorage.org/getpro/habr/upload_files/4e3/ca0/48a/4e3ca048a5fb21cfc8bcdb1e98b97ba5.png)
В библиотеке PyTorch-LifeStream мы реализовали уникальный алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту Сбера. Кроме того, в ней реализованы методы на основе сторонних научных публикаций, но адаптированные Сбером.
Подробнее о PyTorch-LifeStream можно узнать из нашего видео.
Сбер не первый раз делится результатами исследований в области искусственного интеллекта со всеми желающими. Ранее мы вывели в открытый доступ такие библиотеки, как ruGPT-3, LAMA, RePlay, ruDALL-E.