Как стать автором
Обновить

VK использовала общедоступный пользовательский контент для создания генеративной нейросети

Время на прочтение2 мин
Количество просмотров4.3K

VK разработала свою большую языковую модель (LLM) для генерирования текстов. За основу взяты, в частности, комментарии из открытых групп «ВКонтакте». Первые генеративные функции тестируются в сервисах Mail.ru — почте и календаре, пишет «Ъ».

Издание узнало детали технологии, которая легла в основу объявленных 26 февраля функций генерирования текстов в сервисах продуктивности Mail.ru (почте, календаре, облачном хранилище и заметках). Как пояснили в VK, компания создала для этого собственную LLM, её тренировка проводилась на «открытых корпусах текстов из интернета и публичных данных соцсети „ВКонтакте“ — постах и комментариях в открытых группах».

Собственные LLM уже есть у «Яндекса» (YandexGPT) и «Сбера» (GigaChat), оба внедряют их в свои потребительские продукты и одновременно предлагают доступ к результатам генерации сторонним разработчикам. LLM разработала и структура МТС, MTS AI. С 25 января MTS AI руководит Андрей Калинин, который до сентября 2023 года был вице‑президентом VK по искусственному интеллекту.

Команда разработки ассистента «Маруся», которая «почти полностью пересекается с командой Mail.ru», разрабатывала LLM ещё при Калинине, пояснил знакомый с ситуацией источник «Ъ». Сейчас должность вице‑президента VK по ИИ занимает по совместительству гендиректор «Дзена» Антон Фролов.

По словам собеседника «Ъ», при Калинине подразделения VK изучали перспективы создания LLM независимо: «К наработкам команды „Маруси“ в других бизнес‑юнитах VK относились скептически».

Рутинные задачи, по словам представителя VK, «логично распределить по категориям», поэтому нейросетевые функции тестируются на сервисах продуктивности Mail.ru.

В этой категории, помимо корпоративного мессенджера VK Teams, по госконтракту с Минцифры VK разрабатывает автоматизированное рабочее место госслужащего, объединяющее почту, мессенджер, облачное хранилище и внутренний портал. Решение о дальнейшем использовании LLM примут по результатам тестирования на продуктах Mail.ru, говорят в компании.

В «Яндекс 360» (объединяет аналогичные сервисы, в том числе почту) сообщили, что также «работают в направлении внедрения нейросетей в продукты».

Технически, говорит один из источников «Ъ», VK способна привлечь вычислительные мощности, достаточные для тренировки LLM: «Но это могло быть сопряжено с более серьёзными издержками, чем у „Яндекса“ и „Сбера“. VK — прежде всего контентный бизнес, а не технологический, и до бума ИИ у них не было резона делать сопоставимые вложения в мощности».

Теги:
Хабы:
Всего голосов 3: ↑3 и ↓0+3
Комментарии7

Другие новости

Работа

Data Scientist
39 вакансий

Ближайшие события