Pull to refresh

VK использовала общедоступный пользовательский контент для создания генеративной нейросети

Reading time2 min
Views3.9K

VK разработала свою большую языковую модель (LLM) для генерирования текстов. За основу взяты, в частности, комментарии из открытых групп «ВКонтакте». Первые генеративные функции тестируются в сервисах Mail.ru — почте и календаре, пишет «Ъ».

Издание узнало детали технологии, которая легла в основу объявленных 26 февраля функций генерирования текстов в сервисах продуктивности Mail.ru (почте, календаре, облачном хранилище и заметках). Как пояснили в VK, компания создала для этого собственную LLM, её тренировка проводилась на «открытых корпусах текстов из интернета и публичных данных соцсети „ВКонтакте“ — постах и комментариях в открытых группах».

Собственные LLM уже есть у «Яндекса» (YandexGPT) и «Сбера» (GigaChat), оба внедряют их в свои потребительские продукты и одновременно предлагают доступ к результатам генерации сторонним разработчикам. LLM разработала и структура МТС, MTS AI. С 25 января MTS AI руководит Андрей Калинин, который до сентября 2023 года был вице‑президентом VK по искусственному интеллекту.

Команда разработки ассистента «Маруся», которая «почти полностью пересекается с командой Mail.ru», разрабатывала LLM ещё при Калинине, пояснил знакомый с ситуацией источник «Ъ». Сейчас должность вице‑президента VK по ИИ занимает по совместительству гендиректор «Дзена» Антон Фролов.

По словам собеседника «Ъ», при Калинине подразделения VK изучали перспективы создания LLM независимо: «К наработкам команды „Маруси“ в других бизнес‑юнитах VK относились скептически».

Рутинные задачи, по словам представителя VK, «логично распределить по категориям», поэтому нейросетевые функции тестируются на сервисах продуктивности Mail.ru.

В этой категории, помимо корпоративного мессенджера VK Teams, по госконтракту с Минцифры VK разрабатывает автоматизированное рабочее место госслужащего, объединяющее почту, мессенджер, облачное хранилище и внутренний портал. Решение о дальнейшем использовании LLM примут по результатам тестирования на продуктах Mail.ru, говорят в компании.

В «Яндекс 360» (объединяет аналогичные сервисы, в том числе почту) сообщили, что также «работают в направлении внедрения нейросетей в продукты».

Технически, говорит один из источников «Ъ», VK способна привлечь вычислительные мощности, достаточные для тренировки LLM: «Но это могло быть сопряжено с более серьёзными издержками, чем у „Яндекса“ и „Сбера“. VK — прежде всего контентный бизнес, а не технологический, и до бума ИИ у них не было резона делать сопоставимые вложения в мощности».

Tags:
Hubs:
Total votes 3: ↑3 and ↓0+3
Comments7

Other news