Нельзя завалиться в Патентное бюро с заявлением — «Я буду определять вероятность подбора пар, на основе факта полового акта. Дайте добро!». Поэтому патенты пишутся «патентным» языком, что дает лазейки для других компаний в использовании эффективных схем. Разбираю патент компании Match Group и судебные тяжбы с Bumble. Будет скучно!
Система подбора — ключевой элемент в бизнес модели тиндер-подобных сервисов.
Факты для справки
То, что компания Match Group может использовать «социальный рейтинг» — Elo Score и мат. аппарат теории Графов для ранжирования, говорит нам патент.
Тот факт, что сервис тиндер использует нечто очень похожее по описанию «Algorithm 101» говорит нам официальное заявление tinder.
Тот факт, что сервис Bumble использует связку выставления соц рейтинга по ELO и мат аппарата Графов для ранжирования, говорит нам «суть претензий» в судебных исках. Ибо использовать их по отдельности может любой человек.
Эти вопросы уже по сто раз оговорены, у меня за два года набралось достаточно статей по теме с детальным разбором документации. Так что здесь их я обсуждать не буду, а ставлю вопрос…
Вопрос
Достаточно ли описанной информации в патенте MatchGroup для выявления факта половой близости и как дейтинг сервис может использовать эту информацию для корректировки «пользовательского опыта». (чуть ли не дословно патент процитировал))
Ответ — Да.
Вообще странно, что общественность пропустила данный вопрос, не каждый день тебе лезут в постель для твоего же блага. Хотя это прошло патентное бюро, да я и сам, признаться, заметил только спустя два года исследований — заковыристые формулировки, неоднозначная трактовка, 1 предложение из 15 листов текста с картинками. И не слабо напрячь голову, чтобы связать софтверную часть патента с описанием хардварной и спецификой поведения homo-sapiens.
Пункт [0068] — Validation set
Validation set — группа пользователей для отладки «системы проверки точности ранжирования».
Since the validation set is a set of matches that are known to satisfy the target profile of a requester, the validation set can be used to check the accuracy of the ranking model.
Т.е. это группа людей, которые, точно известно, что удовлетворяют запросам профиля пользователя. И используется для отладки алгоритмов последующей выдачи кандидатов.
Пункт [0065]
Gradient-boosted decision trees have several free parameters: number of trees, number of nodes, and shrink age. The decision trees may be trained using the training partition (e.g., a set of labeled matches) and selected free parameters using the validation set (e.g., a set of labeled matches that are relevant), exploring ranges of free parameter values.
Здесь мы понимаем, что отстройка алгоритма строится как на обычной выборке из совместных матчей, так и на параметрах из «валидированной выборки».
Получается
Validation set — не гипотетическая группа с максимальной вероятностью мечта полученная на статистических данных, а группа на которой отлаживаются этот механизм, описанный на странице 2 Fig.2
Простите, что? Фраза «that are known» или «matches that are relevant» — никого не смущает? А давайте посмотрим, что «вы» знаете и откуда вы можете это знать, чтобы сделать такое смелое предположение о релевантности группе и выборке!
Поведенческие данные Страница 4/ Fig. 3
phone exchange | Обмен телефонными номерами |
email exchange | Обмен e-mail адресами |
regexp match | Обмен данными о встрече |
num exchanges | количество сообщений друг другу |
message Orphan | отправленное сообщение без ответа |
message disparity | разница в количестве отправленных сообщений |
exchange timespan | длительность переписки |
message density | периодичность отправки сообщений (от первого до последнего) |
skip | видел профиль, но не отправил сообщения |
num View exchanges | количество просмотров профилей друг друга |
View orphan | пользователь открыл профиль другого, но не был увиден в ответ |
View disparity | разница в открытии профилей друг друга |
View titmespan | время просмотров профилей друг друга |
View density | частота просмотров профиля от первого до последнего сообщения |
Пункт [0069]
…For example, a query (e.g., target profile) may be obtained via a graphical user interface from a user's interaction with a local application, web site or web-based application or service and may be accomplished using any of a variety of well known mechanisms for obtaining information from a user…
Здесь о том, что система отладки модели ранжирования учится не только с пользовательских действий в интерфейсе, но и данных собираемых с обслуживающей инфраструктуры. Fig 4. страница 5.
А это данные о геолокации и соединения с сетью. Что и дает представление о том как валидируется validation set, т.е. точно известно, что люди друг другу понравились.
Видим, что в патенте описаны механизмы и алгоритмы, а также данные достаточные для фиксирования факта коммуникации и длительного контакта. Остается настроить пару пресетов для Validation set для разных сегментов аудитории.
Как я обычно ставлю задачу на такой пресет: Ребята занесите в validation set профили с обоюдными мечтами, длинной переписки в пару часов, обменом контактными данными и нахождением в одной или двух геолокациях одновременно в диапазоне с 23 вечера до 4 утра. Да, и присваивайте обоим в таком кейсе пониженный рейтинг социальной ответственности, чтобы они метчились по схожему поведенческому признаку.
Вероятность
Есть конечно вероятность, что мальчик с девочкой списались, поужинали, а потом поехали к нему играть в Heavy Rain, или к ней чай попить. Но…«Были сигналы: не чай он там пьет.»
P.S.
Не вижу причин, почему остальные игроки рынка не могут последовать примеру Bumble и использовать данную схему. А может уже.
Match Group подала в суд на Bumble только после «корпоративного шпионажа» — термин из ответного иска. В теле иска состоящего из 811 пунктов нарушений патентов, отмечается, что Match Group не известно о факте использования конкретной реализации алгоритмов или части кода, который мог использовать бывший сотрудник и основатель Bumble. На что Бамбл инициировала процедуру проверки для аннулирования патентов Match Group.
В июне 2020 компании пришли к мировой и отозвали совместные претензии, комитет по патентованию отменил процедуру проверки — разделять рынок на двоих выгоднее чем делится с остальными.