Pull to refresh
11
0
Юрий Леонычев @tracer0tong

Пользователь

Send message

“… коллегами Тарином Клануватом”, Тарин Клануват — женщина. Кажется её вклад в KuroNet был наибольшим.

С GDPR всё плохо. Но есть потенциальная возможность анонимизировать данные. Или применять биометрические фичи отдельно, используя сессионные идентификаторы не привязанные к учётной записи. То есть вы считаете что-то про аномальное поведение клиентского ПО (мобильного приложения или браузера); при этом игнорируя, кто конкретно это ПО использует. Это не так круто, как провязка биометрии для каждого профиля, но работает.
Жалко, что не английская версия, пригодилось бы.
Дело в том, что я не рассказывал про Яндекс в своей презентации.
По поводу разрешений для Yandex.Store — их действительно много, но все имеют смысл. Например, запись аудио — это необходимое условие для работы распознавания речи от Yandex.SpeechKit. Доступ к аккаунтам кажется для социальной авторизации нужен. Просто когда в приложении много функций имплементировано, количество разрешений тоже растет неизбежно. Отзыв я передам разработчикам Yandex.Store.
Иван, спасибо за статью. Очень интересно было читать. Про kaggle могу сказать, что это отличный ресурс и для изучения актуальных задач ML и способ заработать (если сильно постараться). Приятно, что во многих случаях задачки решаются полезные для людей в целом, например, построение медицинских экспертных систем или расчеты загруженности дорожных сетей.
Для ML-коммьюнити, то возможно лучше Google Groups?
Тут видимо небольшое недопонимание. Первая часть статьи про приложения, которые мы пишем сами. Их гораздо меньше тысячи.
Если говорить про сторонние приложения, то они все проходят через анализатор при загрузке.
Извините, промахнулся немного, отвечая на ваш комментарий. Мы все-таки стараемся избегать экстенсивных путей развития, потому что иногда лучше немного математики и оптимизации, чем установка еще десяти серверов.
Нативный код постараемся проверять уже в ближайшем будущем.
Google очень далеко ушел в динамическом анализе, но мы постараемся наверстать упущенное. В том числе и в том, что касается нативных частей приложений.
На самом деле тут всё просто. Популярные приложения активно разрабатываются, кодовая база у них растет и меняется, поэтому следить за каждым коммитом вручную было бы тяжело. Поэтому важные части приложения анализируются вручную, но остальной код проверяется автоматически при сборке.
Что касается приложений с менее активной разработкой, то там можно руками без труда проверить каждое изменение и каждый новый релиз. Или опять же при желании собрать проект с Coverity.
В статье не говорится, что мы будем требовать какую-то информацию у пользователей, мы используем только те данные, которые у нас уже есть.
Многие почему-то сконцентрировали внимание на привязке телефона. Хотя это далеко не единственный способ понять, кого нашла система. Что касается IMAP, то «большой набор факторов» может включать и такие. Спасибо за ваш комментарий.
Не все так страшно, чтобы понять, что поведение учетной записи изменилось не нужно нарушать приватность. Как выше уже отметили, все дело скорее в математике.
Почему не попробовали внедрить? Методы машинного обучения в таких ситуациях дают хорошие результаты.
Мы постараемся сделать так, чтобы обычные пользователи не заметили, что система работает. Смысл агрегации индивидуальных характеристик для каждой учетной записи в том, чтобы избежать срабатываний даже в таком случае, как вы описали.
Думаю, что выражение «слежка за каждым шагом», это преувеличение в данном случае.

Information

Rating
Does not participate
Location
Токио, Токио, Япония
Works in
Date of birth
Registered
Activity