Комментарии 12
НЛО прилетело и опубликовало эту надпись здесь
С другой стороны, защитники персональных данных всегда подымут истерику.
Предположим, я или кто-нибудь создаст сервис переводчик, как же им улучшить качество перевода?
— Использовать по одному предложению без идентификации пользователя? Но в нем могут быть персональные данные.
— Проверять автоматически наличие ПД в тексте? Поднимется вой, что сканируется для BigData и рекламы.
— Сканировать интернет на предмет перевода открытых статей? Большие вложения, возможные иски от правообладателей перевода или оригинала.
— Придумывать самим предложения? Отток пользователей, потому что неточный перевод.
Куда не кинь — всюду клин
Добавлено: Забыл еще исправление пользователями, открывает доступ к спамингу и спуфингу:
«Linoleum» — «Лучший линолеум в Арктике >здесь<»
«Ганди» — «Корень всего зла» и т.д.
Предположим, я или кто-нибудь создаст сервис переводчик, как же им улучшить качество перевода?
— Использовать по одному предложению без идентификации пользователя? Но в нем могут быть персональные данные.
— Проверять автоматически наличие ПД в тексте? Поднимется вой, что сканируется для BigData и рекламы.
— Сканировать интернет на предмет перевода открытых статей? Большие вложения, возможные иски от правообладателей перевода или оригинала.
— Придумывать самим предложения? Отток пользователей, потому что неточный перевод.
Куда не кинь — всюду клин
Добавлено: Забыл еще исправление пользователями, открывает доступ к спамингу и спуфингу:
«Linoleum» — «Лучший линолеум в Арктике >здесь<»
«Ганди» — «Корень всего зла» и т.д.
Почему бы не сделать отдельную версию для бета-тестеров и открыто уведомлять их о том, что их разговоры могут быть записаны и проанализированы третьими лицами? Можно даже доплачивать за это.
Именно! Давайте НАЙМЁМ людей которые будут разговаривать на разные темы. Но… на шару гораздо приятней.
Речь идёт всего лишь про то, чтобы в явном виде спрашивать согласие пользователя на прослушивание отрывка его речи живыми тестерами.
С учётом размера аудитории, всё сведётся к тому, что раз в год вам будет приходить сообщение от сервисного бота вида «три месяца назад вы сказали такую фразу [ссылка на отрывок], которую наш ИИ слабо понял. Разрешаете ли вы прослушать её живому человеку?». И кнопочки «согласен/не согласен».
Но понятное дело, что это неимоверно сложно для крупных компаний — признать себя не богами, которым можно делать с пользовательскими данными всё что угодно, а простыми поставщиками сервиса.
С учётом размера аудитории, всё сведётся к тому, что раз в год вам будет приходить сообщение от сервисного бота вида «три месяца назад вы сказали такую фразу [ссылка на отрывок], которую наш ИИ слабо понял. Разрешаете ли вы прослушать её живому человеку?». И кнопочки «согласен/не согласен».
Но понятное дело, что это неимоверно сложно для крупных компаний — признать себя не богами, которым можно делать с пользовательскими данными всё что угодно, а простыми поставщиками сервиса.
Вроде как инфа о прослушке скайпа ещё от Сноудена появилась.
Хорошая лазейка, чтоб сливать разговоры тем, кто "при исполнении". Сделать их подрядчиками — и дело в шляпе.
Анонимность в интернете — сказки
Давайте облегчим задачу и укажем, кто не прослушивает. Этот список будет на много меньше.
Мысль о том, что «теперь Скайп начнут прослушивать» была высказана в том момент, когда стало известно о том, что все потоки пойдут через сервера Микрософт (а не P2P как изначально было).
Удобства сделали нас уязвимыми.
А как это еще обойти? Только добровольцев набирать. Определённые группы в сотню тысяч человек только в одном регионе, чтобы довести тот же перевод или понимание определённых слов до приемлемого уровня. Брать из открытых источников? Ну какие могут быть в наше время открытые источники без предъяв по оплате за созданное?
В итоге, компании нужно липо очень сильно тратится именно на эту часть, либо отправлять деньги на другие проекты, а собственное детище оснастить сбором данных.
Не хотите удобств — всегда есть кривые альтернативы.
А как это еще обойти? Только добровольцев набирать. Определённые группы в сотню тысяч человек только в одном регионе, чтобы довести тот же перевод или понимание определённых слов до приемлемого уровня. Брать из открытых источников? Ну какие могут быть в наше время открытые источники без предъяв по оплате за созданное?
В итоге, компании нужно липо очень сильно тратится именно на эту часть, либо отправлять деньги на другие проекты, а собственное детище оснастить сбором данных.
Не хотите удобств — всегда есть кривые альтернативы.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Подрядчики Microsoft рассказали о прослушке звонков в Skype