Как стать автором
Поиск
Написать публикацию
Обновить

Суд постановил Twitter выдать Маску материалы по проверке 9 тыс. учётных записей пользователей соцсети на ботов

Время на прочтение7 мин
Количество просмотров4.6K
Всего голосов 18: ↑9 и ↓9+4
Комментарии48

Комментарии 48

Слушайте, ну хабр же не твиттер. Новость в одну строчку плюс очередная копипаста "истории".

Статьи писать дописыванием это же совсем моветон.

Это не твиттер, это модерн

Оу, это отличная статья, если честно.

сейчас отберут 9к проверенных аккаунтов и скажут, что у них 0% ботов.

И это будет прекрасным доказательством в суде, что Twitter фальсифицирует проверки. Если в случайной выборке из 9 тысяч аккаунтов отсутствуют боты, значит, не такая уж она случайная.

ну тогда 1% ботов сделают

9к случайных учёток - это для Твиттера капля в море. Тут даже фальсифицировать ничего не надо - выборка заведомо невалидная нерепрезентативная.

Но, да, куда это я лезу со своим трояком по статистике...

На выборке из 9000 случайных аккаунтов можно достоверно определить количество ботов с точностью до одного процента. Количество аккаунтов в твиттере в этом случае практически ни на что не влияет. Важна только методика выбора этих 9000 аккаунтов, от нее требуется обеспечить случайность выборки, а также методика проверки каждого конкретного аккаунта (вероятность false positive и false negative результатов)

Напомню. 9 000 единиц будет выбрано из 3 000 000 000 .

Почему для оценки количества учёток-ботов это нормальная выборка, а для оценки качества пар ботинок это мало?

выбрано из 3 000 000 000

При таком количестве общего числа пользователей думаю можно и без проверки сказать что половина из них не настоящая. Из 8 млрд жителей нашей планеты при таком раскладе каждый третий должен иметь аккаунт в твиттере включая младенцев и стариков.

У меня, кстати, клешня соскользнула спросонья. Хотел набрать 1.3млрд - а получилось 3млрд.
Правда, поскольку сам Твиттер не до конца уверен, думаю, что я лажанул не так уж и сильно. Девять тысяч - это чудовищно мало что для миллиарда, что для трёх.

Твиттер существует не первый год - а значит, какой-то процент учёток принадлежит умершим.
Какой-то - средствам массовой информации и прочим коллективным медиасущностям.
Какой-то - дубли от пользователей, у которых "клешня соскользнула".
Ну и боты-тролли-твинки-смурфы-для-накрутки-лайков...

Миллиард реален - и три тоже.

Хотелось бы услышать какое количество учеток вы бы считали минимально достаточным и почему? Без учета методологии отбора этих самых учеток.

Чертовски хороший вопрос.

Будь у меня в кармане 51% акций сервиса, считающего себя соцсетью, я бы стремился к тотальной проверке 100% учёток. И к стремлению гарантировать, что процент ботов и прочих негуманоидных сущностей стремится к нулю.

Мы ведь сервис, предназначенный для человеков, обсуждаем. Если сервис, предназначенный для человеков, облажался с недопуском нечеловеков, - какой от него толк?

я бы стремился к тотальной проверке 100% учёток

Это невозможно в ручном режиме, ниже я написал как предсталяю реальную ручную проверку. А автоматические тесты обходятся автоматическими ботами. Как только появится новый тест через какое-то время появится новый бот. Даже если вы сможете отсечь всех программных ботов — будут человеческие боты (житель бедной страны по 10 часов в день за 10 баксов в день изображает из себя сотни пользователей из США, выполняя задания по списку, например, пиша хвалебные отзывы о компании клиента и гневные отзывы о его конкурентах. Чем это отличается от программного бота?).

И к стремлению гарантировать, что процент ботов и прочих негуманоидных сущностей стремится к нулю.

Тогда и процент людей, которых забанили по подозрению, что они боты будет стремиться к 100%. Потому всегда есть ложные срабатывания, в результате вашим сервисов никто не будет пользоватся.

Условно, вы не можете проводить полноценные юзабилити и краш тесты у каждой десятой машины и даже у каждой сотой — очень дорого. Поэтому увеличение выборки автоматически уменьшает качество.

Я уже могу бесплатно на коленке набрасывать диздок на систему люстрации ботов? К этому идёт. К этому не придёт.

Нет, но тут получается вы как мышонок из советского мультика, который рассказывал всем как все неправильно работают, но показать как правильно не мог.

Вполне, очевидно что если все стороны в этом деле считают, что проверка 9 тыс. аккаунтов достаточна — они явно учитывали намного больше параметров, чем вы или я.

Вам бы с себя начать. Влезли в чужой диалог с Очень Уместной Критикой. Это не несёт полезной нагрузки.

На хабре нет приватных диалогов, если хотите обсуждать что-то приватно — есть личные сообщения и любые другие способы приватного общения.
Если что-то утверждаете публично в комментариях — любой, с вами несогласный, имеет полное право вам ответить.

Позволю усомниться в ваших намерениях будь у вас 51% акций. Ведь если вдруг окажется, что у вас 3% живых пользователей то и цена ваших 51% станет сразу в 33 раза ниже (условно). Напротив, вы, как владелец 51%, будете всячески способствовать наращиванию цифры общего количества пользователей и недопуска их реальной проверки. Более того, вы сами не рискнете запустить реальную (даже внутри сервиса) проверку, т.к. её результаты могут стать доступны не только вам, поэтому вы будете всячески её блокировать, иначе вы банально станете бедней.
Какой толк от облажавшегося сервиса? Такой как и от всех других - бабки.

Ведь если вдруг окажется, что у вас 3% живых пользователей то и цена ваших 51% станет сразу в 33 раза ниже (условно).

Истинно. И ведь непременно окажется. Потому действия Маска и стремление судебных инстанций умыть руки выглядят, на самом деле, довольно здраво.

Какой толк от облажавшегося сервиса? Такой как и от всех других - бабки.

Ох, истинно... Ведь вовремя "просевшая" в цене компания - может принести прибыль. Изредка даже больше, чем не "просевшая"...
...только вот кому...

Как вы оценили, что мало? Серьезно, каким способом? При 5% фейков на сотне аккаунтов standard error будет около одного процента. Можно посчитать глубже, при необходимости, доверительный интервал, например.

А у вас какие цифры получились? Как считали? Для грубой оценки качества ботинок, если качество равномерно независимо от размеров, цвета и т.п. тоже вполне достаточно сотни пар.

Попытаюсь пояснить, хотя я и уже вижу, что ничего путного из этого не выйдет. Уже не вышло...

Вот есть у нас производство ботинок.

По стандартам качества, приемлемо проверять... скажем, одну пару из ста, случайно выбранную. Это маловато - но и вреда от пропущенных дефективных пар, в общем-то, немного. Поэтому и критерии качественности при проверке довольно... скромные.

Почему для сервиса, который возлагает на себя куда более высокие требования и считает последствия ошибок и дефектов куда более плачевными, меньшая выборка при более раздолбайских критериях качества должна приниматься как "нормальный процесс контроля качества"?

Вот есть у нас производство ботинок. По стандартам качества, приемлемо проверять… скажем, одну пару из ста, случайно выбранную

Производство ботинок зависимо от времени — вышел пьяный работник или сломался механизм и тысячи пар ботинок подряд будут бракованные. Поэтому нужно проверять каждый сотую пару, чтобы успеть заметить бракованную партию.
Если проверять каждую десятитысячную пару легко может оказаться что партия в 5 тыс бракованных пар подряд уйдет покупателям.

В случае онлайн сервиса предполагается, что выборка должна быть рандомно-случайная и нам важно именно общий процент ботов у всей аудитории.

Кроме того, с большой вероятностью проверка каждого аккаунта занимает много сил и время.

Если бы я был на месте проверяющей компании, я бы позвонил по телефонам, которые оставляют пользователи из списка проверки и представился, что делаю опрос выяснил это дейстительно реальный человек, потом проверил все подозрительные активности, например, связался с теми кому этот пользователь отправлял сообщения и выяснил не рассылает ли пользователь спам. Так же мог бы пробить пользователя по соц. сетям, попытаться связаться любым способом лично и провести опрос если он в сервисе, пообещав выслать разумный подарок (наушники, зарядку, подарочный ваучер амазона на 10 баксов и т.п.) в случае прохождения и т.д.

Именно такие реальные действия по обнаружению бот пользователь или не бот дадут достаточно высокую достоверность, но даже для 9 тыс. пользователей это будет относительно дорого. Если переводить на аналогию с ботинками это заплатить тестировщикам, чтобы они пробежали в каждой паре несколько тысяч км, а потом написали отзывы.

Поэтому выборка именно в 9 тыс, а не 9 млн. Потому что 9 млн. можно проверить только на отвали (чисто некоторые автоматические тесты прогнать) и уровень погрешности на 9 млн. будет скорее всего сильно хуже.

Так понятнее?

Вы смотрите затылком. Вопреки моим попыткам Вас развернуть.

Есть сервис, считающий себя соцсетью.
Его владельцев официалы могут нагнуть на совершенно астрономические деньги (а то и посадить кого-нибудь показательно), если выяснится, что "соцсеть" - не соцсеть, а ботнет, который способствует распространению... например, политически некорректной информации.
Контроль качества создаваемых сервисом учёток: никакой.
При этом, контроль качества - это скорее вопрос методологии и добросовестности сервиса.

Есть производство обуви.
Его владельцы могут получить сравнительно скромный (относительно "соцсети") штраф, если выяснится, что производимая ими обувка вызывает... скажем, отвал мизинцев на ногах. Впрочем, в той же индустрии женской обуви такая хренотень сплошь и рядом (да и в остальных ответвлениях не сахар), но все на это плюют, включая потребителей...
Контроль качества создаваемых производством единиц обуви: неплохой.
При этом, контроль качества требует довольно нетривиальных телодвижений по соответствию стандартам, ТУ, etc-etc.

Я не могу научить Ваш затылок делать логические построения. Я не заменю успешно сфэйлившуюся программу учебных заведений.

Переход на личности. Печально. Вам не нужны ответы, а только рассказать что вы д'Артаньян, а все остальные… Скучно.

Какой ужас, собеседник посмел указать на явную ошибку в рассуждениях...

Вы будто воспитаны в тоталитарном обществе. Ботнет и ботнет. Раньше для регистрации везде даже телефон был не нужен, забыли уже? И вроде никто мизинцы не потерял. А теперь свобода настолько не ценится, что бесчисленные крики снизу раздаются - нужен тотальный контроль, без него ведь кто-то что-то не то может сделать. Кошмар какой-то.

А ботинки могут менять качество от партии, вам верно сказали. Попытка оскорбить вашего собеседника не делают его доводы хуже, он прав - мы берем совокупность и проверяем даже не процент, а просто какое-то количество из неё. Если нам интересно усреднённое качество ботинок за двадцать лет, тысячи пар, взятых случайно, будет более чем достаточно, даже если их произвели 6 млрд. Если интересно по каждой партии, то нет.

Сможете найти в океане стакан пресной воды?

Вы забыли школьные курсы физики, химии и географии? Я нет. Я найду. Больше одного варианта.

Не привозя с собой ни стакана, ни воды, ни материалов-прекурсоров для их производства во всех случаях.

Действительно, статистику стоит вспомнить

https://postnauka.ru/faq/58454

Неожиданно толковая статья. Здорово помогла освежить в Памяти некоторые моменты.

Получается, решение суда совершенно Соломоново.

Забавно.

Не нужно её вспоминать. Вспоминать нужно тервер.

А по терверу кол был?

Если верить статье, то речь идет о тех 9к аккаунтах, что уже были отобраны ранее аудиторами. Таким образом Маск сможет проверить выводы аудиторской проверки.

Канцлерский суд Делавэра постановил Twitter выдать Маску все материалы и документы по ранее проведённой проверке 9 тыс. учётных записей пользователей соцсети на ботов.

Вот что мне непонятно – почему 20% ботов считается плохим результатом?

Ну, с точки зрения Маска понятно: Твиттер "мамой клялся", что их пять, а значит, можно призвать к ответу и что-то с этого поиметь. Но в чём интерес Твиттера?

Говорим что 5, все думаюи что популярность растёт больше чем это можно, значит ценные, значит акции надо брать, спрос выше, цена штуки больше, цифирь итоговая пыщ пыщ нее

Самое смешное что не клялся, и в сделке с Маском эта цифра вроде никак не участвовала. Просто чтобы слезть с сделки, ставшей невыгодной, Маску надо к чему-нибудь придраться, вот придрался к найденной в квартальном отчёте цифре. Квартальный отчёт дело святое, но от "to the best of our knowledge" до "мамой клянусь" как до луны.

Участвовала, в документах которые Твиттер дал Маску была цифра 5%. Количество реальной аудитории это главный показатель любого подобного бизнеса

Твиттер ничего не давал Маску, документы он сдавал в SEC. Сам Маск ссылается в утверждениях про ботов на ежеквартальный отчёт в SEC: "However, if it turns out that their SEC filings are materially false, then it should not." https://twitter.com/elonmusk/status/1555823555161604099?s=20&t=C41hcpCwvl-Kk1PXfPfZNg

Маск ссылается на SEC потому как наипать государство, это всегда намного большее преступление, чем наипать клиента.

Если у вас есть секретное знание про обещания напрямую Маску, чем трепаться, лучше предъявите :) Ни у Маска, ни в публичных документах суда, ни в комментариях прочих участников сделки такого не видел.

То есть Твиттер мог подавать какую угодно отчетность, говорить о себе все, что угодно, и если Маск напрямую не спросил их и не получил документ "это действительно так" за подписью всего совета директоров, то отчетность и заявления о своих показателях - это пустой звук? Если нет, то Маск всё правильно делает, оспаривая эту сделку; если да, то Маск вдвойне всё правильно делает, оспаривая эту сделку.

Вопрос не в плохом результате, а в том, что Маск покупает исходя из числа реальніх пользователей.

Больше интересно, как они ботов от мертвых аккаунтов отличают. Вообще какая методика выявления ботов, как отличить тупого человека от интеллектуального бота.

А вообще по дешевизне услуг по накрутке аккаунтов в соц. сетях их количеству. Везде реально по 20% ботов

Почитайте про "Теорию Мёртвого Интернета".

Большинство публикаций на эту тему - мусор, но кое-где есть и попытки научно доказать, есть такая проблема или нет.

Отрезвляет.

Вкупе с доминионом нигилистов в Сети от того, живой собеседник или бот, зависеть начинает очень мало...

А в New York Times рассказывали о событии внутри YouTube в 2013-м, которое команда компании назвала «Инверсией». Внутренний отчет показал, что около половины трафика на сайте составляют боты, которые маскируются под человека и накручивают просмотры. Процент был настолько большой, что появилась реальная возможность того, что машинные алгоритмы YouTube начнут воспринимать ботов как реальных людей, а людей станут банить как ботов. Возможно, в некоторой степени это и произошло.

Источник.

  • Твиттер: Итак, уважаемый суд, вот документы: у нас 1.3 млрд аккаунтов и из них меньше 5% боты

  • Маск: Ха, я полгода назад зарегал 100млн ботов, они до сих пор живые - это только моих уже 8%. Вот документы

  • Судья: э-э-э-э...

  • Твиттер: э-э-э-э...

  • Судья: Дело закрыто!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости