Закон Годвина в деле: в 78% реддитов с более чем 1000 комментариев упоминаются нацисты

    Любитель обработки массивов данных, скрывающийся под ником CuriousGNU, решил проверить «Закон Годвина» по отношению к дискуссиям на reddit. Анализ 4,6 миллионов комментариев к записям reddit, проведённый при помощи сервиса Google BigQuery, показал хорошее соответствие закона реальности.

    Американский журналист и писатель Майкл Уэйн Годвин по прозвищу «Майк», интересовался интернетом ещё со времён появления Usenet, а в 1990-м году устроился в фонд EFF (Фонд электронных рубежей, занимающийся правами человека в цифровом мире) и стал первым штатным юристом организации.

    Являясь активным пользователем Usenet и изучая первые появляющиеся интернет-мемы, Майк заметил, что в дискуссиях с завидным постоянством всплывали упоминания нацистов или Гитлера. Это показалось ему настолько навязчивым, что в шутку он вывел "Закон Годвина нацистских аналогий": с ростом онлайн-дискуссии, вероятность упоминания в ней нацистов или Гитлера стремится к единице.

    CuriousGNU, как энтузиаст больших данных, построил несколько графиков, связанных с этим «законом».

    image
    Количество комментариев, в которых упоминаются нацисты или Гитлер

    Интересно, что, даже исключив из рассмотрения исторические реддиты, от закона Годвина уйти не получается. Для постов, в которых количество комментариев перевалило за тысячу, вероятность упоминания нацистов уже превышает 70%. В постах с более чем 4000 комментариями вероятность стремится к 95%.

    image
    Support the author
    Share post

    Comments 11

      +9
      Хмм, а разве это не частный случай утверждения, что событие, имеющее ненулевую вероятность, гарантированно произойдёт на бесконечном промежутке времени?
        +3
        Для события, которое наблюдается в выборке n=4000 с достоверностью 95%, у него достаточно высокая вероятность. Кроме того, каждый отдельный пост в треде не является независимым событием, поскольку, по большей части, зависит от предыдущих, а потому закономерности вроде теоремы Пуассона здесь неприменимы.
        +7
        Хотелось бы, для сравнения, посмотреть частоту упоминания чего-либо столь же известного. Например, Христа. Или яичницы.
          0
          С Христом не получилось бы, ибо «Jesus Christ» является очень распространённым выражением, своего рода аналогом «Чёрт побери». С яичницей похожая история — есть поговорка «You can't make an omelette without breaking eggs». Хотя может и про Гитлера есть поговорка.

          UPD: с другой стороны, что Иисус, что яичница просто имели бы другую вероятность упоминания, но график вероятности хотя бы одного упоминания в серии из n испытаний должен был бы выглядеть похоже.
            0
            Mylene Farmer — Que mon coeur lache — видео, в начале.
            — Отец, ты меня звал?
            — Нет, это просто такое выражение.
          0
          Всегда радовали такие графики, которые по сути противоречат их сути — наглядности. Сделали фигню? Давайте используем график с кривыми отметками, чтобы казалось, что наша работа имеет смысл.
            0
            В каком месте они ненаглядны?
              0
              На оси абсцисс не выдержан масштаб.
                0
                Он выдержан на отделенных пунктирами областях
                  +2
                  Я уверен, что большинство читающих, на эти пунктиры то и не смотрят, а видят график как «ух ты, интересный скачок идет после 1000 комментов!». Конечно, это можно спихнуть на невнимательность пользователя, но как по мне такие графики — это первый шаг на пути к «ученый изнасиловал журналиста».
            0
            И как всё это соотносится с интернет-мемом граммар-наци?

            Only users with full accounts can post comments. Log in, please.