Как стать автором
Обновить

Комментарии 32

Исследование показывающее как далеко иногда ученые от реальной жизни.
11 сентября был крупнейший теракт в США
автор об этом пишет — «Так было и до 11 сентября, и я не знаю, почему это так», точнее в оригинале before 9/11, где под 11 сентября подразумевается 11 сентября 2001
Так он а пост фильтрация запросов делалась?
Чтобы отсечь 11.09.2001…
И большие сомнения я имею, что исследование велось с до 11.09.2001
Как можно написать о 11 сентября как о терракте в изданном до 11 сентября 2011 года? По оси X — года публикации
Хотя в чем-то вы правы если автор пишет «в базе данных Google Ngrams с 2000 года.»

Но если смотреть на 11 число других месяцев — он пишет «Я построил медианы для каждого порядкового номера с 2000 по 2008 года.» и «Но результат у 11-го числа меньше всех на довольно большую величину»…

Почему так для 11 чисел других месяцев в выборке с 2000 года автор так и не ответил
НЛО прилетело и опубликовало эту надпись здесь
Пробывал. Что хочешь обсудить?
Приведенный рисунок составлен для книг с 2000 года, то есть все рассуждения про шрифты и написания для этих данных идут лесом.
Автор пишет: Я построил медианы для каждого порядкового номера с 2000 по 2008 года… Но результат у 11-го числа меньше всех на довольно большую величину (с Р-значением < 0,05), что на первый взгляд сложно объяснить.… Качество печати книг с 1970 года способствует уменьшению количества неправильных распознаваний, но полностью они не исчезли, поэтому оставшиеся проблемы и проявились на комиксе от xkcd.Открытым остаётся вопрос популярности ошибки, при которой 11 заменяется на n-ное.… Единственный способ это узнать – открыть исходный код алгоритма от Google, распознающего текст. Это упражнение мы оставим читателю.

Что 11 февраля, марта, июня, июля, августа это проблема распознования?
НЛО прилетело и опубликовало эту надпись здесь
Тем что на рисунке они имеют маленький размер.
НЛО прилетело и опубликовало эту надпись здесь
Они не все имеют маленький размер (9/11 исключаем), указанные имет очень отличный от среднего других дней в месяце
Статья не объясняет почему именно по выборке 2000-2008(2015).
НЛО прилетело и опубликовало эту надпись здесь
Они размлчны между собой как 11 число.

Это даты публикации. Графики с 1800 года. С 2000 для 11 числа упоминание все равно мало по сравнению с другими числами
Статью читал, прежде чем написать…
Но вот не увидел чтобы было написано, 11 сентября 1999 года было упомянуто 20005 раз, 11 сентября 1908 было в запросах 100 раз и т.д.
Попробуйте наберите 11 сентебря и любой год, и у вас на соответствующую дату будет очень очевидный результат.
Была ли проведена пост фильтрация не написано.
там ващет написано что с 11 сентября после 2001 всё понятно, а речь идёт о том что с 1800 года 11 число месяца попадает в статистику реже чем например 15е.

P.S. коментарий показывающий насколько далеки коментаторы от внимательного чтения статьи.
Ну и о чем это говорит?
Что всё таки 11.08.2001 всё таки внесло сильный вклад в эту статистику?
Вы в конце концов попробуйте забить эту дату в поисковик и такую же но в другом году.
Он ничего не пишет о пост фильтрации.
Вы не туда думаете. В посте идет подсчет статистики не запросов в «просто гугл», а его сервиса ngrams, который ищет не в вебе, а в буках(книгах).
Он пишет, что специально считал медианы, чтобы уменьшить влияниу этого очевидного выброса. Вы это тоже не прчитали.? И, да, влияние, безусловно, есть. Вы и картинку с календарём не видели? Чего вы вообще получить хотите? С 9/11 всё предельно ясно, случай тривиальный и абсолютно неинтересный.
кажется проблема в том, что мы учитываем 9/11 но делаем это без уважения.
Похоже.
Эгей, товарищ демдвг, если у вас так чешется, то вот вам моё троекратное «КУ»! Отпускает?
Исследование о том что число 11 любого месяца (кроме 11 сентября) встречается реже чем остальные числа.
Если посмотреть на первую картинку, то там в каждом месяце число 11 почти самое маленькое (кроме 11 сентября)
Так в этой статье речь не об 11 сентября, а об 11 числах всех других месяцев. И об упоминании 11.09 до 2001 года.
Ещё одна статья на тему «Вы ещё доверяете машинному распознаванию?»
Возможно помимо дефектов распознавания там действительно кроется некий статистический артефакт в стиле закона Бенфорда.
в стиле закона Бенфорда
Спасибо за упоминание. Было интересно о нем почитать.
>>как часто это число упоминается в книгах по своему имени (например, «14 октября»)
Я минут 15 сижу гуглю про 14 октября и ничего не могу найти. На календаре с картинки дата имеет обычный размер. Или это как пример «любой клавиши»?
> если оно используется в названии с долгой историей, типа 3d Marine Division.

Сейчас такое использование вновь набирает популярность, особенно на афишах кинотеатров.
интересно, после добавления буквенно-цифровых комбинаций для «11», сделал ли он так же для остальных чисел с единицей? Из текста не очень понял этого
эх, распознавалки… «из-за холма показались тапки противника. С неба на них обрушились наши вилы»
Ну и «Николай ИИ-тый» с некоторых пор тоже доставляет.

Очевидно, автор совсем не знаком с китайской и азиатской культурой.
Про цифру 2 и числа с её участием там вообще никто не задумывается: оно означает "смерть".


Аналогично тому, как в английском 2=>to, 4=>for, в китайском языке каждая цифра созвучна с каким-то словом.
Вот двойке не повезло.


Ни один китаец не купит дом с номером 2, 12 и так далее, откажется от номеров гостиницы и квартиры на этих этажах — сильно дешевле, чем на других.

Не 2, а 4.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации