Pull to refresh

Comments 32

Исследование показывающее как далеко иногда ученые от реальной жизни.
11 сентября был крупнейший теракт в США
автор об этом пишет — «Так было и до 11 сентября, и я не знаю, почему это так», точнее в оригинале before 9/11, где под 11 сентября подразумевается 11 сентября 2001
Так он а пост фильтрация запросов делалась?
Чтобы отсечь 11.09.2001…
И большие сомнения я имею, что исследование велось с до 11.09.2001
Как можно написать о 11 сентября как о терракте в изданном до 11 сентября 2011 года? По оси X — года публикации
Хотя в чем-то вы правы если автор пишет «в базе данных Google Ngrams с 2000 года.»

Но если смотреть на 11 число других месяцев — он пишет «Я построил медианы для каждого порядкового номера с 2000 по 2008 года.» и «Но результат у 11-го числа меньше всех на довольно большую величину»…

Почему так для 11 чисел других месяцев в выборке с 2000 года автор так и не ответил
UFO just landed and posted this here
Пробывал. Что хочешь обсудить?
Приведенный рисунок составлен для книг с 2000 года, то есть все рассуждения про шрифты и написания для этих данных идут лесом.
Автор пишет: Я построил медианы для каждого порядкового номера с 2000 по 2008 года… Но результат у 11-го числа меньше всех на довольно большую величину (с Р-значением < 0,05), что на первый взгляд сложно объяснить.… Качество печати книг с 1970 года способствует уменьшению количества неправильных распознаваний, но полностью они не исчезли, поэтому оставшиеся проблемы и проявились на комиксе от xkcd.Открытым остаётся вопрос популярности ошибки, при которой 11 заменяется на n-ное.… Единственный способ это узнать – открыть исходный код алгоритма от Google, распознающего текст. Это упражнение мы оставим читателю.

Что 11 февраля, марта, июня, июля, августа это проблема распознования?
UFO just landed and posted this here
Тем что на рисунке они имеют маленький размер.
UFO just landed and posted this here
Они не все имеют маленький размер (9/11 исключаем), указанные имет очень отличный от среднего других дней в месяце
Статья не объясняет почему именно по выборке 2000-2008(2015).
UFO just landed and posted this here
Они размлчны между собой как 11 число.

Это даты публикации. Графики с 1800 года. С 2000 для 11 числа упоминание все равно мало по сравнению с другими числами
Статью читал, прежде чем написать…
Но вот не увидел чтобы было написано, 11 сентября 1999 года было упомянуто 20005 раз, 11 сентября 1908 было в запросах 100 раз и т.д.
Попробуйте наберите 11 сентебря и любой год, и у вас на соответствующую дату будет очень очевидный результат.
Была ли проведена пост фильтрация не написано.
там ващет написано что с 11 сентября после 2001 всё понятно, а речь идёт о том что с 1800 года 11 число месяца попадает в статистику реже чем например 15е.

P.S. коментарий показывающий насколько далеки коментаторы от внимательного чтения статьи.
Ну и о чем это говорит?
Что всё таки 11.08.2001 всё таки внесло сильный вклад в эту статистику?
Вы в конце концов попробуйте забить эту дату в поисковик и такую же но в другом году.
Он ничего не пишет о пост фильтрации.
Вы не туда думаете. В посте идет подсчет статистики не запросов в «просто гугл», а его сервиса ngrams, который ищет не в вебе, а в буках(книгах).
Он пишет, что специально считал медианы, чтобы уменьшить влияниу этого очевидного выброса. Вы это тоже не прчитали.? И, да, влияние, безусловно, есть. Вы и картинку с календарём не видели? Чего вы вообще получить хотите? С 9/11 всё предельно ясно, случай тривиальный и абсолютно неинтересный.
кажется проблема в том, что мы учитываем 9/11 но делаем это без уважения.
Похоже.
Эгей, товарищ демдвг, если у вас так чешется, то вот вам моё троекратное «КУ»! Отпускает?
Исследование о том что число 11 любого месяца (кроме 11 сентября) встречается реже чем остальные числа.
Если посмотреть на первую картинку, то там в каждом месяце число 11 почти самое маленькое (кроме 11 сентября)
Так в этой статье речь не об 11 сентября, а об 11 числах всех других месяцев. И об упоминании 11.09 до 2001 года.
Ещё одна статья на тему «Вы ещё доверяете машинному распознаванию?»
Возможно помимо дефектов распознавания там действительно кроется некий статистический артефакт в стиле закона Бенфорда.
в стиле закона Бенфорда
Спасибо за упоминание. Было интересно о нем почитать.
>>как часто это число упоминается в книгах по своему имени (например, «14 октября»)
Я минут 15 сижу гуглю про 14 октября и ничего не могу найти. На календаре с картинки дата имеет обычный размер. Или это как пример «любой клавиши»?
> если оно используется в названии с долгой историей, типа 3d Marine Division.

Сейчас такое использование вновь набирает популярность, особенно на афишах кинотеатров.
интересно, после добавления буквенно-цифровых комбинаций для «11», сделал ли он так же для остальных чисел с единицей? Из текста не очень понял этого
эх, распознавалки… «из-за холма показались тапки противника. С неба на них обрушились наши вилы»
Ну и «Николай ИИ-тый» с некоторых пор тоже доставляет.

Очевидно, автор совсем не знаком с китайской и азиатской культурой.
Про цифру 2 и числа с её участием там вообще никто не задумывается: оно означает "смерть".


Аналогично тому, как в английском 2=>to, 4=>for, в китайском языке каждая цифра созвучна с каким-то словом.
Вот двойке не повезло.


Ни один китаец не купит дом с номером 2, 12 и так далее, откажется от номеров гостиницы и квартиры на этих этажах — сильно дешевле, чем на других.

Sign up to leave a comment.

Articles