Comments 32
Исследование показывающее как далеко иногда ученые от реальной жизни.
11 сентября был крупнейший теракт в США
11 сентября был крупнейший теракт в США
автор об этом пишет — «Так было и до 11 сентября, и я не знаю, почему это так», точнее в оригинале before 9/11, где под 11 сентября подразумевается 11 сентября 2001
Так он а пост фильтрация запросов делалась?
Чтобы отсечь 11.09.2001…
И большие сомнения я имею, что исследование велось с до 11.09.2001
Чтобы отсечь 11.09.2001…
И большие сомнения я имею, что исследование велось с до 11.09.2001
Как можно написать о 11 сентября как о терракте в изданном до 11 сентября 2011 года? По оси X — года публикации
Хотя в чем-то вы правы если автор пишет «в базе данных Google Ngrams с 2000 года.»
Но если смотреть на 11 число других месяцев — он пишет «Я построил медианы для каждого порядкового номера с 2000 по 2008 года.» и «Но результат у 11-го числа меньше всех на довольно большую величину»…
Почему так для 11 чисел других месяцев в выборке с 2000 года автор так и не ответил
Но если смотреть на 11 число других месяцев — он пишет «Я построил медианы для каждого порядкового номера с 2000 по 2008 года.» и «Но результат у 11-го числа меньше всех на довольно большую величину»…
Почему так для 11 чисел других месяцев в выборке с 2000 года автор так и не ответил
UFO just landed and posted this here
Пробывал. Что хочешь обсудить?
Приведенный рисунок составлен для книг с 2000 года, то есть все рассуждения про шрифты и написания для этих данных идут лесом.
Автор пишет: Я построил медианы для каждого порядкового номера с 2000 по 2008 года… Но результат у 11-го числа меньше всех на довольно большую величину (с Р-значением < 0,05), что на первый взгляд сложно объяснить.… Качество печати книг с 1970 года способствует уменьшению количества неправильных распознаваний, но полностью они не исчезли, поэтому оставшиеся проблемы и проявились на комиксе от xkcd.Открытым остаётся вопрос популярности ошибки, при которой 11 заменяется на n-ное.… Единственный способ это узнать – открыть исходный код алгоритма от Google, распознающего текст. Это упражнение мы оставим читателю.
Что 11 февраля, марта, июня, июля, августа это проблема распознования?
Приведенный рисунок составлен для книг с 2000 года, то есть все рассуждения про шрифты и написания для этих данных идут лесом.
Автор пишет: Я построил медианы для каждого порядкового номера с 2000 по 2008 года… Но результат у 11-го числа меньше всех на довольно большую величину (с Р-значением < 0,05), что на первый взгляд сложно объяснить.… Качество печати книг с 1970 года способствует уменьшению количества неправильных распознаваний, но полностью они не исчезли, поэтому оставшиеся проблемы и проявились на комиксе от xkcd.Открытым остаётся вопрос популярности ошибки, при которой 11 заменяется на n-ное.… Единственный способ это узнать – открыть исходный код алгоритма от Google, распознающего текст. Это упражнение мы оставим читателю.
Что 11 февраля, марта, июня, июля, августа это проблема распознования?
UFO just landed and posted this here
Тем что на рисунке они имеют маленький размер.
UFO just landed and posted this here
Они не все имеют маленький размер (9/11 исключаем), указанные имет очень отличный от среднего других дней в месяце
Статья не объясняет почему именно по выборке 2000-2008(2015).
Статья не объясняет почему именно по выборке 2000-2008(2015).
Статью не читай, комментируй быстрее, твоё мнение так важно, наш капитан.
Статью читал, прежде чем написать…
Но вот не увидел чтобы было написано, 11 сентября 1999 года было упомянуто 20005 раз, 11 сентября 1908 было в запросах 100 раз и т.д.
Попробуйте наберите 11 сентебря и любой год, и у вас на соответствующую дату будет очень очевидный результат.
Была ли проведена пост фильтрация не написано.
Но вот не увидел чтобы было написано, 11 сентября 1999 года было упомянуто 20005 раз, 11 сентября 1908 было в запросах 100 раз и т.д.
Попробуйте наберите 11 сентебря и любой год, и у вас на соответствующую дату будет очень очевидный результат.
Была ли проведена пост фильтрация не написано.
там ващет написано что с 11 сентября после 2001 всё понятно, а речь идёт о том что с 1800 года 11 число месяца попадает в статистику реже чем например 15е.
P.S. коментарий показывающий насколько далеки коментаторы от внимательного чтения статьи.
P.S. коментарий показывающий насколько далеки коментаторы от внимательного чтения статьи.
Ну и о чем это говорит?
Что всё таки 11.08.2001 всё таки внесло сильный вклад в эту статистику?
Вы в конце концов попробуйте забить эту дату в поисковик и такую же но в другом году.
Он ничего не пишет о пост фильтрации.
Что всё таки 11.08.2001 всё таки внесло сильный вклад в эту статистику?
Вы в конце концов попробуйте забить эту дату в поисковик и такую же но в другом году.
Он ничего не пишет о пост фильтрации.
Вы не туда думаете. В посте идет подсчет статистики не запросов в «просто гугл», а его сервиса ngrams, который ищет не в вебе, а в буках(книгах).
Он пишет, что специально считал медианы, чтобы уменьшить влияниу этого очевидного выброса. Вы это тоже не прчитали.? И, да, влияние, безусловно, есть. Вы и картинку с календарём не видели? Чего вы вообще получить хотите? С 9/11 всё предельно ясно, случай тривиальный и абсолютно неинтересный.
Исследование о том что число 11 любого месяца (кроме 11 сентября) встречается реже чем остальные числа.
Если посмотреть на первую картинку, то там в каждом месяце число 11 почти самое маленькое (кроме 11 сентября)
Если посмотреть на первую картинку, то там в каждом месяце число 11 почти самое маленькое (кроме 11 сентября)
Так в этой статье речь не об 11 сентября, а об 11 числах всех других месяцев. И об упоминании 11.09 до 2001 года.
Ещё одна статья на тему «Вы ещё доверяете машинному распознаванию?»
>>как часто это число упоминается в книгах по своему имени (например, «14 октября»)
Я минут 15 сижу гуглю про 14 октября и ничего не могу найти. На календаре с картинки дата имеет обычный размер. Или это как пример «любой клавиши»?
Я минут 15 сижу гуглю про 14 октября и ничего не могу найти. На календаре с картинки дата имеет обычный размер. Или это как пример «любой клавиши»?
> если оно используется в названии с долгой историей, типа 3d Marine Division.
Сейчас такое использование вновь набирает популярность, особенно на афишах кинотеатров.
Сейчас такое использование вновь набирает популярность, особенно на афишах кинотеатров.
интересно, после добавления буквенно-цифровых комбинаций для «11», сделал ли он так же для остальных чисел с единицей? Из текста не очень понял этого
эх, распознавалки… «из-за холма показались тапки противника. С неба на них обрушились наши вилы»
Ну и «Николай ИИ-тый» с некоторых пор тоже доставляет.
Ну и «Николай ИИ-тый» с некоторых пор тоже доставляет.
Очевидно, автор совсем не знаком с китайской и азиатской культурой.
Про цифру 2 и числа с её участием там вообще никто не задумывается: оно означает "смерть".
Аналогично тому, как в английском 2=>to, 4=>for, в китайском языке каждая цифра созвучна с каким-то словом.
Вот двойке не повезло.
Ни один китаец не купит дом с номером 2, 12 и так далее, откажется от номеров гостиницы и квартиры на этих этажах — сильно дешевле, чем на других.
Sign up to leave a comment.
Пропажа одиннадцатого числа месяца и других дат