Comments 74
А есть эти книги в переводе? Хочу дать на почитать паре людей…
Поясню для автора статьи: «Один мой знакомый» не знает английский, можете ли вы погуглить для меня переводы этих книг?
Нет, вопрос именно — есть или нету. Найти я могу и сам.
Просто автор ссылается на них — но всюду на англ.версии.
Варинты: русской нет, либо просто англ удобнее автору.
Лично мне пофиг (я уже скачал англ себе).
p.s.: беглый вопрос по «имя книги + перевод» результата не дало.
Просто автор ссылается на них — но всюду на англ.версии.
Варинты: русской нет, либо просто англ удобнее автору.
Лично мне пофиг (я уже скачал англ себе).
p.s.: беглый вопрос по «имя книги + перевод» результата не дало.
Не так давно вышел перевод. https://bookmate.com/books/FhAUBcm9
Отличный пример буквально на днях попадался

Сначала смутило то, что статуя свободы изображена больше Волгоградской Родины, но и остальными статуями на картинке расклад тоже такой же
Для тех, кто не в курсе, статуя свободы без пьедестала (как изображено на картинке) всего 45 метров, а Родина Мать без пьедестала — 52.

Сначала смутило то, что статуя свободы изображена больше Волгоградской Родины, но и остальными статуями на картинке расклад тоже такой же
Для тех, кто не в курсе, статуя свободы без пьедестала (как изображено на картинке) всего 45 метров, а Родина Мать без пьедестала — 52.
И это тоже ложь — цифры с пьедесталом, статуи без.
В своё время нам твердили, что Останкинская башня — самая-самая!
Полез на днях в Вики: добрёл до высотных сооружений…
Ну и листаю по мере роста от Эйфевелевой и по годам…
Дохожу до 2000-х с арабской мегапостройкой — Останкинской нету!
Начинаю поиск от Останкинской — выясняется, что как чисто высотка она в свои годы не дотягивала до рекордсменов!!!
НО!
Если учитывать только телевизионные, только бетонные и только без внешних распорок… То да, она была таки на первом месте!
Тоже статистика, однака…
Полез на днях в Вики: добрёл до высотных сооружений…
Ну и листаю по мере роста от Эйфевелевой и по годам…
Дохожу до 2000-х с арабской мегапостройкой — Останкинской нету!
Начинаю поиск от Останкинской — выясняется, что как чисто высотка она в свои годы не дотягивала до рекордсменов!!!
НО!
Если учитывать только телевизионные, только бетонные и только без внешних распорок… То да, она была таки на первом месте!
Тоже статистика, однака…
Статистика такая статистика :)


Для тех, кто не в курсе, статуя свободы без пьедестала (как изображено на картинке) всего 45 метров, а Родина Мать без пьедестала — 52.
Для тех, кто не в курсе. Высота пьедестала статуи «Родина Мать» в Волгограде — около 2 метров. 52 метра — это высота самой фигуры без пьедестала. 85 метров — высота фигуры без пьедестала до конца меча. Высота Статуи Свободы без пьедестала до конца факела 45-46 метров (по разным данным).
А вы дезинформируете народ, давая высоту Статуи Свободы по факел, а Родины Матери по макушку ;)
Ух. Интересно, сколько таких статуй на просторах СНГ?
а то оказалось, чтол статуя «Родина-Мать» внезапно есть не только в Киеве, а и в Волгограде…
а то оказалось, чтол статуя «Родина-Мать» внезапно есть не только в Киеве, а и в Волгограде…
По википедии — довольно много.
В википедии есть наглядная картинка:


Очень важная статья для любого менеджера проекта, я считаю!
20% — это вероятность того, что пять орлов не выпадут ни разу за 50 подходов. Значит, искомая вероятность — 80%. Это, конечно, не есть абсолютная уверенность в успехе, но всё-таки немало. Но не суть. Автор исходного текста имел в виду «мы будем повторять опыт, пока он не даст нужные нам результаты».
Немного не так
>>> 1-(31/32.0)**50
0.7955506304323648
>>> 1-(31/32.0)**50
0.7955506304323648
Хорошая статья, спасибо. Теперь будет на что ссылку давать тем, «кто знает как правильно всем этим заниматься», прежде чем отсылать почитать Тафти и учебник по статистике.
По поводу восприятия людьми различных стимулов — известный Закон Стивенса.
Ресурс, именно по типичным ошибкам в статистике: Statistics Done Wrong.
Ну и масса блогов по визуализации данных.
По поводу восприятия людьми различных стимулов — известный Закон Стивенса.
Ресурс, именно по типичным ошибкам в статистике: Statistics Done Wrong.
Ну и масса блогов по визуализации данных.
А ещё гуглите «Манипулятивная диаграммология».
Она же вот эта статья с загуглённой презентацией «Как не дать диаграммам себя обмануть».
Она же вот эта статья с загуглённой презентацией «Как не дать диаграммам себя обмануть».
Спасибо за статтю.
Напомнило:
Если взять число и отнять от него 20%, потом добавить 20% от того что плучилось, то получится число, на 4% меншее за исходное.
Напомнило:
Если взять число и отнять от него 20%, потом добавить 20% от того что плучилось, то получится число, на 4% меншее за исходное.
del
Спасибо за перевод. Было интересно почитать.
Есть ошибочка. Причём в оригинале. Хотя ситуацию принципиально она не меняет, но
10 копеек от 30 копеек, будет 33,(3)%, а не 50%.
Есть ошибочка. Причём в оригинале. Хотя ситуацию принципиально она не меняет, но
Давайте попробуем еще разок, пусть текущий год — 100%, значит цены на молоко составляли 200% в прошлом году, а хлеб 50%.
10 копеек от 30 копеек, будет 33,(3)%, а не 50%.
Так и не понял, график чего изобразили New York Post.
Ещё один частый подлог — корреляция преподносится как причинно-следственная связь.


Меня всегда раздражают душераздирающие графики ужасающего падения величины почти до нуля, при том, что внизу шкала Y начинается с лишь немного меньшего значения, чем максимум на графике. В итоге, падение на полпроцента создаёт панику в головах людей.
О дааа :)
Помню, лет 7–8 назад, когда был одним из ответственных за доступность сети банкоматов, негодовал, почему большие начальники докладывают самым большим начальникам уровень доступности в масштабе по оси ординат что-то типа от 95 до 97 процентов. Естественно, при таком раскладе падение на полпроцента выглядело феерическим провалом и влекло за собой необходимость долго объясняться. Один раз мои начальники со мной согласились и доложили в масштабе от 0 до 100. На это получили выговор: «не видно изменений, переделайте».
Помню, лет 7–8 назад, когда был одним из ответственных за доступность сети банкоматов, негодовал, почему большие начальники докладывают самым большим начальникам уровень доступности в масштабе по оси ординат что-то типа от 95 до 97 процентов. Естественно, при таком раскладе падение на полпроцента выглядело феерическим провалом и влекло за собой необходимость долго объясняться. Один раз мои начальники со мной согласились и доложили в масштабе от 0 до 100. На это получили выговор: «не видно изменений, переделайте».
Ну так «уровень доступности» стоило бы измерять в процентах недоступности ибо пользователя не волнует сколько раз он успешно воспользовался банкоматом, но его бесит каждый случай когда он воспользоваться им не смог :)
Было бы от 0% (идеал) до, скажем, 7% (ужас). Полпроцента в таком масштабе вполне себе ощущаются.
А 95-97% сделали, надо полагать, потому что «95% доступности» звучит лучше чем «5% недоступности».
Но вот начало шкалы-то как раз выбрали правильно, на графиках для адекватного отражения ситуации все равно следовало бы отразить примерно тот же диапазон, просто в цифрах доступности — т.е. те самые 90-100% или 93-100%.
Было бы от 0% (идеал) до, скажем, 7% (ужас). Полпроцента в таком масштабе вполне себе ощущаются.
А 95-97% сделали, надо полагать, потому что «95% доступности» звучит лучше чем «5% недоступности».
Но вот начало шкалы-то как раз выбрали правильно, на графиках для адекватного отражения ситуации все равно следовало бы отразить примерно тот же диапазон, просто в цифрах доступности — т.е. те самые 90-100% или 93-100%.
На мой вкус — статья несколько… biased («предвзята»).
Все-таки, за такого рода ляпами чаще стоит неграмотность, чем злой умысел. Сколь-нибудь квалифицированные статистики редко делают такие ошибки 00 слишком они «дидактичны». Такие цифры чаще производят на свет менеджеры по продажам и пр.
В пору доступности «Big Data» нужно быть особо осторожным на предмет «False Positive Discoveries» — «Ложные открытия»
Все-таки, за такого рода ляпами чаще стоит неграмотность, чем злой умысел. Сколь-нибудь квалифицированные статистики редко делают такие ошибки 00 слишком они «дидактичны». Такие цифры чаще производят на свет менеджеры по продажам и пр.
В пору доступности «Big Data» нужно быть особо осторожным на предмет «False Positive Discoveries» — «Ложные открытия»
(картинка подо катом)
(картинка подо катом)
Вы недооцениваете человеческую тупость.
Я видел подобные фокусы (в частности, совершенно по-идиотски сконструированные выборки и откровенную подмену причинно-следственной связи корреляцией) в исследованиях, причем не в каких-то несчастных местечковых самопалках и студенческих работах, а «типа как серьезных» публикациях оплаченных вполне ощутимыми грантами (собственно, очень многие из поддерживаемых Институтом Гувера исследований в т.н. social sciences грешат подобными «фокусами»).
«Деньги взад» у таких учоных, насколько я знаю, еще ни разу никто не попросил.
Я видел подобные фокусы (в частности, совершенно по-идиотски сконструированные выборки и откровенную подмену причинно-следственной связи корреляцией) в исследованиях, причем не в каких-то несчастных местечковых самопалках и студенческих работах, а «типа как серьезных» публикациях оплаченных вполне ощутимыми грантами (собственно, очень многие из поддерживаемых Институтом Гувера исследований в т.н. social sciences грешат подобными «фокусами»).
«Деньги взад» у таких учоных, насколько я знаю, еще ни разу никто не попросил.
Хотел бы ещё добавить, что у Мартина Гарднера в книге «А ну-ка, догадайся!», посвящённой парадоксам в широком смысле слова, пятая (кажется) глава посвящена статистике и типичным ошибкам интерпретации.
Например, по статистике, смертность от рака (относительная, доля от всех причин смерти) в мире с каждым годом всё выше. Казалось бы, из этого напрашивается вывод, что медицина плоха и всё хуже справляется с раком. Ну или что экология стала хуже. Или ещё что-то в этом роде.
На самом же деле это прямое следствие увеличения средней продолжительности жизни и уровня её качества — подавляющее большинство случаев рака бывает у пожилых людей, а раньше просто до рака, так сказать, не успевали дожить.
Есть в переводе на русский, читается легко, всем советую.
Например, по статистике, смертность от рака (относительная, доля от всех причин смерти) в мире с каждым годом всё выше. Казалось бы, из этого напрашивается вывод, что медицина плоха и всё хуже справляется с раком. Ну или что экология стала хуже. Или ещё что-то в этом роде.
На самом же деле это прямое следствие увеличения средней продолжительности жизни и уровня её качества — подавляющее большинство случаев рака бывает у пожилых людей, а раньше просто до рака, так сказать, не успевали дожить.
Есть в переводе на русский, читается легко, всем советую.
Мои «5 копеек» из 2009-го года:
habrahabr.ru/post/58344/
habrahabr.ru/post/58344/
У нас в лаборатории большинство экспериментов проводилось на допотопном оборудовании. Прибор чертил на бумаге пером кривую, по наклону которой (методом прикладывания линейки к воображаемой средней линии) определялись различные параметры.
Когда определяли например графики активности ферментов, дабы не смущать научрука большим отклонением от его ранее полученных данных, один край линейки чуть сдвигался вверх или вниз (буквально на 0.5-1.0 мм) в зависимости от допущенной ошибки. Заметить такой финт — невозможно из-за «шумности» прибора.
Когда определяли например графики активности ферментов, дабы не смущать научрука большим отклонением от его ранее полученных данных, один край линейки чуть сдвигался вверх или вниз (буквально на 0.5-1.0 мм) в зависимости от допущенной ошибки. Заметить такой финт — невозможно из-за «шумности» прибора.
Обожаю математику и тервер!
В инсте просто прикола ради рассчитал вероятность того, что пол-аудитории задохнётся: вероятность того, что атом воздуха находится в передней или задней части аудитории — 0.5: тупо или там или там.
Размер аудитории известен, число атомов на кубометр — известно. Надо посчитать вероятность того, что ВСЕ атомы воздуха окажутся с одной стороны…
Число вышло исчезающе малым, но таки ВЕРОЯТНЫМ!
Долго одногрупников пугал, а потом объяснил, что рассчёт яйца выеденного не стоит, т.к. не учитывает давления и т.д.: если в какой-то стороне газа больше, то лишних тупо выпнут в другую часть…
В инсте просто прикола ради рассчитал вероятность того, что пол-аудитории задохнётся: вероятность того, что атом воздуха находится в передней или задней части аудитории — 0.5: тупо или там или там.
Размер аудитории известен, число атомов на кубометр — известно. Надо посчитать вероятность того, что ВСЕ атомы воздуха окажутся с одной стороны…
Число вышло исчезающе малым, но таки ВЕРОЯТНЫМ!
Долго одногрупников пугал, а потом объяснил, что рассчёт яйца выеденного не стоит, т.к. не учитывает давления и т.д.: если в какой-то стороне газа больше, то лишних тупо выпнут в другую часть…
Сразу вспоминаются все эти ТВ ролики с высказываниями вида «Номер 1 в России/Европе/Мире*».
Есть ещё вот такое:

Это рассчитано на тех, кто читает очень быстро. При большой скорости чтения, например 500 слов в минуту на критическую оценку текста времени нет, и читатель впитывает всё, что ему написал автор.
Тут есть люди, которые читают по паре-тройке книг в неделю. Они не отдают себе отчёта в том, что не обдумывают прочитанное — они просто поглощают.
Я некоторые книги по полгода читаю, а некоторые вовсе не осилил, при этом часть книг я не читаю, а изучаю с карандашом в руках. В среднем на книгу уходит месяц, иногда больше. То, что можно читать по пути на работу, в метро повиснув между пассажирами, я книгами не считаю.
Тут есть люди, которые читают по паре-тройке книг в неделю. Они не отдают себе отчёта в том, что не обдумывают прочитанное — они просто поглощают.
Я некоторые книги по полгода читаю, а некоторые вовсе не осилил, при этом часть книг я не читаю, а изучаю с карандашом в руках. В среднем на книгу уходит месяц, иногда больше. То, что можно читать по пути на работу, в метро повиснув между пассажирами, я книгами не считаю.
Поясните пожлуйста, а что именно здесь не так? Нет, я понимаю, что написана ерунда, но что именно вас возмутило?) Подобные книги можно целыми параграфами в качестве цитат приводить…
Вспоминается советский анекдот:
Хрушёв и Кеннеди решили устроить шуточный забег глав государств. Кеннеди, как более молодой, выиграл.
В Американских газетах:
В забеге глав крупнейших государств наш президент первый, а советский генсек пришёл самым последним.
В Советских:
В забеге глав крупнейших государств Никита Сергеевич Хрушёв занял почётное второе место. Американский президент лишь на предпоследнем.
Хрушёв и Кеннеди решили устроить шуточный забег глав государств. Кеннеди, как более молодой, выиграл.
В Американских газетах:
В забеге глав крупнейших государств наш президент первый, а советский генсек пришёл самым последним.
В Советских:
В забеге глав крупнейших государств Никита Сергеевич Хрушёв занял почётное второе место. Американский президент лишь на предпоследнем.
Десять путинских лет



Прикольно. Совершенно хрестоматийный обман.
Что-то не вижу явного обмана (если, конечно, указанные цифры соответствуют действительности), скорее вижу грубую небрежность в построении графиков (проще говоря, графики построены в разных масштабах, чтобы казалось, что они пересекаются гораздо раньше, чем на самом деле) и полное отсутствие пояснений по промежуточным значениям (и при этом зачем-то внизу сделана линейка), да и вообще, непонятна цена деления (делений 22, а годов — 10).
А Вам не кажется немного странным, что тезис — про «рождаемость» а на первом графике (где столбики и человечки) «численность жителей»?
Ежели я в Екатеринбург перееду, то численность там вырастет на 1 :)
Второй график чуть менее «палевный» (хотя надо бы проверить цифры), но всем нормальным специалистам известно что в РФ имеется периодическое колебание рождаемости, которое надо учитывать при оценке ценности заявлений относительно того что «Политик Х увеличил рождаемость....»
Так что очень, очень хрестоматийный пример.
Ежели я в Екатеринбург перееду, то численность там вырастет на 1 :)
Второй график чуть менее «палевный» (хотя надо бы проверить цифры), но всем нормальным специалистам известно что в РФ имеется периодическое колебание рождаемости, которое надо учитывать при оценке ценности заявлений относительно того что «Политик Х увеличил рождаемость....»
Так что очень, очень хрестоматийный пример.
Если цифры рождаемости и смертности не взяты с потолка, то это — скорее уже не явный обман, а всего лишь демагогия. То есть, «мы сказали всю правду, а то, что вы их неправильно поняли, это ваши проблемы».
Согласен с тем, что первый график удобно притянут за уши. А вот второй мне понравился. По моим прикидкам разница рождаемость-смертность принесла "-50000" :) Так что «понаехало» прилично.
При этом сам график не врёт в плане «позитива» — рождаемость привысила сметность, динамика тоже положительная, выборка за 10 лет тоже добавляет оптимизма. А вот правдо ли это — другой вопрос.
При этом сам график не врёт в плане «позитива» — рождаемость привысила сметность, динамика тоже положительная, выборка за 10 лет тоже добавляет оптимизма. А вот правдо ли это — другой вопрос.
Так я и говорю: демагогия. Даны три утверждения:
1) с 2000 по 2010 правил Путин;
2) за это время рождаемость повышалась, смертность уменьшалась, так что в какой-то момент рождаемость превысила смертность впервые со времён перестройки;
3) за этот период население города увеличилось.
Допустим эти утверждения верные. О причинно-следственных связях между ними ничего не сказано, но невнимательный читатель решит, что они выстроены именно так: Путин правил хорошо, поэтому рождаемость увеличилась настолько, что стала причиной роста населения, на что собственно и рассчитано. А вот разные масштабы графиков — это уже грубый просчёт, надо было хотя бы разместить их отдельно, если хотелось, чтобы их не сравнивали.
1) с 2000 по 2010 правил Путин;
2) за это время рождаемость повышалась, смертность уменьшалась, так что в какой-то момент рождаемость превысила смертность впервые со времён перестройки;
3) за этот период население города увеличилось.
Допустим эти утверждения верные. О причинно-следственных связях между ними ничего не сказано, но невнимательный читатель решит, что они выстроены именно так: Путин правил хорошо, поэтому рождаемость увеличилась настолько, что стала причиной роста населения, на что собственно и рассчитано. А вот разные масштабы графиков — это уже грубый просчёт, надо было хотя бы разместить их отдельно, если хотелось, чтобы их не сравнивали.
Sign up to leave a comment.
Как правильно лгать с помощью статистики