Pull to refresh
43
0
Илья Кашницкий @ikashnitsky

Демограф

Send message

Ну простите, стыдно называть анализом кучку надерганных ссылок без логичного и серьезного осмысления. Вы выдаете свое предубеждение за рещультаты анализа

Есть интересный проект leanpub. Он, правда, пока не специализируется на художестенной литературе. Но модель замечательная.

Мне как раз очень понравилось, как вы описали выгрузку данных через API — когда вручную копировал данные хоккеистов, сожалел, что не знаю, как автоматизировать процесс. А вот с самими данными, по-моему, можно было еще много чего интересного нарисовать.

Мерой веса как раз и может выступать букмекерская ставка. А еще коэффициенты пропорциональные стадиям турнира: 1/16, 1/8, 1/4, 1/2, 1 — за финал.

Все так. Просто очень уж выпукло Inkscape смотрится в заголовке.
Программное решение, как правило, лучше тем, что, написанное раз, может быть без лишних усилий использовано много раз. Представьте, что Вы бы построили не 2 графика, а 25. Я бы просто написал функцию, которая прилепляет флаг страны в необходимое место.

Inkscape — явно лишнее звено. Не вполне уверен насчет python и, видимо, seaborn, в R и ggplot2 нашлепнуть флаги команд на графики довольно просто. И, главное, размещать их не придется вручную — достаточно указать отступ от значения столбика. Если еще придираться, надо бы обвечти флаги рамкой — посмотрите на Англию, Польшу и Россию.


Идея анализа ставок букмекеров мне качется очень плодотворной

Спасибо. Очень справедливое замечание. В рисунке 5 лень было возиться с аннотацией при использовании facet. Решил в подписи указать и забыл. Сейчас поправлю.


По сути. Все правильно — каждая точка это усреднение. Просто данные по населению агрегированы по пятилетним когортам, а для хоккеистов есть данные для каждого отдельного года рождения. На самом деле, там строго по одной точке на год. Просто ось х очень сильно сжата для хоккеистов.

Да, довольно сомнительно выглядят выводы, основанные на небольшом количестве наблюдений. При этом не согласен с вами, что регрессионный коэффициент сильно изменится, если убрать две крайние точки. Да, разброс точек вокруг регрессионной линии большой ("облако", residuals), но это говорит лишь об объясняющей силе модели; коэффициент при переменной от разброса не зависит. И чисто визуально: не сильно он изменится, если убрать крайние точки.


С ростом взаимосвязь не напрашивается. Скорее с комплекцией — индекс массы тела (отношение веса в килограммах к квадрату роста в метрах). А вот связь с амплуа точно должна быть. Но при этом защитники, как правило, и массивнее.


Последний аргумент вообще идет в разрез с обсуждаемым тезисом. В статье: чем шире морда — тем больше штрафа.

Есть, конечно, определенное сомнение. Особенно по части количества наблюдений, на которых авторы строят выводы. Но! Попробуйте опубликовать корреляцию типа пираты-потепление в журнале уровня Proceedings of the Royal Society B: Biological Sciences. Да и по цитированиям можно заподозрить, что это не случайный результат, и он подтверждается аналогичными исследованиями.

Да. Видимо, как-то резко изменилась вратарская техника. Мой коллега (он канадец, до 17 лет играл на самом высоком уровне в хоккей) сразу этот момент отметил, когда я только делился с ним планами статьи. Это то, что бросается в глаза — вратари стали значительно выше.

кризис среднего возраста — вид от первого лица

Так нет же никакого пика 1941 года. Судя по графику, пик приходится на 1945; 1940 закономерно существенно выше военных лет. А 1916, правда, похож на аккумуляцию, когда все старое и неизвестное приписывали к последнему дореволюционному году. Подобное очень часто наблюдается в исторических данных о возрастной структуре населения — возрастная аккумуляция на круглых числах.
Очень слабая статья. Мало того, что опоздала чуть больше, чем на месяц, так еще и типичный пример "испорченного телефона". Вы бы хоть поинтересовались, откуда у всей этой шумихи ноги растут, прежде чем переводить рандомную статью рандомного автора (которая тоже опоздала на месяц).

Вся волна публикаций о sci-hub началась с обширной статьи Саймона Оксенхэма на портале Big Thing. Он же написал через неделю еще один великолепный материал про Аарона Шварца, столь поверхностно и искаженно отраженный в вашем переводе (аналогичных вашим косяков в статье Кейт Мерфи нет). Во вступлении к этому второму материалу автор рассказывает, каких трудов стоила публикация всей истории. Sci-hub существует уже 4 года, а волна публикаций прокатилась только в феврале 2016.

Теперь суть претензии. JSTOR — не некоммерческая организация. И статьи у них стоят так же дорого, как и у всех прочих крупных издателей. История про 10 центов за страницу относится к победе Шварца над системой доступа к правовым документам в США (Public Access to Court Electronic Records), которые в принципе должны были быть в открытом доступе, но к ним организовали идиотскую систему доступа.
И все же это не совсем то. Расширение меряет количество оперативной памяти, отводимое компьютером под отображение конкретной вкладки. Это имеет лишь относительную корреляцию с весом самой страницы.
И еще немного про это приложение. Ниже в комментариях приводят ссылку на идельно легкий сайт. Так вот, сравните две картинки:

Раз


Два

Классное расширение. Только вот в тему статьи: официальная страничка этого приложения — 17МБ. На страничке, где все полезное — в виде текста.

Information

Rating
Does not participate
Location
Odense, Fyn, Дания
Date of birth
Registered
Activity