Comments / Profile of ikashnitsky / Habr

Илья Кашницкий @ikashnitsky

Демограф

ikashnitsky Dec 28 2017 at 12:33

Спасибо! Еще будет про геоданные и карты, вероятно, под конец января, и сперва в моем блоге. Если хотите немного "забежать вперед", можете пройтись по моему коду (gist) к этому посту. Вся карта воссоздается с нуля этим кодом.

Добыча данных в R

ikashnitsky Dec 28 2017 at 12:29

Спасибо! Хорошее замечание. Честный ответ — потому что не подумал. Но действительно, картинки тут только как примеры использования, не в них суть. Кроме того, этот материал я готовил для студентов, которым прививаю интерес к R через визуализацию данных.

Убунту OpenBox, установка и настройка

ikashnitsky Dec 9 2017 at 21:11

Ну зачем же так жестоко. Дайте человеку всласть потрахаться с багами в пятничный вечер))

ggplot2: как легко совместить несколько графиков в одном, часть 3

ikashnitsky Oct 2 2017 at 08:17

Не так давно писал два поста (раз, два — на английском) о том, как строить композитные карты в ggplot2. Функция annotate_custom позволяет творить чудеса.

RMarkdown, R и ggplot

ikashnitsky May 4 2017 at 14:00

reveal.js прекрасно создается из-под R.
http://rmarkdown.rstudio.com/revealjs_presentation_format.html
Очень рекомендую.
Мой пример

Выбор диаграммы для одномерных данных: геометрическая модель

ikashnitsky Apr 10 2017 at 10:29

Да, это очень мощное дополнение к боксплоту.
Ну а грубо по многим причинам. Главное (насколько я понимаю): мы визуализируем распределения с помощью боксплота, как правило, перед тем, как покрутить регрессии и посмотреть значимость различий. В большинстве случаев результаты анализа говорят нам о различиях в средних значениях, а не медианных. То есть аналитическая мощь этих засечек опирается на допущение о нормальности распределения, что редко бывает совсем уж правдой. Но все это значимо лишь в пограничных случаях (когда, кстати, и выбор 95% доверительного интервала — не более чем условность). Если различия по засечкам большие, то можно быть уверенным в их статистической значимости.

Выбор диаграммы для одномерных данных: геометрическая модель

ikashnitsky Apr 10 2017 at 10:16

да
Но это довольно грубый и быстрый способ расчета доверительного интервала

Выбор диаграммы для одномерных данных: геометрическая модель

ikashnitsky Apr 10 2017 at 10:01

Это и есть boxplot. Только добавлены засечки, обозначающие приближенно доверительный интервал медианного значения

Выбор диаграммы для одномерных данных: геометрическая модель

ikashnitsky Apr 10 2017 at 09:13

Еще очень удобны засечки (notches), обозначающие доверительный интервал медианы. Можно быстро и довольно надежно судить о значимости различий между группами наблюдений.

Пример

Примечание: TSR = Total Support Ratio — отношение численности населения в трудоспособном возрасте (15-64) к численности населения старше моложе трудоспособного возраста

Литература по теме

Krzywinski, M., & Altman, N. (2014). Points of Significance: Visualizing samples with box plots. Nature Methods, 11(2), 119–120. https://doi.org/10.1038/nmeth.2813
McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of Box Plots. The American Statistician, 32(1), 12–16. https://doi.org/10.2307/2683468

Соавторство на Хабре

ikashnitsky Apr 5 2017 at 11:49

вот классный пост varagian про формулу рейтинга

Соавторство на Хабре

ikashnitsky Apr 5 2017 at 11:47

карма и рейтинг вообще — очень мутная система, заслуживает отдельной дискуссии

Соавторство на Хабре

ikashnitsky Apr 5 2017 at 09:31

Совершенно справедливое замечание!

книга жалоб

Мой последний содержательный пост (который я считаю самым крутым с точки зрения использованных технологий) прошел почти незамеченным, тогда как этот дискуссионный пост набрал рекордное для меня число плюсов.

Но я вообще не вижу, как популярный медиаресурс может обойтись совсем без завлекаловки со всеми вытекающими. И так удивительно, сколько всего ценного есть на хабре.

Соавторство на Хабре

ikashnitsky Apr 5 2017 at 08:30

Не согласен.
Хабр — открытая площадка. Качество статей фильтруется голосованием. Незачем дополнительно вводить барьер в виде редакторов. Сейчас редактура поста — личная ответственность автора. Схалтуришь — заминусуют. Ну а если хабр голосованием поднимает посты, которые кажется вам слабыми… ну что ж… на эту тему много писали. Я не застал толком времена (если такие были), когда по общему мнению (если такое есть) хабр был тортом. В целом, мне очень многое нравится на хабре сегодняшнем. Но всегда можно что-то улучшить.

Соавторство на Хабре

ikashnitsky Apr 5 2017 at 08:25

Да не, развернуть на хабре систему типа SO (не говоря уже о git) — это слишком. Хотя бы просто соавторство для начала

Соавторство на Хабре

ikashnitsky Apr 5 2017 at 08:16

Тсс… кто прошлое помянет

Соавторство на Хабре

ikashnitsky Apr 5 2017 at 07:38

ага, по почте Word… плавали — знаем

В ИТОГЕ