Comments / Profile of ikashnitsky / Habr

Илья Кашницкий @ikashnitsky

Демограф

ProfileArticles13PostsNewsComments214

Соавторство на Хабре

ikashnitsky Apr 4 2017 at 13:49

Да. Но нельзя же сводить идею соавторства к утилитарным выгодам

Соавторство на Хабре

ikashnitsky Apr 4 2017 at 12:50

пациент скорее мертв, чем жив

Соавторство на Хабре

ikashnitsky Apr 4 2017 at 12:42

Вы не указали основное/главное/истинное преимущество соавторства — совместная работа над текстом. И, разумеется, приятно получать признание за проделанную работу пусть и в виде рейтинга.

В научной среде соавторство в первую очередь используют для соавторства. Все остальное — шелуха (цитирования, хирши, наименования журналов в резюме)

Соавторство на Хабре

ikashnitsky Apr 4 2017 at 12:00

Все так. Разделение голосов относится только к рейтингу. Карма остается все той же мутной сущностью

Соавторство на Хабре

ikashnitsky Apr 4 2017 at 11:34

Само собой — все по чесноку

Соавторство на Хабре

ikashnitsky Apr 4 2017 at 11:26

Да, я всерьез думал поставить дисклаймер в примере))

Да, может простое разделение даже лучше.

GitHub Pages для сайта на 8 марта

ikashnitsky Mar 9 2017 at 15:35

@igor_suhorukov И все же, думается мне, вы пали жертвой излишней привязанности к знакомым инструментам. Та схема, которую вы описали, в разы сложнее и по архитектуре и — главное — в использовании, чем просто установить ruby и jekyll.

А в пределе на jekyll можно вообще запилить сайт, форкнув и модифицовав документы через сайт гитхаба.

GitHub Pages для сайта на 8 марта

ikashnitsky Mar 8 2017 at 18:53

Спасибо.
Мне эта тема очень нравится как раз тем, как выглядит сетка с постами. Особенно заметно, когда постов очень много, как, например, в этом моем проекте.
А так тем приятных очень много. Вот, если интересно, список, который я когда-то себе составил

Симпатичные темы Jekyll

Jekyll themes (http://jekyllthemes.org/)

Cards - ideal for projects
Gravity
Good Clean Read
Butane
Twister - really cool for various media
beautiful-jekyll
tufte jekyll
Holo Alfa
Pixyll
Contrast (archive page)
Simpleyyt (archive)

SIMPLE:
Basic
Harmony
Kiko
Solo

Для меня ключевое преимущество jekyll в том, что сайт запросто создается и обновляется из-под RStudio. Вообще замкнул все основные рабочие процессы на одну программу. Очень удобно.

GitHub Pages для сайта на 8 марта

ikashnitsky Mar 8 2017 at 15:32

Так и делаю. Подтверждаю простоту и удобство.
На jekyll есть много великолепных и бесплатных шаблонов.
Еще можно локально поднять сайт на компе с помощью jekyll и посмотреть, все ли так, как хотелось.

Мой сайт

data.table: выжимаем максимум скорости при работе с данными в языке R

ikashnitsky Nov 25 2016 at 14:09

Для сравнения скорости исполнения операций в R стандартом давно стал пакет microbenchmark. Суть в том, что время исполнения никогда не бывает строго одинаковым для итераций одной и той же команды. Поэтому для корректного сравнения надо запускать команду много раз подряд (стандарное число итераций — 100) и потом сравнивать распределния потраченного времени. Чаще всего сравнивают медианы. Пример:

library(tidyverse)
library(microbenchmark)

microbenchmark(
        apply(mtcars, 2, mean),
        mtcars %>% summarise_each(funs(mean)),
        summarise_each(mtcars, funs(mean))
)

Unit: microseconds
                                  expr      min       lq      mean    median        uq      max neval
                apply(mtcars, 2, mean)  151.095  175.042  193.2387  184.7345  213.8135  322.714   100
 mtcars %>% summarise_each(funs(mean)) 1671.156 1724.323 1825.2407 1785.4745 1834.7935 3687.832   100
    summarise_each(mtcars, funs(mean)) 1578.504 1634.238 1742.8804 1678.9960 1731.0240 3583.777   100

Еще примеры использования R для решения практических бизнес-задач

ikashnitsky Nov 22 2016 at 17:41

Ну если помнить об этих граблях, можно при необходимости писать полностью, типа stats::filter()

Еще примеры использования R для решения практических бизнес-задач

ikashnitsky Nov 22 2016 at 15:13

Технические детали

Большую часть подгружаемых пакетов можно вызвать одной строкой
library(tidyverse)
Это прекрасный свежий пакет от Hadley/RStudio. Подробнее можно почитать в блоге RStudio, в репозитории github или в документации SO.

Женщины и убийства: есть ли тут взаимосвязь? [часть 2 из 2]

ikashnitsky Nov 11 2016 at 19:35

Ну возрастной интервал, который проанализирован в статье, и на который я ориентировался, не далеко ушел от предложеного Вами — от 15 до 44.

Возрастной состав убийц, а также прочие характерисики. С этим сложнее. Данные есть (например), но с ними надо много работь, чтобы из отдельных записей рассчитать некие county-level характеристики.

Последний вопрос не понял.

Женщины и убийства: есть ли тут взаимосвязь? [часть 2 из 2]

ikashnitsky Nov 11 2016 at 14:49

Данные по латиносам есть. Но тут суть в том, что доля чернокожего населения — достаточно уверенная прокси неблагополучности района.
Можно прогнать раздельно по возрастным группам населения. Или включить возрастную структуру как контрольную переменную. С возрастом преступников сложнее. Но в принципе, и такие данные можно добыть и посчитать.

Последняя мысль отражает типичное интуитивное предположение, которое как раз и не подтверждается данными. В этом ключевая находка авторов исходной статьи (Schacht, R., Tharp, D., & Smith, K.).

Automatic Relevance Determination или машинное обучение когда данных очень мало

ikashnitsky Oct 28 2016 at 10:43

Спасибо!

Automatic Relevance Determination или машинное обучение когда данных очень мало

ikashnitsky Oct 27 2016 at 21:00

А можно очень просто про L1 и L2 регуляризацию? Или хорошую сслылку.

Выборы-2016. Часть 1 — результаты и сравнения

ikashnitsky Oct 24 2016 at 12:08

Да, Web Mercator удобна именно тем, что она отображает единообразно поверхность всей земли — и поэтому популярна в веб приложениях. Но для наших северных широт она слишком искажает площади, смещая фокус к неинтересным с точки зрения данных территориям Сибири.

Из учебника еще 1920-х годов (друг недавно прислал)

В некоторых статьях встречается

вот такая забавная, крайне утилитарная проекция

Источник

Параметры этой проекции я когда-то искал и не сумел сходу найти. Но слишком не зацикливался. Может быть Moskus или QuePaso знают?

Выборы-2016. Часть 1 — результаты и сравнения

ikashnitsky Oct 24 2016 at 10:06

Исходные данные почти всегда публикуют в проекции longlat. Это позволяет минимизировать искажения при последующих трансформациях.
Не накладывает ли leaflet ограничения на использование проекций отличных от longlat?

Выборы-2016. Часть 1 — результаты и сравнения

ikashnitsky Oct 24 2016 at 09:27

Нет, подождите минусить. Я серьезно спрашиваю. Это же одна строчка кода.

shape <- rgdal::spTransform(x = shape, CRSobj = CRS('+init=EPSG:3576'))

Есть рациональное объяснение выбору проекции?

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено

ikashnitsky Oct 24 2016 at 08:59

Очень красиво выглядят веерные графики — плюс одно свидетельство с помощью визуализации.

Мне кажется, этот замечательный материал выглядит неполным без отсылки к источникам, которыми (рискну предположить) вы вдохновлялись.

Опубликованный 19 сентября график (на следующий день после выборов)

Источник (1.4МБ)

Ну еще можно почитать комментарии автора, Сергея Шпилькина.

1 2 3 4

6 7 ...

10 11