Pull to refresh
43
0
Илья Кашницкий @ikashnitsky

Демограф

Send message

Да. Но нельзя же сводить идею соавторства к утилитарным выгодам

пациент скорее мертв, чем жив

Вы не указали основное/главное/истинное преимущество соавторства — совместная работа над текстом. И, разумеется, приятно получать признание за проделанную работу пусть и в виде рейтинга.


В научной среде соавторство в первую очередь используют для соавторства. Все остальное — шелуха (цитирования, хирши, наименования журналов в резюме)

Все так. Разделение голосов относится только к рейтингу. Карма остается все той же мутной сущностью

Само собой — все по чесноку

Да, я всерьез думал поставить дисклаймер в примере))


Да, может простое разделение даже лучше.

@igor_suhorukov И все же, думается мне, вы пали жертвой излишней привязанности к знакомым инструментам. Та схема, которую вы описали, в разы сложнее и по архитектуре и — главное — в использовании, чем просто установить ruby и jekyll.


А в пределе на jekyll можно вообще запилить сайт, форкнув и модифицовав документы через сайт гитхаба.

Спасибо.
Мне эта тема очень нравится как раз тем, как выглядит сетка с постами. Особенно заметно, когда постов очень много, как, например, в этом моем проекте.
А так тем приятных очень много. Вот, если интересно, список, который я когда-то себе составил


Симпатичные темы Jekyll
Jekyll themes (http://jekyllthemes.org/)

Cards - ideal for projects
Gravity
Good Clean Read
Butane
Twister - really cool for various media
beautiful-jekyll
tufte jekyll
Holo Alfa
Pixyll
Contrast (archive page)
Simpleyyt (archive)

SIMPLE:
Basic
Harmony
Kiko
Solo 



Для меня ключевое преимущество jekyll в том, что сайт запросто создается и обновляется из-под RStudio. Вообще замкнул все основные рабочие процессы на одну программу. Очень удобно.

Так и делаю. Подтверждаю простоту и удобство.
На jekyll есть много великолепных и бесплатных шаблонов.
Еще можно локально поднять сайт на компе с помощью jekyll и посмотреть, все ли так, как хотелось.




Мой сайт

Для сравнения скорости исполнения операций в R стандартом давно стал пакет microbenchmark. Суть в том, что время исполнения никогда не бывает строго одинаковым для итераций одной и той же команды. Поэтому для корректного сравнения надо запускать команду много раз подряд (стандарное число итераций — 100) и потом сравнивать распределния потраченного времени. Чаще всего сравнивают медианы. Пример:


library(tidyverse)
library(microbenchmark)

microbenchmark(
        apply(mtcars, 2, mean),
        mtcars %>% summarise_each(funs(mean)),
        summarise_each(mtcars, funs(mean))
)

Unit: microseconds
                                  expr      min       lq      mean    median        uq      max neval
                apply(mtcars, 2, mean)  151.095  175.042  193.2387  184.7345  213.8135  322.714   100
 mtcars %>% summarise_each(funs(mean)) 1671.156 1724.323 1825.2407 1785.4745 1834.7935 3687.832   100
    summarise_each(mtcars, funs(mean)) 1578.504 1634.238 1742.8804 1678.9960 1731.0240 3583.777   100

Ну если помнить об этих граблях, можно при необходимости писать полностью, типа stats::filter()

Технические детали

Большую часть подгружаемых пакетов можно вызвать одной строкой
library(tidyverse)
Это прекрасный свежий пакет от Hadley/RStudio. Подробнее можно почитать в блоге RStudio, в репозитории github или в документации SO.

Ну возрастной интервал, который проанализирован в статье, и на который я ориентировался, не далеко ушел от предложеного Вами — от 15 до 44.


Возрастной состав убийц, а также прочие характерисики. С этим сложнее. Данные есть (например), но с ними надо много работь, чтобы из отдельных записей рассчитать некие county-level характеристики.


Последний вопрос не понял.

Данные по латиносам есть. Но тут суть в том, что доля чернокожего населения — достаточно уверенная прокси неблагополучности района.
Можно прогнать раздельно по возрастным группам населения. Или включить возрастную структуру как контрольную переменную. С возрастом преступников сложнее. Но в принципе, и такие данные можно добыть и посчитать.


Последняя мысль отражает типичное интуитивное предположение, которое как раз и не подтверждается данными. В этом ключевая находка авторов исходной статьи (Schacht, R., Tharp, D., & Smith, K.).

А можно очень просто про L1 и L2 регуляризацию? Или хорошую сслылку.

Да, Web Mercator удобна именно тем, что она отображает единообразно поверхность всей земли — и поэтому популярна в веб приложениях. Но для наших северных широт она слишком искажает площади, смещая фокус к неинтересным с точки зрения данных территориям Сибири.


Из учебника еще 1920-х годов (друг недавно прислал)

В некоторых статьях встречается


вот такая забавная, крайне утилитарная проекция

Параметры этой проекции я когда-то искал и не сумел сходу найти. Но слишком не зацикливался. Может быть Moskus или QuePaso знают?

Исходные данные почти всегда публикуют в проекции longlat. Это позволяет минимизировать искажения при последующих трансформациях.
Не накладывает ли leaflet ограничения на использование проекций отличных от longlat?

Нет, подождите минусить. Я серьезно спрашиваю. Это же одна строчка кода.


shape <- rgdal::spTransform(x = shape, CRSobj = CRS('+init=EPSG:3576'))

Есть рациональное объяснение выбору проекции?

Очень красиво выглядят веерные графики — плюс одно свидетельство с помощью визуализации.


Мне кажется, этот замечательный материал выглядит неполным без отсылки к источникам, которыми (рискну предположить) вы вдохновлялись.


Опубликованный 19 сентября график (на следующий день после выборов)

Источник (1.4МБ)


Ну еще можно почитать комментарии автора, Сергея Шпилькина.

Information

Rating
Does not participate
Location
Odense, Fyn, Дания
Date of birth
Registered
Activity