Как забавно, буквально пару месяцев назад поднимал кластер MongoDB и выгружал скриптами эти данные с целью посмотреть, что там и как. Но одному конечно с этим справиться было бы очень тяжело.
Насчёт вероятности шального попадания вряд ли. Он маленький же, плотность огня вряд ли бывает такая высокая, чтобы попасть по крошечному вертолёту. И потом при разведке он будет лететь выше линии огня.
Уже несколько лет (с выхода первого айпада) пользуюсь PlainText для записей (лекции и т.д.). Текстовый редактор, синхронизируемый с DropBox. Очень нравится минималистичный интерфейс.
Автор старался насколько это возможно ужать описание программы и работать со стандартными средствами Processing. Кроме того, гораздо приятнее сначала самому пощупать XML и понять, как оно работает, чем пользоваться чужим парсером (что не возбраняется для работы над реальными проектами, где важны скорость и удобство).
А 1 января, раз там значение в два раза больше от положенного поставить 300000/365, а не ноль. И с 1 апреля тоже так же сделать.
Нет. Это фальсификация сета данных, нельзя так делать. Можно исключить часть данных и оговорить это в комментарии к графику, но подделывать данные — ни в коем случае, иначе весь смысл анализа теряется.
Никогда не слышал про интегральный график — это как?
>> И по-моему стоило бы добавить к диаграмме еще одну, сдвинув все значения на 280 дней.
Делал, здесь не стал описывать: пришлось бы объяснять, как сдвинуть все значения на 280 дней — и так портянка получилась.
В статье написано, почему нас пришлось удалить данные по 1 января:
«Но что мы видим? Среди окружающих дней как-то особенно выделяется 1 января. Та же тенденция сохраняется на гораздо больших числах пользователей. Когда я собирал данные по 300 000 аккаунтов, 1 января точно так же сияло глубоким синим, а остальные цвета были бледными. Очевидно, такое явление связано с действиями пользователей, которые, не желая публиковать свой реальный день рождения, выбирают первое число в списке. Отделить действительно родившихся в Новый год от жалких симулянтов не представляется возможным.»
Если интересно, вот код:
github.com/roveo/zakupki
ftp://free:free@ftp.zakupki.gov.ru/Да, тенденция налицо, хотя гораздо интереснее смотреть по дням — найти «свой» день рождения.
Нет. Это фальсификация сета данных, нельзя так делать. Можно исключить часть данных и оговорить это в комментарии к графику, но подделывать данные — ни в коем случае, иначе весь смысл анализа теряется.
>> И по-моему стоило бы добавить к диаграмме еще одну, сдвинув все значения на 280 дней.
Делал, здесь не стал описывать: пришлось бы объяснять, как сдвинуть все значения на 280 дней — и так портянка получилась.
«Но что мы видим? Среди окружающих дней как-то особенно выделяется 1 января. Та же тенденция сохраняется на гораздо больших числах пользователей. Когда я собирал данные по 300 000 аккаунтов, 1 января точно так же сияло глубоким синим, а остальные цвета были бледными. Очевидно, такое явление связано с действиями пользователей, которые, не желая публиковать свой реальный день рождения, выбирают первое число в списке. Отделить действительно родившихся в Новый год от жалких симулянтов не представляется возможным.»