Спасибо за статью.
Можно еще добавить, что разных пакетах есть ещё свои костылики для работы с датой\временем.
Например в data.table есть классы IDate/ITime и функции с ними связанные; и хочется верить, что при обработке данных в таблицах это ускоряет работу с датами\временем, аж шуба заворачивается ;)
в прошедших и предстоящем кризисах большую роль играли не только валюты, а деривативы, облигации и прочий пузырный шлак, который утянул всех на дно…
Надо их ещё замешать. И золото может добавить…
Хорошо.
Заметил я только ещё, что в Windows\Linux скорости обработки в параллельных потоках отличаются заметно. Методы запуска потоков разные.
К примеру на одном и том же моем компе на 40 потоках R под Win10 скорость обработки в data.table — 6K строк/сек., а тот же код на этой же машине, но из-под WSL(Debian) — уже 12,6K строк/сек!
Ну и чтоб два раза не ходить, можно про обмен данными между процессами раскрыть. Маленькую главку. Хотя-бы бы на svSocket. Оч. прикольный пакет, всем рекомендую.
Можно еще добавить, что разных пакетах есть ещё свои костылики для работы с датой\временем.
Например в data.table есть классы IDate/ITime и функции с ними связанные; и хочется верить, что при обработке данных в таблицах это ускоряет работу с датами\временем, аж шуба заворачивается ;)
Надо их ещё замешать. И золото может добавить…
точно 16?
Заметил я только ещё, что в Windows\Linux скорости обработки в параллельных потоках отличаются заметно. Методы запуска потоков разные.
К примеру на одном и том же моем компе на 40 потоках R под Win10 скорость обработки в data.table — 6K строк/сек., а тот же код на этой же машине, но из-под WSL(Debian) — уже 12,6K строк/сек!
С ними гораздо гибче стало жить и код приятнее выглядит.