Комментарии 5
Да и сам пакет data.table хорошо оптимизирован. Без проблем позволяет ворочать гигабайтами данных в оперативной памяти.
Есть пакет fst
для быстрой сериализации данных.
Бенчмарки авторов этого пакета показывают, что fst
значительно быстрее feather
.
Но, вообще говоря, такое преимущество зависит от используемых данных, так как "магия" fst
основана на компрессии данных.
Я сам не люблю лишних зависимостей (библиотек, например), пытаюсь обходиться собственными силами, точнее — силами R и системы.
R распознает и сам умеет читать/писать csv и прочие txt в/из зипованных/-нные, например gz. БодрЕе в результате получается в большинстве случаев, не говоря уже о месте на диске.
R распознает и сам умеет читать/писать csv и прочие txt в/из зипованных/-нные, например gz. БодрЕе в результате получается в большинстве случаев, не говоря уже о месте на диске.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Быстрая загрузка данных из файлов в R