Обновить
1

Пользователь

Отправить сообщение

Паркет: потрогаем parquet файл руками (через Thrift и python)

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели5K

Анализируем структуру файлового формата parquet и читаем метаданные через thrift и python: индексы, страницы и их типы, кодировки (encodings). Статья является хорошим дополнением и иллюстрацией к документации формата parquet. С помощью кода из репозитория любой желающий сможет самостоятельно проанализировать метаданные файла в формате parquet на самом низком уровне.

Читать далее

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность