Я работаю в БигКвири — статья хорошая, вот только мне не совсем понятно вот это:
Избегайте в таблицах полей с типами данных record, array (repeated record).
Запросы, в которых присутствуют данные столбцы, будут потреблять больше трафика, т. к. BigQuery придётся обработать все данные этого столбца.
БигКвири — columnar storage. Даже поля рекордов хранятся по отдельности, поэтому вычитывая одно поле из рекорда вы заплатите только за это поле. Это верно и для repeated records. Платить придется только за то leaf level поле, которое вы читаете. Даже если это поле находится внутри repeated of repeated record. Бигквири умеет вычитывать только это конкретное поле
Я работаю в БигКвири — статья хорошая, вот только мне не совсем понятно вот это:
Избегайте в таблицах полей с типами данных record, array (repeated record).
Запросы, в которых присутствуют данные столбцы, будут потреблять больше трафика, т. к. BigQuery придётся обработать все данные этого столбца.
БигКвири — columnar storage. Даже поля рекордов хранятся по отдельности, поэтому вычитывая одно поле из рекорда вы заплатите только за это поле. Это верно и для repeated records. Платить придется только за то leaf level поле, которое вы читаете. Даже если это поле находится внутри repeated of repeated record. Бигквири умеет вычитывать только это конкретное поле