Обновить
9
Михаил Гричик@grichik

Руководитель направления

16
Подписчики
Отправить сообщение
Попробуйте проанализировать лог приложения spark. Информация о разбивке на стейджи и количеству байт там есть. Насчёт сбора количества строк и прочих метрик: стоит через metrics.properties подключить Gpahite. Например, по динамике использованной памяти и памяти на драйвер там есть метрики
[0-9]*.jvm.heap.used
Мониторинг логов Spark силами Spark SQL — просто демонстрация того, что такое вполне под силу Spark SQL.
2

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность