Продолжаем выводить ваши знания о PySpark на новый уровень :) В этот раз расскажем, что такое план запроса, как его смотреть, и что делать, чтобы уточнить узкие места в расчётах.
Data Science Team Lead, Avito
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив
Тимлид команды аналитики и DS в Авито Александр Ледовский рассказал, как быть, когда нужно посчитать что-то на pySpark, чтобы потом выгрузить.
PySpark для аналитика. Как правильно просить ресурсы и как понять, сколько нужно брать
Александр Ледовский, тимлид команды аналитики и DS в Авито, рассказал про опыт работы с Apache Spark и о том, как правильно задавать параметры Spark-сессии, чтобы получить ресурсы.
Мои принципы в менеджменте ИТ-команд
Уже более 5 лет я занимаю руководящие позиции в области анализа данных. От синьора DS с двумя подчиненными до лида трех команд аналитиков и инженеров в Малом бизнесе Сбера. За это время я сформировал приципы, которые помогают мне в управлении творческими специалистами.
Не претендую на истину, да и не всему всегда получается следовать. Принципы не отражают всех задач менеджера, а относятся к конкретным вопросам. Делюсь с вами своим опытом, буду рад услышать ваше мнение.
Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться
Статистические тесты в R. Часть 3: Тесты количественных данных
Часть 1: Бинарная классифиация
Часть 2: Анализ качественных данных
Поехали!
Статистические тесты в R. Часть 2: Тесты качественных данных
В данной и следующей статье я показываю как выбрать для обработки качественных и количественных данных правильные тесты и реализовать их в R. Данные методы позволяют получить реальное представление об объекте, процессе или явлении по какому-либо параметру, т.е. позволяют сказать «хорошо» или «плохо». Они не потребуют глубоких знаний программирования и статистики, и пригодятся людям различного рода деятельности.
Заинтересовались? Добро пожаловать под кат!
Статистические тесты в R. Часть 1: Бинарная классификация
Многим из нас приходится сталкиваться с различными данными на работе и в повседневной жизни. Качественно и правильно их обработать и проанализировать не так сложно. В этой серии статей я покажу применения некоторых статистических тестов.
Заинтересовались? Добро пожаловать под кат.
Информация
- В рейтинге
- Не участвует
- Зарегистрирован
- Активность