Comments 6
Условие (df['z_score'] > -3) & (df['z_score'] < 3)
можно более просто и красиво записать как df['z_score'].abs() < 3
На мой взгляд, ещё критичным вопросом начинающему аналитику должен быть "Отличия корреляции от причинно-следственной связи". Чтобы он потом не только красивые цифры и графики выводил, а и действительно правильные выводы из них делал
Ну это вообще непростой вопрос. И не всегда имеется достаточно данных, чтобы этот вопрос решить на практике.
На мой взгляд, ещё критичным вопросом начинающему аналитику должен быть "Отличия корреляции от причинно-следственной связи".
Вы ещё скажите, что аналитик должен задаваться вопросом о том, имеет ли полученный им результат хоть какой-либо физический смысл.
А может Вы ещё захотите, чтобы "оператор скармливания данных скрипту на Питоне" задавался вопросом о том, имеют ли обрабатываемые данные метрологическую совместимость?
В статье рассмотрим кратко три темы по статистике, которые часто задают на собеседованиях.
"часто задают" хорошо смотрится в контексте разговоров о статистике.
Про что могут спросить аналитика данных о статистике на интервью: 3 темы