Pull to refresh
4K+
3
Иван Гончарук@Toshi_im

User

9
Rating
Send message

Зависимости, которых не существует: как фильтрация искажает данные и что такое коллайдеры

Level of difficultyEasy
Reading time7 min
Reach and readers5.2K

График, который вы видите очевидно показывает отрицательную зависимость между a и b, однако этой зависимости не существует. Да, зависимости между a и b нет, а видите вы коллайдер - одну из самых коварных ошибок статистики. Коварную потому, что прячется за здравый смысл. Мы делаем вполне разумные действия, а получаем связи между независимыми данными.

Разбираем на пальцах как появляются коллайдеры и как не попасть в их ловушку.

Читать далее

Information

Rating
838-th
Registered
Activity

Specialization

Бэкенд разработчик, Ученый по данным
C#
ASP.NET
Docker
Git
Python
Pandas
Математическая статистика
Jupyter Notebook
MatPlotLib
Математическое моделирование