Многим известен так называемый «парадокс дружбы» (friendship paradox) в социальных сетях, впервые упомянутый в научной работе 1991 года, когда социальные сети были только в офлайне. Этот парадокс применим и к современным социальным сетям в интернете.
Если взять любого пользователя Facebook и случайным образом выбрать любого из его друзей, то с вероятностью 80% у друга будет больше «френдов». Люди, которые плохо знакомы с математической статистикой, очень огорчает тот факт, что почти все френды более «успешны» в общении, чем они сами. Но здесь нет причины для депрессии: так и должно быть, в соответствии с наукой и здравым смыслом.
Парадокс дружбы — одна из форм «парадокса инспекции» (Inspection Paradox), который встречается буквально повсюду и частенько вводит в заблуждение обывателей.
Суть парадокса дружбы в том, что пользователи с большим количеством френдов чаще попадают в статистическую выборку. Например, по данным Stanford Large Network Dataset Collection на выборке из 4000 человек у среднего пользователя Facebook — 42 друга, а у каждого из этих френдов, в среднем, 91 друг.
То же самое наблюдается в других областях исследования.
Например, парадокс размера класса. Предположим, что мы опрашиваем студентов, сколько человек учится у них в группе, а потом выводим среднее арифметическое из их ответов — и получаем 56 человек. Но администрация университета говорит, что среднее количество студентов в группе — 31. Как ни странно, никто не врёт, и оба значения справедливы. Просто во время опроса больше шансов попасть в выборку имеют студенты из больших групп, потому что их на самом деле больше. Если у нас две группы 10 и 100 человек, то 100 из 110 опрошенных назовут размер своей группы в 100 человек, и только 10 человек назовут размер группы 10. Средний размер группы, по такому опросу, составит 92 студента.
Казалось бы, банальная ошибка, но она является источников недопонимания во многих реальных ситуациях. Например, при анализе пассажиропотока в общественном транспорте. Профессор информатики Аллен Дауни (Allen Downey) для статьи в журнале Американского статистического общества приводит пример среднего промежутка времени между электропоездами Red Line в Бостоне. Он записал время прибытия 70 электричек между 17:00 и 18:00.
Минимальный интервал между поездами составил 3 минуты, максимальный — 15 минут. По фактическим данным средний промежуток между поездами составляет 7,8 минуты, то есть среднее время ожидания поезда должно быть около 3,9 минуты. Но опрос пассажиров показывает, что среднее время ожидания на самом деле составило 4,4 минуты, а интервал между поездами — 8,8 минуты, то есть на 15% больше.
Причина в том, что при большей задержке поезда в его ожидании скапливается больше пассажиров, а прибывшие с коротким интервалом поезда идут менее заполненными. Соответственно, большинство пассажиров жалуются на давку в вагоне и долгое время ожидания поезда, тогда как по данным компании среднее время и загруженность вагонов соответствует норме.
Такая же проблема с авиарейсами. Большинство пассажиров говорят о полных салонах самолётов, в то время как авиакомпании жалуются на потерю прибыли, потому что так много рейсов летят почти пустыми. И те, и те правы.
«Парадокс инспекции» наблюдается, например, в забегах на длинные дистанции или при поездках на автомобиле по трассе. В каждом из этих случаев участник движения обгоняет «слишком медленных», а его обгоняют «слишком быстрые». Создаётся субъективное впечатление, что все участники движения делятся на слишком медленных или слишком быстрых, а средних нет.
Последний пример Аллена Дауни родился после прочтения книги «Оранжевый — хит сезона», мемуаров Пайпер Керман (Piper Kerman), которая провела 13 месяцев в федеральной тюрьме. В одном из фрагментов книги она выражает удивление большой продолжительностью сроков, которые отбывают заключённые. Очевидно, девушка не знакома с законами математической статистики. А ведь в соответствии с парадоксом инспекции, если попасть в тюрьму в случайный момент времени и выбрать случайного заключённого, то с большой долей вероятности он приговорён к длительному сроку заключения. Это вовсе не свидетельство негуманной тюремной системы США, а простой вывод из парадокса инспекции.
По официальным данным U.S. Sentencing Commission, средний срок составляет 121 месяц, а «субъективный средний срок» при опросе заключённых — 183 месяца.
Даже при опросе окружающих заключённых в течение тринадцати месяцев, как показывает расчёт, полученный средний результат не сильно отличается от первоначального однократного опроса.
Более-менее объективную цифру можно получить при опросе в течение 600 и более месяцев.
Если взять любого пользователя Facebook и случайным образом выбрать любого из его друзей, то с вероятностью 80% у друга будет больше «френдов». Люди, которые плохо знакомы с математической статистикой, очень огорчает тот факт, что почти все френды более «успешны» в общении, чем они сами. Но здесь нет причины для депрессии: так и должно быть, в соответствии с наукой и здравым смыслом.
Парадокс дружбы — одна из форм «парадокса инспекции» (Inspection Paradox), который встречается буквально повсюду и частенько вводит в заблуждение обывателей.
Суть парадокса дружбы в том, что пользователи с большим количеством френдов чаще попадают в статистическую выборку. Например, по данным Stanford Large Network Dataset Collection на выборке из 4000 человек у среднего пользователя Facebook — 42 друга, а у каждого из этих френдов, в среднем, 91 друг.
То же самое наблюдается в других областях исследования.
Например, парадокс размера класса. Предположим, что мы опрашиваем студентов, сколько человек учится у них в группе, а потом выводим среднее арифметическое из их ответов — и получаем 56 человек. Но администрация университета говорит, что среднее количество студентов в группе — 31. Как ни странно, никто не врёт, и оба значения справедливы. Просто во время опроса больше шансов попасть в выборку имеют студенты из больших групп, потому что их на самом деле больше. Если у нас две группы 10 и 100 человек, то 100 из 110 опрошенных назовут размер своей группы в 100 человек, и только 10 человек назовут размер группы 10. Средний размер группы, по такому опросу, составит 92 студента.
Казалось бы, банальная ошибка, но она является источников недопонимания во многих реальных ситуациях. Например, при анализе пассажиропотока в общественном транспорте. Профессор информатики Аллен Дауни (Allen Downey) для статьи в журнале Американского статистического общества приводит пример среднего промежутка времени между электропоездами Red Line в Бостоне. Он записал время прибытия 70 электричек между 17:00 и 18:00.
Минимальный интервал между поездами составил 3 минуты, максимальный — 15 минут. По фактическим данным средний промежуток между поездами составляет 7,8 минуты, то есть среднее время ожидания поезда должно быть около 3,9 минуты. Но опрос пассажиров показывает, что среднее время ожидания на самом деле составило 4,4 минуты, а интервал между поездами — 8,8 минуты, то есть на 15% больше.
Причина в том, что при большей задержке поезда в его ожидании скапливается больше пассажиров, а прибывшие с коротким интервалом поезда идут менее заполненными. Соответственно, большинство пассажиров жалуются на давку в вагоне и долгое время ожидания поезда, тогда как по данным компании среднее время и загруженность вагонов соответствует норме.
Такая же проблема с авиарейсами. Большинство пассажиров говорят о полных салонах самолётов, в то время как авиакомпании жалуются на потерю прибыли, потому что так много рейсов летят почти пустыми. И те, и те правы.
«Парадокс инспекции» наблюдается, например, в забегах на длинные дистанции или при поездках на автомобиле по трассе. В каждом из этих случаев участник движения обгоняет «слишком медленных», а его обгоняют «слишком быстрые». Создаётся субъективное впечатление, что все участники движения делятся на слишком медленных или слишком быстрых, а средних нет.
Последний пример Аллена Дауни родился после прочтения книги «Оранжевый — хит сезона», мемуаров Пайпер Керман (Piper Kerman), которая провела 13 месяцев в федеральной тюрьме. В одном из фрагментов книги она выражает удивление большой продолжительностью сроков, которые отбывают заключённые. Очевидно, девушка не знакома с законами математической статистики. А ведь в соответствии с парадоксом инспекции, если попасть в тюрьму в случайный момент времени и выбрать случайного заключённого, то с большой долей вероятности он приговорён к длительному сроку заключения. Это вовсе не свидетельство негуманной тюремной системы США, а простой вывод из парадокса инспекции.
По официальным данным U.S. Sentencing Commission, средний срок составляет 121 месяц, а «субъективный средний срок» при опросе заключённых — 183 месяца.
Даже при опросе окружающих заключённых в течение тринадцати месяцев, как показывает расчёт, полученный средний результат не сильно отличается от первоначального однократного опроса.
Более-менее объективную цифру можно получить при опросе в течение 600 и более месяцев.