Как стать автором
Обновить

Комментарии 62

Свечки по-моему не репрезентативны, тем более с группировкой по годам. Гистограмма со смещением или график отношения к первому году выглядели бы более внятно.
Я-то было подумал тут про РФ. Свечки были бы мягко говорят другими, я полагаю.
«Свечки» в наших ареалах плавно превращаются в остроконечный скипетр, при этом конец скипетра пробивает не только небеса, но и вселенную…
В России индикаторы социального неравенства ниже, чем США, но несильно. Так что статистически причин увидеть другие «свечки» нет.
В статье есть ссылка на подборку статистики, можете ознакомиться.
Не все же доходы попадают в статистику. Особенно, в России.
Я вам — подробную статистику, а вы мне — голословные суждения. Нехорошо. Могли бы хоть википедией прикрыться.

Если вкратце — есть способы засунуть «не все» доходы в статистику.
Только вот эти способы смазывают всю картину или делают всю статистику нерепрезентативной. А часто подобное еще и «подкручивают», по разным причинам, до желаемых или просто неверных результатов. Как проводятся соцопросы случайных людей и фокус-групп знаю. Как и методы с предсказанием по особым группам. Единственная статистика, которой можно более-менее верить в этом — это как раз что-то вроде данных по которым вы сделали это исследование. Остальное — цифры чуть ли не с потолка или рассчеты по сомнительным методам, без научного подтверждения верности методов, нерепрезентативные выборки и т.д. Да даже о двойном слепом методе часто и не вспоминают.
Да даже если и попадают… Зарплата моей жены= МРОТ (бюджетник), а средняя з/п в регионе по данным статистики в 3-5 раз выше. Что же получается- в регионе очень мало работников бюджетной сферы? Или просто у кого-то (скажем, главврача местной больницы) доход на порядок выше?
Потому и есть смысл всегда указывать еще и медиану.
Кстати интересно, какой процент работающего населения занят в бюджетной сфере? На вскидку кажется должно быть около 15%
В статье описано и показано на картинках, почему так бывает. Попробуйте перечитать еще раз.
А вы думаете, что статистика неравенства доходов госслужащих совпадает с такой статистикой для населения в целом?
Неравенство для населения в целом будет существенно больше.

Например, для муниципальных служащих индекс Джини у меня получился 18.9 (что неправдоподобно мало), в то время, как по США в целом он 45.0 (что много и свидетельствует о социальных проблемах).
Вот именно. Так что та ссылка, которую вы привели, не даёт оснований утверждать, что

статистически причин увидеть другие «свечки» нет


Если даже для США в целом такие причины есть!

Тем более даже не уточнив, например, идёт ли речь о всей РФ или о бюджетниках какого-нибудь аналогичного по статусу города.
Однако, это всего лишь один сектор экономики и только в одном весьма нетипичном городе.

Ну вот как-то да…
На основе данных (например) Росстата было бы что-то более актуальное и интересное, наверное.
В любом случае, спасибо за статью.

Как видим, действительно, средняя зарплата выше медианной, но отнюдь не существенно.

Я так понимаю ящик с усами построен с отсечением выбросов сверху? То есть в расчете средней и медианы выбросы не принимали участия?
Среднее точно считалось по всем данным.
Насчет медианы вы сподвигли меня на сомнения. В документации сказано, что «усы» точно отбрасывают выбросы, но медиана должна их учитывать. Спасибо за замечание, вечером уточню.
«усы» точно отбрасывают учитывают выбросы


Мм?
Опечатался, поправил.
Благодарю. Прекрасный короткий обзор, который может дальше использован как пример для подобного анализа для других стран и групп.
Кстати, Норвегия, наверно единственная страна в мире, где данные доходов, налогов и капиталов каждого человека доступны публично (с некоторыми ограничениями) для всех.
Вот например норвежский топ 100 богатых по доходам/налогам/капиталу по областям/районам
www.dn.no/skattelister/#!/Norge/2014/
О, спасибо за наводку!

И за комплимент. =)
Статья классная! А уж если бы кто проанализировал данные по Норвегии, это было бы вообще очень ценно для понимания реальности.
Только один вопрос — почему Вы называете это Data Science?
Вспомним известную цитату.

Потому что Data Science, как и Big Data — это как секс в разговорах подростков.
Все это обсуждают, но никто не знает, что это такое на самом деле.
Я лишь прикрываюсь этим брендом, чтобы оправдать бездарно потраченное время.
Сарказм засчитан :)
«На верхнем рисунке вы видите попытку подогнать распределение зарплат к нормальному». Судя по диаграмме, это скорее распределение Релея, хотя возможно это случайность.
Сплошная черная линия — это плотность вероятности нормального распределения, подогнанная (fitted) к реальному распределению. Это самый простой способ визуально отобразить матожидание.

Как лучше параметризовать функцию реального распределения — вопрос более сложный, и он явно выходит за рамки статьи.
По тексту до хабраката не понятно, что речь идет не о России. Нехорошо.
НЛО прилетело и опубликовало эту надпись здесь
Смешанное чувство, когда твоя зарплата находится в зоне статистической погрешности… Снизу…
Социальное неравенство это проблема? Мэр города должен получать столько же, сколько уборщица? На мой взгляд госслужащим наоборот недоплачивают, потому что не должен мэр получат меньше руководителя самой крупной корпорации в том же городе. А так сколько платим — такую власть и имеем, что туда только воровать с такой зарплатой идут, что у нас, что в США.
НЛО прилетело и опубликовало эту надпись здесь
Как в США-то воровать, посодют же.
Роковая ошибка в вашей логике, что руководитель всегда работает на владельца.
У компании владелец — это конкретный человек или группа. У города — население этого города.
Бедные, бедные депутаты с зарплатой 400 т.р. (+ премии и овер 9000 льгот). На такую зарплату у нас можно только выживать, но не жить.
Подавляющие число людей, способных к административной борьбе (при этом могут слабыми работниками в целом), часто ненасытны в деньгах или власти, и не менее часто добиваются и того и другого не чистыми методами. Вывод, высокие зарплаты не гарантируют вообще ничего, кроме высокого ФОТ и потенциально, ещё большего воровства.
Карьеру интересно изучать в разрезе распределения по отдельным профессиям
у архитекторов, юристов и врачей видно «2-е дыхание»,
тоже неплохо инженерам, пожарным, полицейским и мэрам)
image

Хорошая профессия — Animal.
я сначала подумал, что это всякие собаки на службе, питомцы зоопарка и т.п., но потом увидел

код R
query = «select Id,
case when jobtitle like '%fire%' then 'Fire'
when jobtitle like '%police%' then 'Police'
when jobtitle like '%sherif%' then 'Police'
when jobtitle like '%probation%' then 'Police'
when jobtitle like '%Sergeant%' then 'Police'


when jobtitle like '%MTA%' then 'Transit'
when jobtitle like '%transit%' then 'Transit'
when jobtitle like '%anesth%' then 'Medical'
when jobtitle like '%medical%' then 'Medical'
when jobtitle like '%nurs%' then 'Medical'
when jobtitle like '%health%' then 'Medical'
when jobtitle like '%physician%' then 'Medical'
when jobtitle like '%Orthopedic%' then 'Medical'

when jobtitle like '%health%' then 'Medical'
when jobtitle like '%pharm%' then 'Medical'
when jobtitle like '%airport%' then 'Airport'
when jobtitle like '%animal%' then 'Animal'
when jobtitle like '%architect%' then 'Architectural'
when jobtitle like '%court%' then 'Court'
when jobtitle like '%legal%' then 'Court'

when jobtitle like '%MAYOR%' then 'Mayor'
when jobtitle like '%librar%' then 'Library'

when jobtitle like '%parking%' then 'Parking'

when jobtitle like '%Public Works%' then 'Public Works'
when jobtitle like '%Attorney%' then 'Attorney'
when jobtitle like '%MECHANIC%' then 'Automotive'
when jobtitle like '%automotive%' then 'Automotive'
when jobtitle like '%custodian%' then 'Custodian'
when jobtitle like '%engineer%' then 'Engineering'
when jobtitle like '%engr%' then 'Engineering'
when jobtitle like '%account%' then 'Accounting'
when jobtitle like '%Gardener%' then 'Gardening'
when jobtitle like '%General Laborer%' then 'General Laborer'
when jobtitle like '%food serv%' then 'Food Service'
when jobtitle like '%clerk%' then 'Clerk'
when jobtitle like '%porter%' then 'Porter'
else null
end as JobType
from Salaries»
Кажется, код не опровергает вашу версию.

Есть служба "Animal control" — это всякие собаколовы и т.п. Типа отлавливать шарящихся по мусоркам енотов, выдворять из города медведей и т.п.


Кстати, один местный рассказывал такую хохму — делал очень реалистичный маскот-костюм льва, надел его испытать, разлёгся у себя на заднем дворе — а соседи через забор увидели, и вызвали этот самый Animal Control — "У соседа во дворе ЛЕВ!!!"

Это логично. В низкоквалифицированном труде расти некуда. Если ты грузчик, то ты будешь таскать ящики. Делать это более профессионально фактически невозможно. Все тонкости труда познаются за неделю в худшем случае.
А в России можно посчитать что либо подобное — а то чем интереснее по той или стране данные тем тщательнее их берегут от любопытных.
Вспомнилась Tropico)
Не играл… Стоит?
Экономический градостроительный симулятор-RTS.
Мне игра понравилась юмором (крайне удачно локализована на русский) и колоритом бананового островного квазигосудартсва на Карибах.
На вкус и цвет, как говорится, но мне доставила весьма, особенно 3-4 части, несмотря что я набрёл на неe только в прошлом году.
А почему вы подгоняли под нормальный закон? Видно же, что нужно что-то другое посмотреть. Тот же хи-квадрат, весьма похоже описывает данные — резкий рост в начале и постепенное снижение в дальнейшем.
Доходы населения моделируют распределением Парето обычно
По-моему логнормальное тоже иногда используют…
верно, главное exp
Как написано в тексте, я пытался максимально наглядно показать на выборке среднее значение.

Задачи параметризовать выборку каким-либо распределением не стояло.
медианная зарплата несильно отличается от средней

в муниципальной сфере в СФ. Все таки это гос учреждение, публичные люди и все такое. Имхо именно в этой выборке медиана и должна была быть максимально приближена к средней. А вот в реальной (конкурентной среде частного бизнеса), это были бы другие цифры.
Да, в рассматриваемой выборке получилась неправдоподобная уравниловка. В реальности все немного по-другому.
В википедии есть интересующие вас цифры со ссылкой на данные Росстата.
nmnmnmmnmnm
Прошу прощенья, это был случайный коммент
Интересно почитать, спасибо. Если интересует тема доходов, то US Census Bureau в своем ACS дает данные по доходам населения, но правда на основе опросов, то есть люди могут занижать.
Кроме того можно сравнить средние месячные зп за 2012-2014 (до волнений) в месяц по оф. статистике:
в Норвегии — 3313$, Росии — 377$, Украине — 116$ и Индии —
Статья не про сравнение. Кроме того, она про очень частный случай. Получившиеся результаты некорректно сравнивать с общей статистикой.
Это очевидно, однако мы живем в мире, в социуме, и все-таки резонно посмотреть не только вертикально, но и горизонтально, тем более в комментариях.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации