Pull to refresh

Comments 42

как всегда, статистика ничего общего с действительностью не имеет
Какие конкретно кажутся вещи радикально неправильными?
вы верите данным в контакте?
возраст, семейное положение, место учебы, работы… я могу сейчас пробежаться по друзьям и с вашими графиками реальность и написанное точно не совпадет)
Конечно, есть некая доля чуши, но все-таки она ограничена.
Но однородным шумом считать это нельзя — все-таки, чем человек старше, тем больше доверия к его профилю. Тут вы правы.
чем человек старше, тем меньше он пишет данных в своем профиле)
мне так кажется
возраст тут не при чем. скорее другое. в возрастом времени не хватает на контакты с одноклассниками, потому и информации меньше, меняется реже. насчет правдивости: все же большинство указывают настоящие данные, особенно в возрасте от 19-20 лет… только совсем дети указывают ненастоящие данные (это и понятно, сами были такими в 12-15 лет:)).
а графики стоит сохранять в гифе или пнг, размытыми они тогда не будут
Последний график можно сделать понасыщенней? А то я только красную линию отличаю в легенде…
Ну условно получше сделал. Origin почему-то с какими-то проблемами выводит.
Спасибо автору: очень интересное и наглядное исследование.

Кстати, любопытно было бы сохранить данные и через год-два-три снова проанализировать. Можно было бы увидеть, связаны ли аномалии 30 лет с годом рождения (79-80) или именно с возрастом.

А 30 лет вообще такой возраст — переломный. Полжизни прожито и всё такое. Многие наконец совершают решительные действия вроде жениться\развестись.
занимался давно чем-то подобным.
график возрастов на 28 апреля 2008.

csv, к сожалению, не осталось.
Супер! А как парсили? Тоже вручную?
UFO just landed and posted this here
Просто вконтакте: при задании поиска по людям сверху выводится количество человек, удовлетворяющее критериям поиска.
Мне кажется, всё довольно правильно. Однако есть как боты, которым ставят какой-то статус массово, так и пользователи, ставящие неправильный статус (не отражающий их истинное положение), так и просто пустые статусы. (У меня всегда будет статус «не женат», ну, а убирать совсем статус не хочу, а то будет меньше народа знакомиться, к тому же статуса «гражданский брак» нет. :-) )
а поправка на количество людей в возрастной группе проводилась?

ведь если в группе от 20-и до 30-и есть всего пять людей и они все «в поиске», а в группе 10-20 лет есть 1000 людей, и из них лишь половина в поиске, то все-равно группа 10-20 выигрывает на 495 людей…
Указанные данные — доли людей в конкретной возрастной группе.
Или я неправильно понял?
Последний график очень интересный. Тут есть 3 точки соприкосновения. Если этот график правильный, и если его спроецировать на реальную жизнь, то выходит очень забавно:

1. С 12 лет начинают формироваться гармоны, и мальчики с девочками переходят с активную половую позицию, так как ищут себе партнёра (чтоб был.)
2. Ага, в 20 лет у нас тут институт/универ/академия. Ух весёлые похождения. Тут тоже неверное всё понятно. Как было сказано ещё на Баше, секс ещё не повод авторизовать тебя в аське, но повод добавить в статус есть друг.
3. Собственно 23 года. Пора прекращать половое безобразие, особенно, когда тебя в КВД уже по лицу узнают. Видимо надо жениться, а это понимает 13% пользователей.
4. Дальше всё туманно, как утро над Альбионом, но видно, что следующий «скачёчек» на замужество прошёл на 27 лет. Ну, оно и понятно, работа, засидки до позна вместе с симпатичной сотрудницей и просто «кажется уже пришло время».
5. Далее очень много шума. Ощущение такое, что в статус идёт отменная «липа».
6. О! Только сейчас заметил, где 55-60. Тут, относительно, всё понятно. Дети выросли, терпеть друг друга (это я про супругов) уже не надо и пора уже заканчивать этот сыр-бор. Так что те, кто не спят в разных комнатах, ищут друг другу замену.

P.S. Это то, что я смог прочитать из последнего графика, надеюсь, никого не обидел.
К сожалению, очень много липы в возрастной группе старше 50. Там в основном шутники, которые неправильно указывают возраст. С другой стороны, при указании левого возраста, все возраста равновероятны.
Интересно, я один вспомнил Гэри Сэлдона и его План?
Отчетливо помню этот прекрасный роман, но пр чем здесь Сэлдон? Невкурю %)
На чем основывалась сама теория, которую Сэлдон разрабатывал всю свою жизнь? на сборе статистики.
Психологи говорят, что «в 27-33 года человек переживает определенный кризис в жизни (возраст Христа не случаен). Меняется переживание времени — жизнь идет, а чего-то не хватает, у других все происходит, а у меня нет. С одной стороны люди активны, а с другой стороны — ощущение ловушки — того, что чего-то важного не происходит, все как-то однообразно. При не очень удачном выборе семьи, профессии — острота кризиса возрастает.»

Сам проходил через что-то подобное. Это хорошо объясняет аномальный всплеск на графиках.
Боюсь, что он слишком точечный. Если бы был пик от 28 до 32 — было бы похоже, а так…
Очень интересные графики! Но было бы любопытно оценить погрешность. Особенно это касается отношений, там погрешность может быть очень не маленькой. Если забыли формулы и лень искать, я могу помочь.
Спасибо! Погрешность действительно немаленькая, но я просто о ней не заморачивался.
Про погрешность: необходимо ведь учитывать как систематическую, так и случайную. Систематическая требует некой дополнительной гипотезы.
Большое спаибо! Сразу загорелась идея пойти дальше и распарсить вконтактик собрав более детальную базу. Ведь шикарные исселедования можно сделать)
Да-да! Я сам очень зажегся. Есть идеи, как можно распарсить, чтоб в ручную не делать?
Имхо, самое простое: все параметры поиска передаются в url'e, таким образом нас интересует только единственное число на получаемой странице — его то мы и берем. Но тут проблема — если нас интересует доля, то со знаменателем проблема — я уже не помню точно, да никто точно и не знает, о вроде порядка 23-30% аккаунтов или не настоящие или мертвые, тоесть в принципе выборка получается так нехило смещенной — вот с этим надо что то делать.
Ну а сложное — написать паука, который будет обрабатывать все доступные открыте данные о людях и собирать из в локальную базу, что уже вообще нелегально, да и опять же со смещенностью есть проблемы.
Спасибо за проделанную работу, было довольно интересно.

По поводу графика «Все сложно», то выбросы у юбиляров, возможно это возрастной кризис, и соответствующие им настроения проявляются на этих статусах. Например стукнуло человеку 40, он проснулся утром после пьянки, и думает «бл*!!! мне уже 5-ый десяток пошел», в депрессии поругался с женой, пошел и сменил статус вконтакте :)

Американские психологи уже давно выявляют такое понятие как кризис четвертака (т.е. 25 лет), наряду с кризисом среднего возраста, и прочего… вот и еще один всплеск.
отличный пост

Я проводил подобное исследование в части возрастов, даже чуть более подробное. Очень советую обратить внимание на ежемесячные отчеты TNS (могу выслать на почту). Там после магического возраста 30 лет наткнетесь на интересную особенность — по TNS ежемесячная активная аудитория превышает (и чем дальше, тем больше) общее число людей этого возраста, находимое через поиск. Что порождает разные интересные гипотезы
Спасибо! Вышлите, плз!

Не очень понял: аудитория старше 30 ходит, но не индексируется поиском?
неизвестно, т.к. проверить невозможно: 1) массово не указывают возраст (хотя можно именно указать для сайта, но людям не отображать); 2) врут с возрастом (гипотеза не подтвердилась, визуально наоборот молодежь скорее указывает старший возраст, плюс по мужчинам и женщинам различий нет, хотя не склонны не указывать должны были женщины); 3) врет TNS (сенсация! но с такой репутацией не должны...); и т.д.

Для них замеряют аудиторию рунета их панелисты, т.е. отслеживают активность компа, точно зная возраст и соцдем его владельца. Таким образом с поиском контакта они не связаны, но аномалия очень интересная, к тому же не единственнная (также активность аудитории с поиском вконтакте по юзерам онлайн расходится)
Панелей не так много на самом деле.
Что-то около 3-4х тысяч.
Как социолог, говорю вам браво!
Жалко только, что приходится делать все вручную. Может попросить администрацию сайта сделать статистику более открытой чисто для научных целей?
Мне кажется, что даже несмотря на большое количество ботов, вполне возможно, что данные получаются более валидными, чем при опросах, где сейчас просто бешеные мисинги…
Как человек прошлым летом преодолевший «магический» порог в 30 лет могу попытаться предположить откуда эти пики.
В 30 лет у многих происходит переосмысление жизни. Пока тебе 20 или 25 ты редко задумываешся о прожитых годах. Но вот исполняется 30 лет и как обухом по голове приходит осознание того, что половина жизни уже позади. И кажется быстро то все пролетело! Будто только еще вчера в школу ходил. В общем становится слегка грустно и страшно.
Я лично сильно изменился в 30 лет. Изменился внутренне, ну и внешне тоже «немного» — новое хобби, машина, работа.
Есть похожие примеры и среди друзей.
Sign up to leave a comment.

Articles