а какой должна быть аудитория для того, чтобы объем данных был достаточно большой, и не получить вот это: «К сожалению, объем данных, собранных о сайте хххххххххх, слишком мал и не позволяет сделать выводы о его посещаемости и структуре аудитории.»?
Вообще рассчет примерно такой – наша дневная аудитория на сегодня около 15к, или ~0.1% пользователей. То есть если ваш сайт посещает тысяча человек, мы фиксируем в среднем 1 человека в день, а это уже где то на грани погрешности.
У нас довольно шустро растет аудитория, думаю через месяц снизим планку до 500 уников.
как мне кажется картинкой пытались указать не на отсутствие скриншота хабра, а на проценты разделения по полу. Ну не верю я, что почти половина аудитории хабра — женщины.
Отмодерим анкеты и еще раз посмотрим :)
Решение проблемы на самом деле простое – автоматически определять тех, кто врет, и в общем то именно к этому мы сейчас и идем.
поясню, вдруг не поймете, как со скрином )) Проблема видимо в том, изначально ваши плагины ооочень неравномерно распределены по аудитории рунета. А не в том, что эта аудитория якобы шифруется под слабый пол
Проблема также может быть в том, что компьютер использует несколько человек в семье и это сбивает считалку с толку. Это как пример. Выясним. В любом случае, это не смертельно и поправимо. Мы бы больше удивились если бы таких фактов не было :)
Ваша версия как владельца ресурса кажется несколько странной, а ответ бросает тень на весь ресурс. «не смертельно» это как-то небрежно по отношению к данным, не считаете? Данные это же ваш хлеб и ваше богатство.
Вы будете удивлены узнав сколько людей опрашивают перед выборами например, чтобы узнать предпочтения страны.
Но понятно что на ресурсах как хабр, со специфической аудиторией, это более критично.
Не только с него. Есть договоренности с несколькими фриварными приложениями, которые работают со всеми браузерами. Плагин – пока только для IE, но это скоро вылечим.
фриварные приложения? То есть вы меряете аудиторию которая пользуется какими то приложениями и потом выдаете их как статистику по рунету? Пока не убедили
Обобщение — это такая неприятная особенность метода выборочной статистики.
Больше разнородных источников данных – более обоснованное обобщение.
Я бы не стал употреблять словосочетание «выдаем их как статистику по рунету», он несет некий отрицательный оттенок, скорее – мы показываем свое видение соцдема. Ровно так же, как это делают Алекса, Кванткаст и Ливинтернет, ТНС и другие.
да ладно вам. Я уже находил там сайты, рейтинг Алексы которых по миру выше, чем их рейтинг по рунету согласно системе автора. И это при том, что сайты русскоязычные :)
Остается пожелать только успеха в наборе базы. Пока все очень сыро и необъективно
А кто вам сказал, что наша технология подсчета рейтинга совпадает с Алексой?
Большую часть порносайтов и сайты эрзац-рекламных сетей мы пессимизируем. Точнее не пессимизируем, а считаем так, как их надо считать, а не так как их считает Алекса.
Насчет точности, вы как-то оптимистично смотрите на вопрос.
Для статистики давно уже придуманы характеристики метода, говорящие о его качестве — доверительная вероятность или доверительный интервал. Если вы даете информацию в формате «30% (+-3%)», это гораздо более ценно, чем просто «30%» с неизвестной ошибкой.
И доверия к данным сразу больше.
«Сайт www.boomburum.ru не найден в нашей базе данных. Это могло произойти по двум причинам:
— Популярность сайта недостаточна, и респонденты Нетчарт посещают его реже, чем один раз в день. В этом случае сайт может появиться в нашей базе позже, так как количество респондентов Нетчарт постоянно увеличивается.
— Вы неправильно ввели доменное имя сайта www.boomburum.ru. Если это так, введите правильное доменное имя и повторите поиск.»
Спасибо. Очень неприятная штука, что при вбивании в главную форму произвольного url и нажатия enter, url автоматически заменяется на какой-то, который предлагает сам сайт.
Читайте при установке бесплатных программ внимательно, что вы ставится дополнительно к ней, если, конечно создатели этих программ вам право выбора компонентов установки дали )
А можете объяснить, что такое «индекс»? Я как статистик въехать не могу. И в скобочках у процентов очень стоит писать дисперсию или стандартное отклонение. Ведь не сложно рассчитывается.
Что-то для OGL.ru 40% женщин это слишком много. А с Kanobu так вообще жесть по посещаемости. (с учетом того что 20% аудитории Kanobu, внезапно работают в безопасности, так вообще жить страшно)
добавьте в сводную статистику распределение по типу подключения к интернету.
Ну и то, что отсутствие распределение по географии, тоже довольно странно.
Плагин только для IE. Рассмешили. Помоему точность такого метода плюс минус пальцем в небо. MS последовательно блокирует бреши и саму технологию ActiveX и BHO потому сейчас значительное количество пользователей не ставят себе плагинов, увидев несколько раз полоску з предупреждением их кондрашка хватает, а из более квалифицированных пользователей на IE сидят немногие. А теперь учтём увеличающийся процент Firefox, незначительній но обычно денежный процент Safari, а также что Opera по последним даным на територии екс-СССР достаточно популярна, то точность вашей выборки стремится к безконечно малой величине.
Счётчики на сайте может и хуже вручную заполненных данных, но вот я не пойму какой взрослый человек в здравом уме будет заполнять личные данные и ставить ваш плагин если его полезность для него ничтожно мала.
Видео и последние новости на любом большом портале, и интересуют разве ваших студенток первых курсов. Добавленная ценность должна быть достаточной чтобы даже какой-то мэнэджер превозмог лень и заполнил анкету.
Как по мне вы двигаетесь в не том направлении. Я понимаю желание отхватить кусок тех кому панели вроде TNS не по карману, но эти динозвары эпохи телевидения в интернете по моему дают недостаточно релевантную статистику. Сейчас в сегменте детализированой аналитики могут рулить только ресурсы с большой и лояльной пользовательской базой вроде Google, mail.ru, vkontakte, одноглазики ну и Yandex если сможет подсадить на свои персонализированные сервисы много людей. А ваша статистика с одним и даже 10 заходами в день абсолютно нерелевантна.
Хотя дерзайте, возможно я неправ и вам удастся пробить стену лбом.
Ну и напоследок пиарится на техногиковском сайте и иметь плагин только для всеми нелюбимого Ослика 0_o Shame of you, как по мне но сообразить панельку под firefox легче чем обойти Сцилу и Харибду IE ActiveX.
Мне кажется даже если протестировать сайт транзисторномоторных технологий, то всё равно статистика покажет, что девушек на этом сайте свыше 40% — если не все 80%
Нет, просто если в первом варианте ответа написано
18 и младше, то логично что второй должен быть 19-24, а не 18-24.
Не понятно тогда к какой категории относится если мне скажем 18 лет.
Ребята, вы конечно извините, но то, что выдает ваша статистика по проектам, к разнообразной статистике которых у меня есть доступ, говорит о том, что ваши данные можно сравнить с выражением «взято из головы». Я хотел сравнить уровень вашей погрешности, но потом понял, что это не погрешность, это вообще какие-то понятные только вам алгоритмы подсчета.
Ни один из показателей, даже категории сайта, не отображает даже близких значений.
Надеюсь, что это связано со стартом, но на данный момент вашими данными пользоваться нельзя совершенно.
Данные вашего сайта противоречат данным mp.openstat.ru/. Я сравнивал сайты с посещаемостью ~3000+ уников в сутки.
Про внутреннюю статистику вообще молчу.
Мне тут подумалось, что если не будет возможности убрать ресурс из участия в этом проекте, то будет создана ситуация, при которой можно будет подать в суд за распространение ложной информации, порочащей репутацию ресурсов.
Это не конструктивно. Перед нами же не стоит цели публиковать недостоверные данные, чтобы кого-то там опорочить, мы ежедневно работаем над улучшением статистики. Что есть какие то неприятные артефакты – это временные издержки процесса.
Более правильно написать какие по вашему мнению данные считаются неправильно, чтобы мы разобрались и подкрутили считалку.
А сайты удалить мы в принципе можем — ответил выше.
Извините, но у меня нет желания и времени заниматься оптимизацией вашего проекта, даже при самых добрых побуждениях. Конструктивность данного вопроса в том, что вы уже запустили проект. Вы не указали, что это бета, не указали, что информация может содержать погрешность в сравнении с… или без сравнения. По факту — вы опубликовали ложные данные о ДРУГИХ проектах. Если бы информация касалась только вас — ваше право как распоряжаться информацией, но в данном случае вы предоставляете не просто ошибочную, а ложную информацию.
Для информации, я проконсультировался с нашими юристами, они подтвердили, что подтвердить ложность ваших данных в суде не составит никакого труда, т.к. мы можем предоставить не только серверную статистику, но и статистику и отчеты 2 независимых систем.
Однако надеюсь, что ваш проект вырастет из того, что он представляет собой сейчас и станет реальным инструментом в работе. А пока извините, без нас.
Судя по тому, что седьмым по популярности сайтом Рунета вы считаете Letitbit.net, я догадываюсь, откуда у вас 15 тысяч панелистов.
Рискну предположить, что вы и есть создатели этой адвари, что при закачке с Летитбита насильно впаривается. Решили несколько диверсифицировать свой бизнес? И то верно, 15 тысяч носителей заразы — ценный ресурс.
В общем, Letitbit.net на седьмом месте и прямо, и косвенно говорит, что доверять вашей статистике нельзя.
Посмотрел дальше по рейтингу: сплошные файло- и сайтопомойки. Тут тебе и Depositfiles, тут тебе и Ucoz. В объективность такого рейтинга я не верю, у вас очень смещенная панель. Смещенная в сторону доверчивых лохов, лазящих по сомнительным сайтам и ставящим себе все подряд.
Вам нужны незагаженные каналы распространения для выправления панели, пополнения ее опытными пользователями. Пиар на Хабре — шаг в правильном направлении :)
«дает возможность бесплатно посмотреть детальный портрет аудитории любого ресурса в рунете, просто введя его URL»
не надо врать, далеко не любого
написали бы честно: «любого посещаемого»
представляю, сколько хабраюзеров ввело свои URL и получило в ответ фигу с маслом
Хм, интересный проект… пробил несколько ресурсов на которых задействован и узнал пару новых подробностей о них. Хотя, в большинстве случаев, по парочке (LL, mail) можно составить картину не хуже… но опять таки, тут все и сразу. Молодцы!
На моём проекте ~3000 уников ежедневно. Статистики всё равно нет. Конечно русскоязычная Алекса была бы на некоторое время интересна, но коль уж она в данный момент не работает…
ввожу имя сайта, жму ентер и он меняет одно имя, на совершенно другое!!!
из 5 введёных сайтов три не смог совсем определить, два определил не корректно
Поправьте «Лицензионное соглашение». Первая же ошибка в начале: «Настоящее Лицензионное соглашение (далее именуемое «Лицензия») заключаетсямежду пользо...» (нет пробела между «заключается» и «между»). И сделайте его вычитку, а то портит впечатление.
Да, а еще портит впечатление, что у нас на популярных ресурсах аудитория — «Мужчины от 25 до 34 лет со средним образованием, состоящие в браке и не имеющие детей». Я может быть и не прав, но разве мужчина в 25-34 без высшего образования может так часто и много пользоваться Интернетом? Если у нас в стране до сих пор половина пользователей выходит в Интернет из офиса? (Что печально :()
В среднем пользователь проводит на нем 85 мин. 3 сек.
Что там делать 85 минут?))))
Как только прочитал — первая мысль была — поставить панельку в фаерфокс на работе, мелочи подзаработать.
Оказывается вы и панельку бесплатно предлагаете поставить (и мне даже платить не придётся!!) и только под ослик…
Такой системой мотивации вы и правда очень сильно сужаете аудиторию панелистов. Не удивительно, что в «характерном посетителе» самых посещаемых сайтов люди с высшим образованием нашлись только во втором десятке сайтов. Так что выборка очень некачественная. Делайте плагины под большинство браузеров, мотивируйте рублём, монитизируйтесь и тогда будет отдача.
Это наш тестировщик :)
«Система мотивации» – вопрос второй. Сейчас мы обкатываем логику системы и результаты, подключить новые приложения или мотивировать деньгами – проще.
так если проще — может быть и реализовать это, а потом уже подтягивать остальное — у вас-то какое количество информации для обработки появится сразу?
А насчёт тестировщика — это, получается, всего один человек так сильно влияет на результаты статистики? Что-то слышно было про 10000 человек панелистов. Думаю значительная часть из них должна заходить на сайт. Значит влияние 1 человека должно быть не таким сильным. Даже за гранью погрешности.
ваще не верю исследования с аппаратным отслеживанием действий какой-то выборки,
потомцу что не знаю, кто себе эти панели ставит и с какой корыстной целью…
из-за таких дебилов телек превратился в зомобоящик
Идея хорошая, но в реальность и адекватности данных я очень сильно сомневаюсь. Если вы хотябы приблизительно описали процедуру формирования портрета аудитории. Пока все напоминает тыканье пальцем в небо.
Для реального использования пока Google Analytics гораздо удобнее и эффективнее. Посещаемость сайта можно отслеживать постоянно.
Site-centric счетчики удобны, если вы являетесь владельцем сайта и у вас есть доступ к его статистике. У нас несколько иная глобальная задача – быстро дать представление о сайте тогда, когда вы им не владеете.
Починили генерацию файла с ключом, ну теперь можно и добавить сайт.
А далее поглядим на этот сервис — как он будет улучшаться и показывать правильные данные, ведь точность в данном случае = хлеб проекта.
Отличный сервис, большое спасибо. Извините, может уже спрашивали и пропустил где-то в комментах. Вопрос: — Откуда вы берете такую информацию, например: я знаю аудиторию своего сайта, но по графику получается, что 25% людей из сферы «Строительство и недвижимость», а другая «Бухгалтерия». Откуда такая информация, просто чтобы понимать.
Это данные, которые вбивают панелисты при установке софта.
Демография считается по уникальным посетителям, посетившим сайт за последний месяц и сделавшим на сайте более одного хита. То есть если человек указал «Промышленность и производство», и случайно один раз зашел на ваш сайт, при подсчете соцдема он учитываться не будет. Далее, если он ежедневно ходил на сайт в течении месяца и сгенерил 90% хитов, мы все равно учтем его лишь один раз.
заполнять анкеты и участвовать в подобных исследованиях склонны люди определенного психотипа, поэтому любое исследование с анкетами (если конечно их не заставлять заполнять силой) будет искаженным. Некоторые компании предлагают деньги за заполнение анкеты и установку плагина, но это тоже не выход, потому что согласятся только люди с малым и средним заработком. Топ-менеджеры — самая желанная аудитория для большинства сайтов — не будут участвовать в панельных исследованиях.
А сколько людей склонны преувеличивать свой доход и преуменьшать свой возраст при любой возможности. Не потребуешь ведь документы…
Не верю я панельным исследованиям, сорри.
а) У меня сайт отдаёт 304 Not Modified, на что оно мне при подтверждении говорит «К сожалению по указанному адресу не обнаружено файла с правильным ключем». Плохо искали.
б) зачем требовать вводить город, адрес, страну, телефон и так далее? Будет куча подтвержденных сайтов с левыми данными, лишь бы сохранилось.
Раздел «Графики», «посещения» -> «абсолютная величина». Это конечно прикольно, писать числа в форме 4.01e+3, но много ли кто поймёт, что с такими цифрами делать? :)
Ребят, как-то помоему надо было систему-то допилить, а потом говорить, а то че-то вначале не генерился файл с ключем, но после заработало. Закинул в корень файл, сохраняю, но мне все равно говорят, что файл не обнаружен…
ещё из забавного — сайт определился как со 100% мужской аудиторией. Яндекс.Метрика, тематика поисковых запросов и здравый смысл говорят обратное, для сайта «общих тематик».
1. Размер панели растет изо дня в день на 1к пользователей.
2. Сейчас 15000 – это ежедневно. Суммарный размер панели порядка 50к пользователей.
3. Если вы сравниваете с панелью того же комкона, который объявляет 60к пользователей, то нужно понимать две вещи.
i. При размере панели в 60к по прикидкам они имеют порядка 18-20к онлайн пользователей в день. Не берусь утверждать, но по впечатлениям где-то так.
ii. Пользователи, помеченные куками и пользователи софтовой панели – это разные весовые категории, просто потому что последние фиксируются вообще на всех сайтах и генерят на порядок больше статистики.
Кстати, знаете сколько человек участвуют в экзит-пулах на выборах? Вы сильно удивитесь :)
Екзит-пулы дают хорошую статистику даже при малок кол-ве респондентов. Все дело в том, что кандидатов на выборах, к примеру, 20 (обычно и меньше), а респондентов — неслоко тысяч. А теперь подумаем… Сайтов в рунете даже страшно подумать сколько, а респондентов — всего 15 тыс.
Были бы авторитетными данные экзитпулов, где кандидатов 20, а респондентов — 2-3 человека? Я дума, нет. В вашем случае все то же самое.
А понимаю, что пользователей Alexa.com тоже меньше, чем сайтов в Интернете, но их (пользователей Алексы) все же очень много и поэтому этот сервис хоть дает и не 100% правильный результат, но все же авторитетен.
Чтобы не писать одно и то же – напишу здесь.
В первую очередь спасибо всем за указания на ошибки и обоснованную критику.
Всю мелочь, вроде автокомплита, доменов с www, научной нотации чисел и так далее вчера пофиксили.
По соцдему сейчас ведем ресерч, уже сегодня скорее всего будут более точные результаты.
Аддоны под другие клиенты, медиапланнер в чуть более далекой перспективе, но тоже скоро будут.
Кто ходит на ваш сайт?