Не соглашусь, те, кто отправляли, пользовались сервисом Мегафона, мы не называем их абонентами. Полное название курсовой работы могло бы быть: «Анализ текстов SMS группы пользователей сервиса отправки сообщений ЗАО «Мегафон», опубликованных поисковым сервисом ООО «Яндекс» 18.07.2011 за период с 07.07.2011 по 18.07.2011».
Согласен, про репрезентативность не то написал. Имел в виду, что ошибка выборки на таком объеме будет очень большая. А репрезентативность отсутствует из-за того, что не знаем методику выборки, все верно.
Еще фактор — форма отправки через интернет, коротких односложных сообщений там скорее всего нет или крайне мало.
Исследуется не Мегафон и не Яндекс, исследуются тексты данной группы пользователей. Как на основе этих данных понять алгоритм выдачи Яндекса, честно, не представляю, нужны тогда хотя бы смс, которые проиндексили, но не попали в выдачу.
В ограничениях мы написали, что репрезентативности здесь быть не может — в день Мегафон обрабатывает 40 млн. смс (132 тыс. с сайта), по их данным, а в базе почти за 10 дней — 862.
Тем не менее источник интересный в жанре современного приватного текста. Изучают же личную переписку Пушкина по имеющимся документам без точных цифр по генеральной совокупности источника.
Сложный вопрос, у нас тоже мнения разделились. Но если нет номера, чем это отличается от башорга? Если бы я был на месте адресата (а подобные случаи были), думаю, я бы постарался отнестись к этому с юмором, это работает лучше всего.
Спасибо за ваше мнение. Ситуация неоднозначная, согласен. Мы это делаем по следующим причинам:
1. Это интересный источник для исследования
2. Промо, мы это не скрываем
3. Чтобы историю не замяли по тихому, а сделали выводы, «утекли и ладно», мне кажется, не самая лучшая позиция.
И все-таки лучше, если сообщения будут расходиться по форумам без номеров, а не в полном виде как сейчас.
да, это смс пользователей Мегафона, которые проиндексировал Яндекс. Они разошлись по рукам и лежат в открытом доступе вместе с номерами телефонов, мы скрыли номера, превратив их в анонимный набор текстов.
Здесь получается надвиртуальная реальность — проекция фантазии виртуальных пользователей, ведь это их желания и мечты, а действительность все ставит на свои места в выдачу поисковика.
На всякий случай: «опускаются» не имеет никакого сексуального контекста.
Еще фактор — форма отправки через интернет, коротких односложных сообщений там скорее всего нет или крайне мало.
Тем не менее источник интересный в жанре современного приватного текста. Изучают же личную переписку Пушкина по имеющимся документам без точных цифр по генеральной совокупности источника.
1. Это интересный источник для исследования
2. Промо, мы это не скрываем
3. Чтобы историю не замяли по тихому, а сделали выводы, «утекли и ладно», мне кажется, не самая лучшая позиция.
И все-таки лучше, если сообщения будут расходиться по форумам без номеров, а не в полном виде как сейчас.
С урлами разберемся, спасибо.