Pull to refresh
14
0
steveb @steveb

User

Send message
Спасибо! добавили
KPEM, вы прекрасно поняли смысл словосочетания, пусть и не сразу. Вы не знаете, что некоторые слова опускаются, чтобы не писать километры текста?

На всякий случай: «опускаются» не имеет никакого сексуального контекста.
У нас получилось 832 из 1000 после исключения сервисных сообщений, были бы признательны за дополнительную информацию.
Не соглашусь, те, кто отправляли, пользовались сервисом Мегафона, мы не называем их абонентами. Полное название курсовой работы могло бы быть: «Анализ текстов SMS группы пользователей сервиса отправки сообщений ЗАО «Мегафон», опубликованных поисковым сервисом ООО «Яндекс» 18.07.2011 за период с 07.07.2011 по 18.07.2011».
Согласен, про репрезентативность не то написал. Имел в виду, что ошибка выборки на таком объеме будет очень большая. А репрезентативность отсутствует из-за того, что не знаем методику выборки, все верно.
Еще фактор — форма отправки через интернет, коротких односложных сообщений там скорее всего нет или крайне мало.
Сделали, ранжируется по количеству кликов на кнопки соц. сервисов
Исследуется не Мегафон и не Яндекс, исследуются тексты данной группы пользователей. Как на основе этих данных понять алгоритм выдачи Яндекса, честно, не представляю, нужны тогда хотя бы смс, которые проиндексили, но не попали в выдачу.
В ограничениях мы написали, что репрезентативности здесь быть не может — в день Мегафон обрабатывает 40 млн. смс (132 тыс. с сайта), по их данным, а в базе почти за 10 дней — 862.

Тем не менее источник интересный в жанре современного приватного текста. Изучают же личную переписку Пушкина по имеющимся документам без точных цифр по генеральной совокупности источника.
спасибо, поправим
спасибо! но пока все сильно сырое
Точно! «думать» в конце списка :)
Сложный вопрос, у нас тоже мнения разделились. Но если нет номера, чем это отличается от башорга? Если бы я был на месте адресата (а подобные случаи были), думаю, я бы постарался отнестись к этому с юмором, это работает лучше всего.
Спасибо за ваше мнение. Ситуация неоднозначная, согласен. Мы это делаем по следующим причинам:
1. Это интересный источник для исследования
2. Промо, мы это не скрываем
3. Чтобы историю не замяли по тихому, а сделали выводы, «утекли и ладно», мне кажется, не самая лучшая позиция.

И все-таки лучше, если сообщения будут расходиться по форумам без номеров, а не в полном виде как сейчас.
да, это смс пользователей Мегафона, которые проиндексировал Яндекс. Они разошлись по рукам и лежат в открытом доступе вместе с номерами телефонов, мы скрыли номера, превратив их в анонимный набор текстов.
Слова «Добро», «Радость» и «Счастье» имеют большее количество упоминаний, чем «Зло» и «Проблемы»
Здесь получается надвиртуальная реальность — проекция фантазии виртуальных пользователей, ведь это их желания и мечты, а действительность все ставит на свои места в выдачу поисковика.
Мы работаем над этим, подключили филилогов, может получится курса до 3-го дотянуть)
На наш взгляд, чем больше этой теме уделят внимания сейчас, тем меньше вероятность повторения в будущем.
С урлами разберемся, спасибо.
Не знаю) Это не мои фотки, это HDR Wallpapers
1

Information

Rating
Does not participate
Location
Россия
Date of birth
Registered
Activity