Любопытное исследование провел ЖЖ-юзер sheldon_j. С помощью лингвистических методов он составил примерный портрет аудитории каждого из трех самых популярных блогосервисов в Рунете: Livejournal, Liveinternet и Блоги@Mail.ru. Целью исследования было проверить распространенную гипотезу о том, что пользователи ЖЖ — самые умные, а на Liveinternet и «Блоги@Mail.ru» чаще встречаются малообразованные, малограмотные люди.
На первом этапе исследования были определены коэффициенты популярности блогосервисов, то есть примерный размер базы проиндексированных записей. Для этого использовался поиск по блогам и нейтральные поисковые запросы «окно» и «стол».
Таким образом, индекс популярности ЖЖ равен 594, Liveinternet — 301 и «Блоги@Mail.ru» имеют коэффициент популярности 68.
Чтобы проверить свою гипотезу, ЖЖ-юзер sheldon_j решил использовать лингвистические маркеры трех групп.
Первая группа маркеров — слова, характерные для сетевого сленга и слова с орфографическими ошибками: прив (искаж. привет), пасиб (спасибо), кажеться (кажется), мну (я), пробывал (пробовал). По мнению автора, эти слова явно указывают на «дебиловатых или малолетних» пользователей.
Как видим, результаты исследования полностью подтверждают гипотезу о более высоком уровне культуры пользователей Livejournal. В их лексике «мусорные» слова встречаются гораздо реже.
Вторая группа лингвистических маркеров — слова их лексикона интеллигента, которые «чаще всего маркируют текст как интеллектуальный и имеют неочевидную орфографию».
На первом этапе исследования были определены коэффициенты популярности блогосервисов, то есть примерный размер базы проиндексированных записей. Для этого использовался поиск по блогам и нейтральные поисковые запросы «окно» и «стол».
Запрос | Блоггерский сервис | Записей |
Окно | Livejournal | 686578 |
Liveinternet | 372433 | |
blogs.mail.ru | 87350 | |
Стол | Livejournal | 500745 |
Liveinternet | 229459 | |
blogs.mail.ru | 49423 |
Таким образом, индекс популярности ЖЖ равен 594, Liveinternet — 301 и «Блоги@Mail.ru» имеют коэффициент популярности 68.
Чтобы проверить свою гипотезу, ЖЖ-юзер sheldon_j решил использовать лингвистические маркеры трех групп.
Первая группа маркеров — слова, характерные для сетевого сленга и слова с орфографическими ошибками: прив (искаж. привет), пасиб (спасибо), кажеться (кажется), мну (я), пробывал (пробовал). По мнению автора, эти слова явно указывают на «дебиловатых или малолетних» пользователей.
Запрос | Блоггерский сервис | Записей | Частота |
Прив | Livejournal | 2937 | 4,94444444 |
Liveinternet | 15464 | 51,3754153 | |
blogs.mail.ru | 2317 | 34,0735294 | |
Пасиб | Livejournal | 14420 | 24,2760943 |
Liveinternet | 16306 | 54,1727575 | |
blogs.mail.ru | 1079 | 15,8676471 | |
Кажеться | Livejournal | 13306 | 22,4006734 |
Liveinternet | 17612 | 58,5116279 | |
blogs.mail.ru | 2963 | 43,5735294 | |
Мну | Livejournal | 37481 | 63,0993266 |
Liveinternet | 111929 | 371,857143 | |
blogs.mail.ru | 7331 | 107,808824 | |
Пробывал | Livejournal | 3333 | 5,61111111 |
Liveinternet | 2949 | 9,79734219 | |
blogs.mail.ru | 516 | 7,58823529 |
Как видим, результаты исследования полностью подтверждают гипотезу о более высоком уровне культуры пользователей Livejournal. В их лексике «мусорные» слова встречаются гораздо реже.
Вторая группа лингвистических маркеров — слова их лексикона интеллигента, которые «чаще всего маркируют текст как интеллектуальный и имеют неочевидную орфографию».
Запрос | Блоггерский сервис | ЗаписейЧастота | Индульгенция | Livejournal | 3253 | 5,476431 | Liveinternet | 932 | 3,096346 | blogs.mail.ru | 178 | 2,617647 | Интеллигибельный | Livejournal | 149 | 0,250842 | Liveinternet | 8 | 0,026578 | blogs.mail.ru | 7 | 0,102941 | Постмодернизм | Livejournal | 8271 | 13,92424 | Liveinternet | 987 | 3,27907 | blogs.mail.ru | 207 | 3,044118 | проверяется еще и третья группа маркеров: фамилии политиков. Они тоже гораздо чаще встречаются в сообщениях Livejournal.