Американский хип-хоп vs. Уильям Шекспир: у кого словарный запас больше?

    Еще 30 лет назад хип-хоп считался музыкой улиц, в которой не стоит искать какой-либо литературной или культурной ценности. В нем рассказывали о жизни неблагополучных слоев населения, поднимали социальные проблемы, выражали свое недовольство и злость на власти и мир в целом.

    Люди, далекие от хип-хопа, считают его низким жанром музыки. Но лингвисты провели исследование словарного запаса популярных американских исполнителей и оказалось, что английский язык в их текстах довольно разнообразен, а некоторые из них и вовсе оперируют словарным запасом, который сравним с Шекспировским. 

    Интересно? Тогда поехали!

    Как это вообще: сравнивать лексикон рэперов с Шекспиром?

    Мэтт Дэниелс, журналист и автор издания Pudding, провел исследование, в котором измерил словарный запас наиболее популярных американских исполнителей в стиле хип-хоп и сравнил их со словарным запасом в произведениях культового английского поэта.

    По исследованиям лингвистов из университета Стэнфорда, Уильям Шекспир использовал в своих произведениях 31 534 уникальных слов. А реальный словарный запас писателя по оценкам ученых составляет свыше 70 000 слов.

    Для сравнения, средний словарный запас носителя английского с высшим образованием составляет около 25 000-30 000 слов. 

    А средний словарный запас людей, которые изучают английский язык как иностранный, составляет примерно 8000 лексем. 

    Но сравнивать абсолютные величины текстов писателя и американских хип-хоперов нецелесообразно.

    Понятно, что если сравнивать абсолютные цифры, то любой писатель победит. Объемы художественных произведений нельзя сравнивать с текстами хип-хоп треков. Их размеры отличаются на несколько порядков.

    Но что если уравнять шансы и проанализировать одинаковое количество слов? 

    Сказано — сделано.

    Автор исследования взял суммарно 35 000 слов из разных произведений: «Ромео и Джульетта», «Отелло», «Макбет», «Как вам это понравится», «Зимняя сказка», «Троил и Крессида». 

    А потом взял 85 самых популярных хип-хоп исполнителей США и у каждого также выделил по 35 000 слов из их текстов. Как утверждает исследователь, этот объем покрывает примерно 3-5 студийных альбомов.

    В качестве рабочего инструмента был использован токен-анализ, по которому отдельные словоформы считаются разными словами. То есть, pimps, pimp, pimping, and pimpin — это четыре отдельных лексемы для анализа, а не одно «прокачать». 

    Чтобы избежать дупликации смыслов со словоформами с апострофами (, к примеру, pimpin’), они не засчитываются.

    Результаты хоть и не идеальные, но для оценки словарного запаса Шекспира был использован точно такой же метод, поэтому их можно объективно сравнивать.

    Результаты анализа получились очень интересными.

    Хип-хоп и Шекспир: кто победит

    Относительный объем лексики английского «наше все» из среза в 35 000 слов составил 5170 уникальных лексем. 

    И как оказалось, это далеко не лидирующая позиция. Почти каждый пятый из хип-хоперов в списке (18,8%) по итогам анализа текстов показал более высокие результаты.

    Рэпер Xzibit, который знаком широкой публике больше по проекту «Тачка на прокачку» (Pimp my ride), к примеру, использовал 4 982 уникальных слова - почти на уровне с Шекспиром. 

    Уверенное первое место занял рэпер Эзоп Рок (Aesop Rock), который по мнению ресурса Betterpropaganda занимает 19 строку рейтинга топ-100 исполнителей десятилетия. В срезе он использовал 7392 уникальных слова. 

    Давайте посмотрим на один из самых популярных треков рэпера — None shall pass.

    Текст трека под спойлером

    Flash that buttery gold

    Jittery zeitgeist, wither by the watering hole, what a patrol

    What are we to Heart Huckabee, art fuckery suddenly

    Not enough young in his lung for the water wings

    Colorfully vulgar poacher, out of mulch

    Like, "I'mma pull the pulse out a soldier and bolt"

    Fine, sign of the time we elapse

    When a primate climb up a spine and attach

    Eye for an eye, but the bog life swamps and vines

    They get a rise out of frogs and flies

    So when a dogfight's hog-tied prize sort of costs a life

    The mouths water on a fork and knife

    And the allure isn't right

    No score on a war-torn beach

    Where the cash cow's actually beef

    Blood turns wine when it leak for police

    Like, "That's not a riot; it's a feast, let's eat!"

    And I will remember your name and face

    On the day you are judged by the funhouse cast

    And I will rejoice in your fall from grace

    With a cane to the sky, like, "None shall pass"

    None shall pass

    None shall pass

    Now, if you never had a day a snow cone couldn't fix

    You wouldn't relate to the rogue vocoder blitz

    How he spoke through a NoDoz motor on the fritz

    'Cause he wouldn't play rollover fetch like a bitch

    And express no regrets, though he isn't worth a homeowner's piss

    To the jokers who pose by the glitz

    Fine, sign of the swine in the swarm

    When a king is a whore who comply and conform

    Miles outside of the eye of the storm

    With a siphon to lure out a prize and award

    While avoiding the vile and bizarre that is violence and war

    True blue triumph is more

    Like, "Wait, let him snake up out of the centerfold

    Let it break the walls of Jericho, ready, go"

    Sat where the old, cardboard city folk

    Swap tales with heads, like every other penny throw

    And I will remember your name and face

    On the day you are judged by the funhouse cast

    And I will rejoice in your fall from grace

    With a cane to the sky, like, "None shall pass"

    None shall pass

    None shall pass

    You tried, you tried, you tried to trick me

    You've got a, you've, you've got a, a lot of nerve

    I'm, I'm not, I'm not, trying to trick you

    I'm try, I'm try, I'm trying to help

    Okay, woke to a grocery list, goes like this

    Duty and death; anyone object, come stand in the way

    You could be my little Snake River Canyon today

    And I ran with a chain of commands

    And a jetpack strapped where the backstab lands if it can

    Fine, sign of the vibe in the crowd

    When I cut a belly open to find what climb out

    That's quite a bit of gusto he muster up

    To make a dark horse rush, like, "Enough's enough!"

    It must've struck a nerve so they huff and puff

    'Til all the king's men fluster and clusterfuck

    And it's a beautiful thing

    To my people who keep an impressive wingspan

    Even when the cubicle shrink

    You got to pull up the intruder by the root of the weed

    N.y. Chew through the machine

    And I will remember your name and face

    On the day you are judged by the funhouse cast

    And I will rejoice in your fall from grace

    With a cane to the sky, like, "None shall pass"

    None shall pass

    None shall pass

    I'm try, I'm try, I'm trying to help

    I'm try, I'm try, I'm trying to help

    I'm try, I'm try, I'm trying to help

    I'm try, I'm try, I'm trying to help

    Help, help, help, help, help, help, help

    Мы не будем касаться литературной ценности текстов и самой музыки, но вот лексика трека действительно широкая. Да, ее обширность во многом обеспечивается использованием сленговых слов, но при этом образы и метафоры не повторяются.

    What are we, to heart Huckabee

    Кто мы такие, чтобы любить Хакаби

    «Huckabee» на сленге имеет довольно много значений. Одно из них — к примеру, курительная смесь из марихуаны и табака. Также оно обозначает общее уничижительное название политиков — из-за довольно неоднозначной политической передачи «Huckabee», которую ведет политик Майк Хакаби. И при всем этом фраза отсылается на фильм «I Heart Huckabees» («Взломщики сердец»). 

    Where the cash cows actually beef

    Когда дойные коровы на самом деле говядина.

    Интересный каламбур, который прямо переводится как: «Когда дойные коровы на самом деле говядина». Но имеет еще второй смысл, ведь «cash cow» — это еще и «богатый человек», «денежный мешок». Поэтому получается что-то вроде «Когда богатые люди — это расходный материал».    

    Плотность текста очень высокая и концентрация уникальных лексем — тоже.

    Интересно, что многие исполнители, которых считают легендами хип-хопа, в своих треках показывали довольно словарный запас значительно ниже медианы.

    Lil Wayne, 2pac, Kanye West, Snoop Dogg — все они находятся в 20% исполнителей со самым скудным словарным запасом. 

    Это никак не убирает их мощнейшее влияние на музыкальную сферу США и мира целиком, но по сравнению с тем же Эзопом Роком, лексически их тексты действительно более слабые. 

    И вполне возможно, это одна из причин их популярности.

    Тупак, Канье или Снуп Дог передают многие метафоры через предельно простые языковые формы и словосочетания. А на заре развитие хип-хоп стиля слушателями такой музыки были преимущественно низшие слои населения с ограниченным словарным запасом, поэтому такая подача гарантировала, что тексты поймут и примут. 

    А вот тексты рэпера 50 Cent можно даже считать примитивными с лингвистической точки зрения. В срезе из 35 000 слов он использовал только 3591 уникальных лексем. 

    Давайте посмотрим на один из наиболее известных треков рэпера, который в свое время просто порвал мировые чарты — Candy shop. Он создан в стиле «грязного рэпа», в котором недвусмысленно поется о сексе. Метафоры и словарный запас здесь предельно простые, понятные даже самой непритязательной целевой аудитории.

    Текст трека под спойлером:

    [Olivia]

    Welcome to the candy shop

    [Intro: 50 Cent]

    Yeah...

    Uh huh

    So seductive

    [50 Cent]

    I'll take you to the candy shop

    I'll let you lick the lollipop

    Go ahead, girl, don't you stop

    Keep goin' 'til you hit the spot (whoa)

    [Olivia]

    I'll take you to the candy shop

    Boy, one taste of what I got

    I'll have you spending all you got

    Keep goin' 'til you hit the spot (whoa)

    [50 Cent]

    You can have it your way, how do you want it?

    You gon' back that thing up or should I push up on it?

    Temperature rising, OK, let's go to the next level

    Dance floor jam-packed, hot as a teakettle

    I'll break it down for you now; baby, it's simple

    If you be a nympho, I'll be a nympho

    In the hotel or in the back of a rental

    On the beach or in the park, it's whatever you into

    Got the magic stick, I'm the love doctor

    Have your friends teasin' you 'bout how sprung I gotcha

    Wanna show me you can work it, baby?

    No problem, get on top then get to bouncing round like a low rider

    I'm a seasoned vet when it come to this shit

    After you work up a sweat, you can play with the stick

    I'm tryin' to explain, baby, the best way I can

    I melt in your mouth, girl, not in your hands (ha ha)

    [50 Cent]

    I'll take you to the candy shop

    I'll let you lick the lollipop

    Go ahead, girl, don't you stop

    Keep goin' 'til you hit the spot (whoa)

    [Olivia]

    I'll take you to the candy shop

    Boy, one taste of what I got

    I'll have you spending all you got

    Keep goin' 'til you hit the spot (whoa)

    [Bridge: 50 Cent & Olivia]

    Girl, what we do (what we do)

    And where we do (and where we do)

    The things we do (things we do)

    Are just between me and you (oh, yeah)

    [Verse 2: 50 Cent]

    Give it to me, baby, nice and slow

    Climb on top, ride like you in the rodeo

    You ain't never heard a sound like this before

    'Cause I ain't never put it down like this

    As soon as I come through the door, she get to pullin' on my zipper

    It's like it's a race who can get undressed quicker

    Isn't it ironic how erotic it is to watch them thongs?

    Have me thinking 'bout that ass after I'm gone

    I touch the right spot at the right time

    Lights on or lights off, she like it from behind

    So seductive, you should see the way she winds

    Her hips in slow-mo on the floor when we grind

    As long as she ain't stoppin', homie, I ain't stoppin'

    Drippin' wet with sweat, man; it's on and poppin'

    All my champagne campaign

    Bottle after bottle, it's on

    And we gon' sip 'til every bubble in the bottle is gone

    [50 Cent]

    I'll take you to the candy shop

    I'll let you lick the lollipop

    Go ahead, girl, don't you stop

    Keep goin' 'til you hit the spot (whoa)

    [Olivia]

    I'll take you to the candy shop

    Boy, one taste of what I got

    I'll have you spending all you got

    Keep goin' 'til you hit the spot (whoa)

    [50 Cent]

    I'll take you to the candy shop

    I'll let you lick the lollipop

    Go ahead, girl, don't you stop

    Keep goin' 'til you hit the spot (whoa)

    [Olivia]

    I'll take you to the candy shop

    Boy, one taste of what I got

    I'll have you spending all you got

    Keep goin' 'til you hit the spot (whoa)

    Candy shop — это кондитерская. Но на американском низком сленге оно еще и означает «секс-шоп». По сути вся дальнейшая метафоризация построена вокруг этой двусмысленности. 

    Lick the lollipop — облизать леденец, но в контексте абсолютно точно ясно, что имеется в виду под этим.

    Но дальше и таких метафор нет, а все поется максимально примитивным разговорным языком:

    Soon as I come through the door

    she get to pullin on my zipper 

    Как только я переступаю порог,

    Она расстегивает мне ширинку.

    Собственно, вообще не странно, что с такими текстами 50 Cent занял предпоследнее место среди рэперов по богатству языка.

    Да и вообще завуалированные и не очень треки про секс — одна из топовых тематик американской музыкальной культуры. И очень многие исполнители попробовали в ней свои силы. 

    Интересно? Тогда смотрите видео «Секс-подтекст в известных песнях». 

    В целом, грязный и гангста рэп довольно сильно выделяются из общей массы хип-хопа как раз в сторону снижения словарного запаса. Треки в этих стилях создают максимально примитивными, чтобы отвечать требованиям слушателей.

    East coast vc. West coast

    Даже если вы далеки от рэпа и хип-хопа, то все равно слышали про «Вест кост» и «Ист кост».

    Исследователь сделал также анализ исполнителей по географии, чтобы оценить, хип-хоп исполнители в каких регионах обладают большим словарным запасом.

    Исполнители из East Coast показали себя лучше остальных — среднее количество использованных уникальных слов в их треках равно 4804. У West Coast — 4411.

    Интересно, что и «Вест кост», и «Ист кост» примерно поровну распределены на графике. То есть, здесь многое уже зависит от стиля конкретных исполнителей, а не от общих региональных особенностей.

    Но вот, к примеру, южане занимают в этом рейтинге низшие позиции: в среднем словарный запас Southern-рэперов — 4268. 

    Скорее всего, подобные цифры отражают различия в популярных музыкальных стилях и способах создания треков. В южном хип-хопе характерны повторения фраз и слов — так называемое респонсорное пение. 

    Это стиль музыки, в котором фразы солиста дублируются хором. При подсчете общего количество слов эти дубли идут в общее число анализируемых лексем, поэтому число уникальных слов снижается. Тем не менее еще одной причиной также является особая популярность в южных штатах гангста и грязного рэпа, которые тоже не отличаются богатством словарного запаса.

    Общая ситуация интересная. С одной стороны, сравнивать Шекспира и американских рэперов как-то нецелесообразно. Но в равных условиях они будут практически равны. Поэт обеспечивает свой широкий лексикон неологизмами, многие из которых придумал сам, а хип-хоп исполнители — сленгом. 

    Для человека, который изучает английский как иностранный, читать Шекспира или слушать американский рэп — это одинаково сложные занятия. Причудливые лексические конструкции или куча сленга в быстром речитативе — та еще тренировка. 

    Но если вы действительно хотите прокачать владение языком и одинаково хорошо понимать как Шекспира, так и американский рэп, то записывайтесь на бесплатный урок с преподавателем и откройте для себя всю многогранность английского. 

    Онлайн-школа EnglishDom.com — вдохновляем выучить английский через технологии и человеческую заботу

    Только для читателей Хабра первый урок с преподавателем в интерактивном цифровом учебнике бесплатно! А при покупке занятий получите до 3 уроков в подарок!

    Получи целый месяц премиум-подписки на приложение ED Words в подарок. Введи промокод march2021 на этой странице или прямо в приложении ED Words. Промокод действителен до 01.05.2021.

    Наши продукты:

    EnglishDom
    Лидер в онлайн образовании

    Комментарии 25

      0
      Они бы еще провели лингвистический анализ блюза, какой был когда его пленные негры исполняли =). Хотя «уравнивание» конечно получилось весьма интересным.
        0
        Существует ли конкорданс и частотный словарь Шекспира?
        Какие 20 существительных наиболее часто встречаются во всех его поэтических текстах?
        0
        А средний словарный запас людей, которые изучают английский язык как иностранный, составляет примерно 8000 лексем.

        Как это? Даже за время после распада СССР в русский язык много тысяч англицизмов добавилось, не считая других заимствованных слов, существующих и в английском языке. А сколько давно заимствованных слов с окончаниями -ция (-tion) и так далее… Пара ссылок на подсчеты:


        https://core.ac.uk/download/pdf/290214622.pdf
        https://wordhelp.ru/end/ция


        Вспомнилось еще, в «Приключениях Электроника» обсуждается, что в рифмованных произведениях (стихах) выше плотность информации, так что сравнивать художественный текст и тексты песен — априори неверно.

          +2
          Вспомнилось еще, в «Приключениях Электроника» обсуждается, что в рифмованных произведениях (стихах) выше плотность информации,
          ниже, конечно. Значительная часть содержания расходуется на организацию размера и рифм.
          сравнивать художественный текст и тексты песен
          Хм, а Вы можете указать у Шекспира сколько-нибудь заметный объём прозаических текстов? Тогда Вы знакомы с его творчеством лучше всех большинства.
            +2
            Шекспир очень часто переходит на прозу, в то же Гамлете, когда не остается ни поэтической формы, ни размера. Не говоря уже про рифму — ее у Шекспира и так днем с огнем не найдешь.
              0
              Шекспир очень часто переходит на прозу, в том же Гамлете
              вкрапления, конечно, есть. Но это не делает того же «Гамлета» прозаическим произведением, не так ли? Прозаических текстов (рассказов, новелл, романов, повестей...) у Шекспира — сколько?
              Не говоря уже про рифму — ее у Шекспира и так днем с огнем не найдешь.
              английская поэзия — вообще нечто не то же самое, что подразумевается под этим в русском языке. Она больше похожа на оперное пение, где исполнитель вроде и поёт, но песнями это никак не назовёшь.
              0
              ниже, конечно. Значительная часть содержания расходуется на организацию размера и рифм.

              Да вы что — плотность информации по Шеннону у стихов в полтора раза выше. В детской книжке-то как раз известный факт привели! Да и очевидно это — чем ниже избыточность — тем выше информативность, у прозы избыточность значительно выше. Кстати, у Пушкина максимальная вообще для русского языка плотность информации. У Шекспира не знаю, не встречал работ на эту тему.


              P.S. Из вики: "Клод Шеннон предположил, что прирост информации равен утраченной неопределённости". Прямо руководство для начинающих поэтов :)

                0
                Разный подход к определению количества информации. При таком подходе Вы, конечно, правы. Но, скажем, если речь идёт об отчуждаемой (извлекаемой) информации — наоборот. Скажем, при равном размере текста телефонный справочник в поэтической форме будет содержать намного меньше номеров :-) Пример, конечно, утрированный, но, надеюсь, понятный.
                  0

                  В той же книжке "Приключения Электроника" есть примеры, в том числе "и корень взяв из нет себя". Это заметно короче определения "Мни́мая едини́ца — комплексное число, квадрат которого равен -1". Или вот закон Архимеда на биофаке ННГУ был известен как "тело выпертое туды, выпирает из воды с силой выпертой воды тела впёртого туды". Такая вот краткая и запоминающаяся мнемоника, информативность равна таковой у исходного определения, а в разы короче.

                    +1
                    ай, бросьте, это мнемоники в расчёте на уже знающего, а не определения. В таком случае можно и просто «закон Архимеда» написать, sapienti sat.
                      0

                      Как раз это определение для решения задачек — сказано про силу и дана ее величина и направление.

                  0
                  Кстати, у Пушкина максимальная вообще для русского языка плотность информации.

                  Интересное замечание! Ни в коем случае не хочу поставить его под сомнение, но все-таки: а как это посчитано и какая была база сравнения? Мне почему-то кажется, что многие современные поэты должны его перекрывать по этому показателю. Честное слово, было бы очень интересно увидеть табличку, включающую, кроме имярека, еще и других сравнимых с ним авторов. Например, уже упомянутых ниже В.Высоцкого и М.Щербакова.
                    0

                    Посчитано понятно как — смотрели, сколько слов можно выкинуть без утраты смысла… нисколько, то есть плотнее уже некуда. Очень простые же и образные строчки, скажем « Пленяет грозного царя» — что тут можно убрать без потери смысла? Высоцкому приходилось очень иносказательно выражаться по политическим причинам, так что сохранение смысла при удалении слов трудно оценить...

                0
                Как это?
                В английском нет суфиксов и окончаний, зато есть фразовые глаголы.
                Идти — go
                Шёл, шла, шло — went
                Вышел, вышла, вышло — went out
                Прошёл, прошла, прошло — went through
                По итогу мы имеем десять лексем в русском языке и четыре в английском по приведённой методике.
                  0

                  Вот только по той ссылке, что я привел выше, заимствования считали по их оригинальным (английским) основам.

                    0
                    И?
                    В целом статистика показывает, что англичанин с высшим образованием знает порядка 26 тыс. слов (в статье 25-30 тыс.) а для русского языка эта цифра составляет уже 80-100 тыс. слов. именно по причине разной системы образования новых слов.
                    Ещё играет роль сленг, в том числе и профессиональный, скажем у сварщика и у программиста несколько разное количество англицизмов в речи будет вне зависимостти от образования.
                    Я как-то проходил подобное тестирование и у меня получалось, что на русском у меня словарный объём на уровне 78 тыс. слов, а на английском — всего 6 тыс., так что да, примерно сходится со статистикой из статьи.
                    по той ссылке, что я привел выше
                    по первой ссылке можно прочитать
                    количество новейших англицизмов, пополнивших русский
                    язык в 90-х гг. ХХ в. – начале ХХI в., составляет 673 слова.

                    По данным других исследований, значительно больше англицизмов
                    пополнили русский язык в течение последнего десятилетия (1200-1500 единиц)
                    Что не совсем тоже что и
                    много тысяч англицизмов добавилось, не считая других заимствованных слов
                    Для понимания масштаба советую поискать по термину рунглиш, ну или просто посмотреть видео
                    youtu.be/6aNDpVOWJjo
                    Вот там — реально многие тысячи слов заимствованы.
                    По второй ссылке, я, совсем не к стыду, понял, что знаю не более пятой части от перечисленных слов, а подавляющее большинство является узкоспециализированными терминами. Более того, при таком подходе не избежать огромного количества ошибок, например нация в русском означает совершенно иное чем nation в английском (правильней было бы сравнить с ethnic)
                    Ну и с тем же успехом можно сравнить английский с немецким или фризским (все три относятся к германской языковой группе), или латинским (много заимствований из-за влияния католицизма) или заимствования в русский из французского и немецкого (самое простое — глюк, происходит от германского Glück, радость, в частности от применения веществ, юнга — от нидерландского jongen/мальчик, трап — нид. trap/лестница, трюм — нид. truim/het ruim/пространство, от которого, к слову образовано и английское — room) и так далее.
                    А ещё в русском почти нет ни одного собственно русского слова начинающегося на букву «А», все заимствованные, если я правильно помню.
                    В итоге получится, что в принципе треть любого языка заимствована из других :)

                    З.Ы. Ещё можно почитать Войну и Мир, для сравнения :)
                      0

                      Ох, сомневаюсь я, что авторы тестов на знание языка, скажем, читали стандарт GSM, если мне не изменяет память, на примерно 10 000 страниц:) Сегодня в каждой области знаний свой язык с уймой терминов. Да хотя бы взять программирование — вот что-то не нахожу лингвистический анализ даже Дональда Кнута (искусство программирования), зато для Гарри Поттера пожалуйста. А интересно было бы еще и для суммы прочитанных книг получить значение количества уникальных слов, тогда можно сравнивать.

                0
                Подскажите, пожалуйста: а есть ли какой-то онлайн-сервис для подсчета числа лексем в тексте? Чтобы просто засунуть туда текст Толстого или сборник стихов Высоцкого, М.Щебакова и пр. и получить ответ?
                А то что-то гуль показывает сервисы только для подсчета числа слов. А я хочу, чтобы лексически одинаковые слова не учитывались. Т.е. чтобы система отбрасывала окончания (считала число различных основ).
                  0
                  Такого онлайн-сервиса, к сожалению, не встречали.
                  Знаем только конкретный инструмент, с помощью которого это можно сделать — токен анализ. Но вот как правильно сделать с окончаниями в русском языке — без понятия.
                  0

                  " средний словарный запас носителя английского с высшим образованием составляет около 25 0000-30 000 слов."
                  Как это вообще можно посчитать?
                  Дать человеку огромный словарь, и он будет отмечать "знаю — не знаю"? Так это уйму времени должно занять.
                  Или просто анализируют текст за много лет? Так большинство людей не так много пишут.

                    0
                    Конкретно здесь словарный запас измеряется в целом, а не только по письменным текстам.
                    Вот здесь есть масштабное исследование словарного запаса носителей и не-носителей.
                    Если вкратце, делается словесный срез: человек выбирает слова, которые знает, примерно из сотни примеров. А затем результаты среза экстраполируются на весь словарный запас.
                    0
                    вот уж не думал, что буду читать статью про сравнение реперов и классиков. Спасибо за интересное время
                      0
                      Всегда пожалуйста :)
                        0
                        Много лет назад на ютубе было видео, где надо было угадывать, кто автор, поэты серебряного века или рэперы — но бездна поглотила его.

                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                      Самое читаемое