Комментарии 106
Составители словарей при этом немало удивляют: Оказывается слово «effectively» является популярным, в вот слово «likely» — нет. (longman)
Но всё-таки выбор 3000 частых слов, при прочих равных, полезнее выбора 3000 других слов, считаю.
Составители словарей, похоже, рассматривают словарный запас конкретного региона (Оксфорд?) или конкретной группы людей (профессора английских университетов?).
Что же до списка самых популярных слов, то его, наверное, стоит откорректировать с учетом особенностей речи собеседников и профессиональных интересов.
Классические романы, газетные статьи, научные работы, посты в блогах… Гугл говорит, что «effectively» найден на 372 млн страниц, а «likely» на 811 млн, так что вряд ли используют гугл.
Что логично — составители словарей стараются отслеживать актуальное состояние языка. Поэтому я бы взял свежие блоги, газеты и научные журналы, в результате чего получил бы перекос в сторону формального языка.
Моя практика (и не только на мне) показывает, что понимание ~30% слов дает более-менее адекватное представление, о чем идет речь. Понимание ~70% — вполне адекватное, на что уже можно адекватно ответить. Оставшихся ~30% — смысловые/эмоциональные тонкости, которые добавляют мало информации (но полезно).
Но таки да — составители словарей удивляют. В Египте было достаточно знать «ту бир, плиз». Остальное — руками. Египетский английский с нижне-кировоградским английским не очень совместим.
Кроме того… Вы пробовали посмотреть на эти красные слова? Я плохо знаю английский, но я почти все из них угадал по смыслу. Часть просто похожа «по звучанию» (да, можно сильно обмануться, но не всегда же), некоторые состоят из двух известных слов, имеют знакомый корень (да, тоже можно ошибиться, но не так уж часто).
Я по диагонали иногда просматриваю английские статьи, и при моём очень бедном словарном запасе худо-бедно понимаю, о чём речь. Это при том, что узнаю треть слов примерно, а то и четверть… Может быть недостаток словарного запаса способствует развитию интуиции? И наоборот…
И я бы сказал, что это достаточно частое явление — многие слова, которые носителям языка кажутся редкими и заумными оказываются понятнее, так как в русском языке используется аналогичное «заумное» заимствование. А вот простые бытовые вещи перевести труднее.
забавно, что как раз piquing и profanity имеют близкие фонетические и смысловые аналоги в русском. То есть их смысл тоже можно угадать.
Profanity? Это какой же?
Эээ. Это ложный друг переводчика, вообще-то. Profanity — в этом конкретном тексте — это не профанация.
В этом контексте — ругательство (своевременное и цветистое).
Опошление и кощунство — это не ругательство (а ругательство — это не обязательно опошление или кощунство). "Понять смысл" русское слово не помогает, оно только вводит в заблуждение. Как, собственно, и бывает с ложными друзьями.
… вот только если вы когда-нибудь встретите в английском тексте слово profane и попробуете его перевести "по ассоциации" со словом "профан" (в его неспециальном значении), вы сильно ошибетесь.
Особенно с учетом того, что в английском есть слово profanation с абсолютно совпадающем смыслом.
Мне кажется довольно очевидной ассоциация с нашим «профан», что есть «невежда».
Это ошибочная ассоциация. Profane music — это не "невежественная музыка", это "мирская музыка" (синоним — secular).
Особенно с учетом того, что в английском есть слово profanation с абсолютно совпадающем смыслом.
Не абсолютно. В русском языке слово "профанация" почти полностью потеряло религиозные корни (я не удивлюсь, если в этом смысле его только специалисты используют), в английском слово profanation напрямую отсылает к религии (и тот смысл, в котором мы его используем, сильно в конце списка).
Свободность общения практически не коррелирует с количеством выученных слов. Человек знающий сотню слов может быть более уверенным в общении, чем знающий 10000. И выбор конкретных слов тут не причём.
А восьмилетние дети грамматику знают?
Не знают, но умеют пользоваться (хотя, конечно, и не всегда правильно).
Беда в том, однако, что (а) вряд ли взрослый человек, хочет, чтобы его речь звучала, как речь восьмилетнего ребенка, и (б) то, как учились говорить восьмилетние дети, взрослому человеку не очень доступно.
Не знают, но умеют пользоваться
Собственно, я именно об этом: что практика использования языка первична по сравнению с теорией, что, конечно, не отменяет важности знания теории. В рельном общении ведь просто некогда думать как там строится страдательный залог или, скажем, сослогательное наклонение. Зато легко подражать виденному/слышанному в похожей ситуации.
Собственно, я именно об этом: что практика использования языка первична по сравнению с теорией, что, конечно, не отменяет важности знания теории.
Как вы определяете "первичность"?
В рельном общении ведь просто некогда думать как там строится страдательный залог
Почему некогда? Люди вообще думают быстрее, чем говорят.
Зато легко подражать виденному/слышанному в похожей ситуации.
Это если вы (а) были в похожей ситуации (б) помните ее и (ц) можете определить критерии похожести.
Не обязательно «были в похожей ситуации». Достаточно, скажем, «видели в кино».
Не обязательно «были в похожей ситуации». Достаточно, скажем, «видели в кино».
У вас такая хорошая память, чтобы помнить все, что вы видели в кино? У меня — нет.
Что важнее, когда вы что-то "видите в кино" — как вы понимаете, что это такое, и какая у него область применения?
Английскими словами можно пользоваться в определенном грамматическом порядке или системе. Это искусственный язык.
… это в какой момент английский стал искусственным языком?
Да и по-отдельности знать слова тоже довольно бессмысленно, ибо предлоги (или другие слова) бывает очень хорошо меняют общий смысл на прямо противоположный. И это ещё как считать что ты знаешь какое-то иностранное слово — по иностранным словам считать или же по их переводам на русский? К примеру слова run, get, take, come — там только на чистые слова под сотню переводов, а если ещё предлоги добавить, то ещё и умножить можно на два смело.
Конечно, всё больше овладевая языком, такие переводы с русского уже не делаются, и неродная речь становится действительно богаче, но, на это уходит больше времени. Другими словами, чтобы свободно начать говорить на иностранном языке, кроме массы других факторов, мне кажется немаловажным и то, как именно мы думаем и говорим на своем родном языке.
Я проверил лексику переписывающихся со мной — действительно, 90% попали в список, остальные более-менее специфические термины.
Каки-то слишком оптимистичные данные по среднему словарному запасу.
Я где-то читал другое — 10000 — 15000 слов у носителей. Похоже, что исследователи сознательно отсекают определенные слои общества.
Я выучил 25000 слов, но вот поговорить обо всем, что я хочу на английском я не могу.
Мне встречалась статистика западных исследований, говорящая о том, что восьмиклассник отличник знает 25.000 слов, отличник первокурсник около 50.000. Выпуск лиги плюща около 80.000. Это пассивный словарь.
Что интересно, Donald Trump не входит в топ-3000 в обоих списках. Что говорит о том, что составлялись они давно и, возможно, сейчас неактуальны.
А 3000 тысячи, позволят обращаться к словарику довольно редко. Но опять-же если текст не специфичен.
play.google.com/store/apps/details?id=io.lingvist.android&hl=ru
Так, Seashore в 1947 насчитал 9600 слов, Watts (1950) — в 4000-7000, Smith (1926) — в 2100, Baker (1997) — в 2500-5000, есть оценки в полторы тысячи слов, что выглядит абсурдно. Как правило, в этих исследованиях низкие цифры — это активный словарный запас, то, что ребенок реально произносит, а высокие — то, что он правильно понимает, но сам не использует.
Взрослый человек по разным подсчетам владеет от 20 до 100 тыс. слов.
Не знаю, насколько русский можно распространить на английский: слов в русском языке гораздо меньше, кроме того, русские гораздо ровнее понимают тексты, чем англичане или американцы. Трудно представить себе взрослого русского, не понимающего многие предложения в газете. Но зато на русском нам будет проще понять, что в высоких цифрах объема словарного запаса среднего человека нет ошибки. Откройте словарь Ожегова. В зависимости от издания, там 60-80 тыс слов. Откройте наугад десяток страниц и просмотрите на них все слова. Вероятно, вы не встретите ни одного незнакомого слова, максимум — десяток. Получается, вы знаете минимум 50 тыс русских слов, и это только те, что попали в словарь. Разговорные, профессиональные, ругательные, новые, устаревшие и прочие слова вы знаете, но в словаре их нет. В английском примерно то же самое. Я, например, по оценкам каких-то онлайновых тестирований, знаю примерно 25 тыс английских слов, и все-таки практически в каждом абзаце письменной и в каждой длинной фразе устной речи наталкиваюсь на незнакомое слово. Буквально сейчас читаю «Янки из Коннектикута», примерно каждое десятое слово незнакомое или напрочь забытое, а ведь по-русски я понимал почти всё ещё в детстве.
Так что оценка в 25 тыс для «образованного взрослого» явно заниженная. Советский двухтомный «Большой англо-русский словарь» на базе Мюллера содержит более 200 тыс словарных статей, и из них носитель языка знает (в пассиве) не меньше половины. Кроме того, если верить С. Пинкеру, образованность не особо влияет на объем словарного запаса. Пинкер утверждает, будто вообще не влияет, хотя я ему не верю.
Короче, 3000 самых частотных слов для изучения английского — это замечательно, это гораздо лучше, чем 3000 редких. Прекрасная идея напирать на самые частотные слова и выражения. Но 3000 даже близко не хватит для хорошего понимания или свободного общения.
Хочу напечатать на карточках и выучить!
Киньте ссылкой плз
Там на гитхабе ещё кнопочка Raw есть, чтобы совсем уж легко сохранить как текст.
github.com/OliverCollins/Oxford-3000-Word-List/blob/master/Oxford%203000%20Word%20List.txt
В Oxford 3000 два раза встретилось слово "ally". Значит, на самом деле, их всего лишь 2999. :)
Ради примера, где для понимания требуется знать на порядок больше, чем набор слов, можно взять, например (у меня сейчас на столе), «AMD64 Architectutre. Programmer's Manual. Vol.1: Application Programming».
Что понятно, поскольку подобные документы, в основном, ненативные оутсорсеры пишут.
Что понятно, поскольку подобные документы, в основном, ненативные оутсорсеры пишут.
Тяжелее всего с китайским было — там разобрал только формулы, но смысл статьи был в целом понятен.
Возьмем детский текст посовременнее и попроще. «Charlotte's Web» — 2900 слов. Допустим, на самом деле еще меньше, где-нибудь 2000. Как думаете, сколько из них совпадают с вашими 3000 самыми частотными?
Возьмем современную взрослую массовую литературу типа Марининой: Джон Гришем, «The Firm». 140 тысяч слов, из них после обрезания конечных (es|s|ed|ing|ly) остается 6800 уникальных.
По «Гарри Поттеру» я сам считать не стал, процитирую чью-ту чужую работу (стемминг там не использовался, так что делите на полтора):
The number of unique words also increases with the series. In HP 1 there are 5687 unique words compared to 12624 unique words in HP 5, so the writing is more sophisticated or J.K. Rowling is introducing new words (could be character names, new locations, spells, etc.) to readers.
А теперь что-нибудь серьезное.
Апдайк, «Кролик, беги», 106 тыс слов, из них 7 тыс уникальных.
Драйзер, «Американская трагедия», 360 тыс слов, 10 тыс уникальных.
Беллоу, «Герцог», 130 тыс слов, 10 тыс уникальных.
Дос Пассос, «42 параллель»: полмиллиона слов, 18 тыс уникальных.
И эти наборы слов не совпадают. Если взять все четыре вышеназванные книги, то будет уже 27 тыс уникальных слов.
— 3000 слов — критический рубеж, позволяющий без словаря читать и догадываться о смысле не знакомых слов по контексту
— есть масса производных слов, образованных из известных, (wonder-wonderful, doubt-doubtful, conductor — semiconductor, sonic — supresonic, division — sudivision и пр.), которые вам известны, даже если вы их не включили в 3000
— имена собственные и географические названия, не требующие перевода
— аналоги русских англицизмов и латинизмов (computer, integration, submarine, stop, machine) и производных от них, которые не требуется даже выписывать и учить
— прочие слова о смысле которых легко догадаться (computer — compute — computational)
— приставки (understanding — misunderstanding, expected — unexpected)
— технические термины, которые часто одинаковы во многих языках
Ну то есть пассив-то у вас, на самом деле, сильно больше, чем 3000 слов (особенно учитывая, что вы знаете, что conductor — это не только проводник, который билеты в проверяет, и что semi — это половина).
Но я подозреваю, что (реальная) разница у вас и вашего оппонента в том, какие тексты читать, и в том, сколько позволять себе "додумывать".
В число уникальных слов будут входить magic wand, cast a spell и т.д. Если вы фанат Гарри Поттера и фантастической литературы в общем, конечно, здорово знать такие фразы и выражения, но в повседневном разговоре или при чтении текста на какую-то другую тематику они вряд ли пригодятся
То есть вы никогда не слышали в повседневной речи фразы she cast a spell on them?
Способность свободно выражать мысли определяется не только знанием отдельных слов, но и навыком применения фразовых глаголов и речевых оборотов.
Если я знаю слова «get» & «done» то само по себе мне это никак не поможет выразить мысль, которая выражается фразой «get smth done». Что бы выразить такую мысль мне нужно знать именно эту фразу, а не отдельные слова, которые ее составляют.
Т.е. можно знать хоть 100000 отдельных слов, но если при этом не знаешь фразовых глаголов, то с точки зрения fluency можно так и остаться посредственностью. Поэтому мне кажется не очень полезным составлять частотные словари и анализировать словарный запас в таком виде как это предлагается в статье.
Мне кажется в идеале в частотном словаре должны быть упорядочены некие «лексические единицы» — такой единицей может быть либо слово, либо фразовый глагол, либо устойчивое словосочетание. Это, конечно, из области фантастики, но кто знает, может быть компьютерная лингвистика когда-нибудь найдет способ сделать сказку былью.
В связи с этим чем лично я пытаюсь заниматься: беру литературу и выписываю из нее «разговорные фразы» которые лично мне кажутся потенциально полезными (типа «are you in the middle of something?»
Отдельные слова в таких фразах в 96% случаев не будут для меня новыми, а полезными для fluency являются как раз неочевидные сочетания этих слов передающие определенный смысл.
Дальше нужно понять как это лучше вызубрить и «перевести в актив»…
Во-вторых, не соглашусь с логикой что если take сам по себе является частотным то и обороты с ним нужно учить с большим приоритетом чем обороты со switch. Очевидно ведь что switch on-off является более частотным и приоритетным чем множество (большинство?) оборотов с take, типа take over или take smth for granted.
Ещё раз повторю свой поинт: нужен частотный словарь в котором будут упорядочены слова и обороты:
1. take (сам по себе, без учета его вхождений во фразовые глаголы)
2. switch (сам по себе, без учета его вхождений во фразовые глаголы)
3. switch on
4. switch off
5. take over
6. take smth for granted
И вот по такому словарю надо двигаться, а не по частотному словарю отдельных слов.
Большинство слов в любом языке, кроме разве точных научных терминов и имен собственных, имеют в разных языках сильно отличающиеся семантические поля, сочтетаемость, управление и прочее. Однозначные соответствия скорее исключение, чем правило.
Разнообразные программы и методы по заучивнию слов исходят из совершенно наивной предпосылки что у каждого иностранного слова есть четкий и однозначный перевод. Поэтому изучение вырванного из контекста отдельного значения слова, как предлагается в большинстве сервисов такого типа, — скорее ритуал, чем реально полезное занятие.
Вот и в вашем примере an attitude — это не только отношение, а и позиция, поза, положение, стойка, осанка, положение. Причем и в прямом смысле, по отношению к телу, и в переносном, по отношению к мыслям, идеям и убеждениям.
И это просто многозначное слово с близкими значениями. А в случае омонимии вообще все запутывается окончательно…
Вот и получаются после такого изучения фразы типа:
«I have bought in the lake...» — Я покупался в озере…
«Я к вам пишу, чего же боле» — I am pissing on you…
Конечно для общения нужен словарный запас, но так как англ-кий очень контекстно зависимый, а так же что они очень любят идиомы, то знание слов самих по себе мало что будет вам давать в реальном общении с носителями языка.
Тогда зачем же вы в заголовке пишете "Сколько английских слов надо выучить для свободного общения и чтения статей?"
Сколько английских слов надо выучить для свободного общения и чтения статей? (спойлер: 3000)