Skyeng-Habr 7 дек 2017 в 21:15

Сколько английских слов надо выучить для свободного общения и чтения статей? (спойлер: 3000)

4 мин

82K

Блог компании SkyengЧитальный зал

+20

106

Комментарии 106

pwl 7 дек 2017 в 22:45

Сдается мне, что приведенный пример, показывает, что выпадение 9% слов позволит лишь очень примерно судить, о какой теме вообще был текст, но не позволит понять собственно смысла текста. Выпадение 19% процентов, превращает текст в полностью бессмысленный набор слов.

Составители словарей при этом немало удивляют: Оказывается слово «effectively» является популярным, в вот слово «likely» — нет. (longman)

EndUser 7 дек 2017 в 23:56

Да, может действительно оказаться «cat blah fish blah food blah» как в этом ролике www.youtube.com/watch?v=aHC3i6N9Wvk&t=408

Но всё-таки выбор 3000 частых слов, при прочих равных, полезнее выбора 3000 других слов, считаю.

geher 8 дек 2017 в 05:33

Составители словарей, похоже, рассматривают словарный запас конкретного региона (Оксфорд?) или конкретной группы людей (профессора английских университетов?).

Что же до списка самых популярных слов, то его, наверное, стоит откорректировать с учетом особенностей речи собеседников и профессиональных интересов.

dolovar 8 дек 2017 в 08:35

Или для наполнения базы используют не распознавание диктофонных записей, а готовые электронные тексты. Которые сильно зависят от источника.
Классические романы, газетные статьи, научные работы, посты в блогах… Гугл говорит, что «effectively» найден на 372 млн страниц, а «likely» на 811 млн, так что вряд ли используют гугл.
Что логично — составители словарей стараются отслеживать актуальное состояние языка. Поэтому я бы взял свежие блоги, газеты и научные журналы, в результате чего получил бы перекос в сторону формального языка.

Ontaelio 8 дек 2017 в 09:29

Нет, корпус составляется из текстов и аудиозаписей со всего мира, как носителей, так и нет. Подробнее можно посмотреть здесь: https://www.macmillandictionary.com/corpus.html (там еще хорошая ссылка на статью главреда с более свежими данными).

domix32 8 дек 2017 в 09:53

И местячковых диалектов наверное.

justhabrauser 8 дек 2017 в 18:12

Это Вам сдается.
Моя практика (и не только на мне) показывает, что понимание ~30% слов дает более-менее адекватное представление, о чем идет речь. Понимание ~70% — вполне адекватное, на что уже можно адекватно ответить. Оставшихся ~30% — смысловые/эмоциональные тонкости, которые добавляют мало информации (но полезно).

Но таки да — составители словарей удивляют. В Египте было достаточно знать «ту бир, плиз». Остальное — руками. Египетский английский с нижне-кировоградским английским не очень совместим.

beetleinweb 8 дек 2017 в 18:43

Кто ж заставляет их «выпадать» совсем? При чтении — в словарь. При разговоре — переспросить, попросить пояснить. Трудно ведь оспаривать предположение, что знание 3000 самых «частотных» слов сократит непонимание в разы.

Кроме того… Вы пробовали посмотреть на эти красные слова? Я плохо знаю английский, но я почти все из них угадал по смыслу. Часть просто похожа «по звучанию» (да, можно сильно обмануться, но не всегда же), некоторые состоят из двух известных слов, имеют знакомый корень (да, тоже можно ошибиться, но не так уж часто).

Я по диагонали иногда просматриваю английские статьи, и при моём очень бедном словарном запасе худо-бедно понимаю, о чём речь. Это при том, что узнаю треть слов примерно, а то и четверть… Может быть недостаток словарного запаса способствует развитию интуиции? И наоборот…

Areso 9 дек 2017 в 04:34

Т.е. вы легко угадали смысл слов smack, twat, twit, piquing, profanity?

НЛО прилетело и опубликовало эту надпись здесь

bay73 11 дек 2017 в 09:48

Забавно, что как раз piquing и profanity имеют близкие фонетические и смысловые аналоги в русском. То есть их смысл тоже можно угадать.
И я бы сказал, что это достаточно частое явление — многие слова, которые носителям языка кажутся редкими и заумными оказываются понятнее, так как в русском языке используется аналогичное «заумное» заимствование. А вот простые бытовые вещи перевести труднее.

lair 11 дек 2017 в 10:32

забавно, что как раз piquing и profanity имеют близкие фонетические и смысловые аналоги в русском. То есть их смысл тоже можно угадать.

Profanity? Это какой же?

bay73 11 дек 2017 в 12:31

Профанация она и в Африке профанация.

lair 11 дек 2017 в 12:33

Эээ. Это ложный друг переводчика, вообще-то. Profanity — в этом конкретном тексте — это не профанация.

bay73 11 дек 2017 в 12:42

А как вы переведёте profanity?

lair 11 дек 2017 в 12:49

В этом контексте — ругательство (своевременное и цветистое).

bay73 11 дек 2017 в 12:53

Ну а профанация это — опошление, кощунство. На мой взгляд, крайне близкий аналог. Я бы не стал использовать именно «профанацию», как перевод. Но понять смысл текста русское слово помагает.

lair 11 дек 2017 в 12:54

Опошление и кощунство — это не ругательство (а ругательство — это не обязательно опошление или кощунство). "Понять смысл" русское слово не помогает, оно только вводит в заблуждение. Как, собственно, и бывает с ложными друзьями.

bay73 11 дек 2017 в 12:55

Ну что ж ваше право. Вам не помогает и ладно. А по мне так очень точное значение.

bay73 11 дек 2017 в 12:58

Заглянул в словарик. Там для profanity два значения: профанация и богохульство. Ну думаю, что словарик помог бы мне больше, чем ложный друг. :)

lair 11 дек 2017 в 13:04

Возьмите нормальный словарь, в котором ругань/брань стоит отдельным значением.

bay73 11 дек 2017 в 13:06

Мне-то как раз не надо. Мне и без словаря «ложный друг» помог. :)

martin_wanderer 15 дек 2017 в 09:59

А как насчет «профан», которое само по себе не самое нежное слово. Не знаю, насколько такая ассоциация помогает угадать смысл, не зная его, но мне во-всяком случае помогает вспоминать.

lair 15 дек 2017 в 10:04

… вот только если вы когда-нибудь встретите в английском тексте слово profane и попробуете его перевести "по ассоциации" со словом "профан" (в его неспециальном значении), вы сильно ошибетесь.

martin_wanderer 15 дек 2017 в 10:24

Оксфордский словарь утверждает, что profane — это 1) мирской, 2) неуважительный и только 2.2) обсценный. Мне кажется довольно очевидной ассоциация с нашим «профан», что есть «невежда».

Особенно с учетом того, что в английском есть слово profanation с абсолютно совпадающем смыслом.

lair 15 дек 2017 в 10:34

Мне кажется довольно очевидной ассоциация с нашим «профан», что есть «невежда».

Это ошибочная ассоциация. Profane music — это не "невежественная музыка", это "мирская музыка" (синоним — secular).

Особенно с учетом того, что в английском есть слово profanation с абсолютно совпадающем смыслом.

Не абсолютно. В русском языке слово "профанация" почти полностью потеряло религиозные корни (я не удивлюсь, если в этом смысле его только специалисты используют), в английском слово profanation напрямую отсылает к религии (и тот смысл, в котором мы его используем, сильно в конце списка).

vlivyur 10 дек 2017 в 15:52

Кому за 30 первое слово угадают с трёх нот.

bay73 7 дек 2017 в 23:30

Свободность общения практически не коррелирует с количеством выученных слов. Человек знающий сотню слов может быть более уверенным в общении, чем знающий 10000. И выбор конкретных слов тут не причём.

artmmslv 8 дек 2017 в 13:43

Вы, конечно, про Эллочку?

bay73 9 дек 2017 в 15:06

Нет, я про то, что заучивание слов никак не приближает к свободному общению.
Это не более чем реклама.

KiloLeo 8 дек 2017 в 17:59

Сотня слов — это только числительные и местоимения :-) Ну, в принципе, в магазине этого хватит :-)

Skyeng-Habr 11 дек 2017 в 09:45

Вы совершенно правы, что знания 3000 слов недостаточно для свободного общения. Необходимо слушать, читать, говорить, чтобы видеть как эти слова работают в контексте. Список 3000 слов — это не панацея, это скорее база, с которой стоит начать изучение языка и знание этих слов поможет лучше понимать письменную и устную речь.

НЛО прилетело и опубликовало эту надпись здесь

interprise 8 дек 2017 в 06:04

те забиваем на грамматику и тупо учим фразы? хороший подход, если у вас в голову вшит винчестер на пару терабайт.

НЛО прилетело и опубликовало эту надпись здесь

martin_wanderer 8 дек 2017 в 09:00

А восьмилетние дети грамматику знают? А говорить умеют?

lair 8 дек 2017 в 09:15

А восьмилетние дети грамматику знают?

Не знают, но умеют пользоваться (хотя, конечно, и не всегда правильно).

Беда в том, однако, что (а) вряд ли взрослый человек, хочет, чтобы его речь звучала, как речь восьмилетнего ребенка, и (б) то, как учились говорить восьмилетние дети, взрослому человеку не очень доступно.

martin_wanderer 8 дек 2017 в 12:27

Не знают, но умеют пользоваться

Собственно, я именно об этом: что практика использования языка первична по сравнению с теорией, что, конечно, не отменяет важности знания теории. В рельном общении ведь просто некогда думать как там строится страдательный залог или, скажем, сослогательное наклонение. Зато легко подражать виденному/слышанному в похожей ситуации.

lair 8 дек 2017 в 12:30

Собственно, я именно об этом: что практика использования языка первична по сравнению с теорией, что, конечно, не отменяет важности знания теории.

Как вы определяете "первичность"?

В рельном общении ведь просто некогда думать как там строится страдательный залог

Почему некогда? Люди вообще думают быстрее, чем говорят.

Зато легко подражать виденному/слышанному в похожей ситуации.

Это если вы (а) были в похожей ситуации (б) помните ее и (ц) можете определить критерии похожести.

martin_wanderer 8 дек 2017 в 12:39

Наверное, я медленно думаю. Во всяком случае у меня так: либо я знаю как сказать что-то ( не задумываясь; и еще может быть затруднюсь перевести это на русский ), либо мне надо вспоминать грамматику — и на это уйдет ощутимое время, да еще и ошибусь наверняка.

Не обязательно «были в похожей ситуации». Достаточно, скажем, «видели в кино».

lair 8 дек 2017 в 12:41

Не обязательно «были в похожей ситуации». Достаточно, скажем, «видели в кино».

У вас такая хорошая память, чтобы помнить все, что вы видели в кино? У меня — нет.

Что важнее, когда вы что-то "видите в кино" — как вы понимаете, что это такое, и какая у него область применения?

Keyten 17 ноя 2018 в 10:35

Английскую грамматику вполне можно понимать, а не помнить. Как математику. Тогда и вспоминается она мгновенно.

lair 8 дек 2017 в 08:18

Английскими словами можно пользоваться в определенном грамматическом порядке или системе. Это искусственный язык.

… это в какой момент английский стал искусственным языком?

REPISOT 8 дек 2017 в 03:03

У меня в словаре больше 3к. Но при этом, когда я строю предложение, мне не хватает слов. Какое же это свободное общение?

vlivyur 8 дек 2017 в 12:25

Я присоединюсь к вам. В моём словаре тоже много слов. Понимать ещё как-то понимаю, но как только доходит дело до сказать, то даже наличие этих слов никак не помогает — с грамматикой проблемы. Т.е. для чтения достаточно, но для свободного общения ещё очень далеко. И я понимаю что тот товарищ с 1500 словами просто напросто знает грамматику и неизвестное слово может об'яснить при помощи известных.
Да и по-отдельности знать слова тоже довольно бессмысленно, ибо предлоги (или другие слова) бывает очень хорошо меняют общий смысл на прямо противоположный. И это ещё как считать что ты знаешь какое-то иностранное слово — по иностранным словам считать или же по их переводам на русский? К примеру слова run, get, take, come — там только на чистые слова под сотню переводов, а если ещё предлоги добавить, то ещё и умножить можно на два смело.

marenkov 8 дек 2017 в 16:42

По себе скажу, что знание грамматики помогает только в письме. Во время разговора попросту не успеваешь строить нужные конструкции. Нужно не знание грамматики, а натренированная нейронная сеть, которая сходу выдает правильно построенные фразы, не особо вдаваясь в то, почему именно так. Так и разговаривают дети — грамматики они не знаю, но их сеть уже обучена на построение не слишком сложных фраз.

vlivyur 8 дек 2017 в 17:52

Само-собой что правила вспоминаются легче, когда над душой никто не стоит и временем не ограничен. Хотя бы на письме, но есть возможность по-тренироваться. Хуже когда ты и в письме еле-еле слова расставляешь и на времена не обращаешь внимания. Но если твой «акцент» никто не понял, то у тебя в любом случае есть ещё пара-тройка секунд, чтоб собраться с мыслями, вспомнить правила и перестроить фразу, пока они морщат лоб в попытках понять тебя.

Skyeng-Habr 11 дек 2017 в 10:28

Список частотных слова — это база, с которой стоит начать изучение языка. Он поможет лучше понимать письменную и устную речь, а также задаст направление в развитии разговорных навыков. Безусловно, у слова take много значений, также он является частью фразовых глаголов, устойчивых выражений и идиом. Но если вы знаете, что глагол take входит в список самых частотных слов, а вот, например, глагол switch нет, то это даст вам понимание, что лучше сначала обратить внимание на все распространенные вариации использования глагола take, а после уже перейти к switch.

martin_wanderer 8 дек 2017 в 12:29

Так это же разные словарные запасы: активный и пассивный. И слов, которые мы понимаем, гораздо больше, чем тех, что активно используем.

grumegargler 8 дек 2017 в 15:52

Плюс, на мой взгляд, еще имеет значение насколько хорошо вы владеете своим родным языком. Если ваша речь богата, фразы разнообразны, вы публикуетесь, способны быстро, свободно и красиво излагать мысли на своем языке, то научиться говорить на иностранном будет сложнее, при том же запасе в 3000 слов, чем у индивидуума с речью попроще.

Ontaelio 8 дек 2017 в 16:32

На мой взгляд, если речь идет просто о «говорить», а не писать статьи, то хорошие навыки родного языка изрядно помогут и в иностранном — просто потому, что вы сможете собирать вполне осмысленные и грамотные предложения из известных слов; даже если местами эти слова будут не совсем точны, собеседник вас прекрасно поймет. Люди, не очень хорошо владеющие родным языком, в иностранном, как правило, пытаются вспомнить точный перевод того, что хотят сказать, и не пытаются импровизировать.

grumegargler 8 дек 2017 в 17:08

Да, и тут всё индивидуально. Я исхожу из своей практики, например, банальщина, коллега меня спрашивает: -Как дела? (how are you?). На русском, в зависимости от ситуации, мне нередко приходят фразы типа: «ну не так что бы уж очень и не то чтобы уж совсем», либо «как говорил мальчиш-кибальчиш, всё хорошо, да что-то не хорошо». На английском, я «спотыкаюсь» и просто отвечаю: same old, same old либо просто «no bad», что не совсем верно отражает исходную мысль. То есть для английского, мне приходилось либо упрощать речь, либо искать аналоги выражениям. То есть в итоге, я тратил больше времени, чем, например, некоторые знакомые, которые просто не парятся, и выстреливают слова формируя максимально простые фразы, потому что они почти также и думают (не хочу никого обидеть, и без претензий на грамотея, но уровень владения родным языком у людей разный).
Конечно, всё больше овладевая языком, такие переводы с русского уже не делаются, и неродная речь становится действительно богаче, но, на это уходит больше времени. Другими словами, чтобы свободно начать говорить на иностранном языке, кроме массы других факторов, мне кажется немаловажным и то, как именно мы думаем и говорим на своем родном языке.

Ontaelio 8 дек 2017 в 19:26

Мне кажется, что вот эти вещи приходят из практики: книг, общения. И тут важно богатство именно этой практики, а не знания родного языка. Хотя, конечно, если на своем языке у человека словарь Эллочки Людоедки, едва ли он внезапно начнет витиевато выражаться по-английски только потому, что начитался Вудхауза.

Areso 8 дек 2017 в 03:27

У меня словарный запас около 10 тысяч. Это соответствует носителю языка в 10 или 11 летнем возрасте. Однако носитель, обычно, к этому возрасту уже устойчиво правильно применяет грамматику (даже если не знает ее), а у меня с грамматикой бывают проблемы.

Pilat 8 дек 2017 в 05:06

Я проверил лексику переписывающихся со мной — действительно, 90% попали в список, остальные более-менее специфические термины.

geher 8 дек 2017 в 05:36

Каки-то слишком оптимистичные данные по среднему словарному запасу.
Я где-то читал другое — 10000 — 15000 слов у носителей. Похоже, что исследователи сознательно отсекают определенные слои общества.

cbgx74 8 дек 2017 в 05:56

Я выучил 25000 слов, но вот поговорить обо всем, что я хочу на английском я не могу.

Мне встречалась статистика западных исследований, говорящая о том, что восьмиклассник отличник знает 25.000 слов, отличник первокурсник около 50.000. Выпуск лиги плюща около 80.000. Это пассивный словарь.

Pilat 8 дек 2017 в 06:38

Что интересно, Donald Trump не входит в топ-3000 в обоих списках. Что говорит о том, что составлялись они давно и, возможно, сейчас неактуальны.

Areso 8 дек 2017 в 08:10

Туда имена собственные, как правило, не включают. Хотя некоторые составители могут и включить.

marenkov 8 дек 2017 в 16:46

Было бы не плохо, если бы эти топ-3000 входили в мистера Трампа.

tSmoker 8 дек 2017 в 07:03

В университете английский был одним из профилирующих предметов. В школе до этого учил немецкий. К началу обучения английскому, мой словарный запас состоял из слов/фраз вроде «options», «start game», «control setings»(с соответствующим произношением). Но уже через пол года английского по 12 часов в неделю(это только в университете), я практически без проблем общался с девчонкой из США, приехавшей к нам на новогодние каникулы. Сомневаюсь, что мой словарный запас был тогда больше 1000 слов(английский мне плохо давался). Философских бесед мы конечно не вели, но простое «бытовое» общение давалось очень легко.
А 3000 тысячи, позволят обращаться к словарику довольно редко. Но опять-же если текст не специфичен.

laughman 8 дек 2017 в 08:04

Есть хорошее предложение для запоминания слов для андроид? Чтобы можно было убирать те, что точно знаешь, а остальные были с транскрипцией, с вовлечением в обороты и предложения, со словесными мини-играми (ввести слово, расставить соответствие, мини-кроссворд где хотя бы 60% изученных, и т.д. ), с озвучкой, с учетом частотности (разделить слова на «слои», первый слой — самые частые 3000 слов, далее по возрастанию редкости использования слов), и если не бесплатно, то хотя бы недорого? Я пробовал недавно несколько топовых предложений плеймаркета, но даже примерно близкого к описанному не нашел, а денег хотят многие, если не все из них.

Areso 8 дек 2017 в 08:10

Anki. Бесплатно, существует куча словарей. Но немного проще функционал.

acsent1 8 дек 2017 в 09:16

Мне нравится такое, но это уже для среднего уровня
play.google.com/store/apps/details?id=io.lingvist.android&hl=ru

Pentoxide 8 дек 2017 в 09:36

А где подобное можно взять для других языков?

Alek_roebuck 8 дек 2017 в 10:23

Разные исследования по-разному оценивают словарный запас у детей 5-6 лет (это нулёвка американских школ — возможно, поэтому и рассматривают обычно именно этот возраст).

Так, Seashore в 1947 насчитал 9600 слов, Watts (1950) — в 4000-7000, Smith (1926) — в 2100, Baker (1997) — в 2500-5000, есть оценки в полторы тысячи слов, что выглядит абсурдно. Как правило, в этих исследованиях низкие цифры — это активный словарный запас, то, что ребенок реально произносит, а высокие — то, что он правильно понимает, но сам не использует.

Взрослый человек по разным подсчетам владеет от 20 до 100 тыс. слов.

Не знаю, насколько русский можно распространить на английский: слов в русском языке гораздо меньше, кроме того, русские гораздо ровнее понимают тексты, чем англичане или американцы. Трудно представить себе взрослого русского, не понимающего многие предложения в газете. Но зато на русском нам будет проще понять, что в высоких цифрах объема словарного запаса среднего человека нет ошибки. Откройте словарь Ожегова. В зависимости от издания, там 60-80 тыс слов. Откройте наугад десяток страниц и просмотрите на них все слова. Вероятно, вы не встретите ни одного незнакомого слова, максимум — десяток. Получается, вы знаете минимум 50 тыс русских слов, и это только те, что попали в словарь. Разговорные, профессиональные, ругательные, новые, устаревшие и прочие слова вы знаете, но в словаре их нет. В английском примерно то же самое. Я, например, по оценкам каких-то онлайновых тестирований, знаю примерно 25 тыс английских слов, и все-таки практически в каждом абзаце письменной и в каждой длинной фразе устной речи наталкиваюсь на незнакомое слово. Буквально сейчас читаю «Янки из Коннектикута», примерно каждое десятое слово незнакомое или напрочь забытое, а ведь по-русски я понимал почти всё ещё в детстве.

Так что оценка в 25 тыс для «образованного взрослого» явно заниженная. Советский двухтомный «Большой англо-русский словарь» на базе Мюллера содержит более 200 тыс словарных статей, и из них носитель языка знает (в пассиве) не меньше половины. Кроме того, если верить С. Пинкеру, образованность не особо влияет на объем словарного запаса. Пинкер утверждает, будто вообще не влияет, хотя я ему не верю.

Короче, 3000 самых частотных слов для изучения английского — это замечательно, это гораздо лучше, чем 3000 редких. Прекрасная идея напирать на самые частотные слова и выражения. Но 3000 даже близко не хватит для хорошего понимания или свободного общения.

bagrintsev 8 дек 2017 в 10:54

Где можно взять эти три тысячи слов?
Хочу напечатать на карточках и выучить!
Киньте ссылкой плз

Skyeng-Habr 8 дек 2017 в 10:56

Ну оксфордский, например, тут www.oxfordlearnersdictionaries.com/about/oxford3000 (ссылка из текста).

Areso 8 дек 2017 в 11:04

Оттуда чтобы их выбрать, придется скрипт-краулер писать.

Ontaelio 8 дек 2017 в 11:16

ну вот такое еще нашлось: www.smartcom.vn/the_oxford_3000.pdf

beetleinweb 8 дек 2017 в 18:28

Первая мысль была такая же. Вторая мысль — «наверняка это кто-то уже сделал». И дальше — гуглим. Причем после «oxford 3000» гугл уже сам подсказывает «word list».
Там на гитхабе ещё кнопочка Raw есть, чтобы совсем уж легко сохранить как текст.

github.com/OliverCollins/Oxford-3000-Word-List/blob/master/Oxford%203000%20Word%20List.txt

Areso 9 дек 2017 в 04:29

Это список, а по ссылке от Skyeng-Habr — на каждом слове доступны словарные статьи.

immaculate 8 дек 2017 в 12:13

В Oxford 3000 два раза встретилось слово "ally". Значит, на самом деле, их всего лишь 2999. :)

McAaron 8 дек 2017 в 12:26

Смешно. Кроме слов нужно знать грамматику.
Ради примера, где для понимания требуется знать на порядок больше, чем набор слов, можно взять, например (у меня сейчас на столе), «AMD64 Architectutre. Programmer's Manual. Vol.1: Application Programming».

DarkTiger 9 дек 2017 в 12:37

Не готов говорить по AMD-шным, но Интеловские мануалы такого рода легко читаются с 500-700 слов в запасе, да и грамматика там, прямо скажем, не Шекспировская.
Что понятно, поскольку подобные документы, в основном, ненативные оутсорсеры пишут.

KvanTTT 11 дек 2017 в 01:00

Грамматика не Шекспировская потому что текст весьма строг и сух в таких документах.

DarkTiger 9 дек 2017 в 12:38

vlivyur 10 дек 2017 в 15:54

Я знаю человека, который английские мануалы читал имея только немецкий в запасе.

bay73 11 дек 2017 в 09:53

Когда я был студентом научный руководитель подкинул мне для чтения статьи на шести языках (а я и английский-то понимал с трудом). И ничего — справился со всеми :)
Тяжелее всего с китайским было — там разобрал только формулы, но смысл статьи был в целом понятен.

lair 11 дек 2017 в 10:33

… не пробовали читать статьи без формул?

KiloLeo 8 дек 2017 в 16:48

По своему опыту скажу, что после около 3000 стал читать почти любые тексты без словаря. Главное, чтобы это были именно те 3000. 2000 самых нужных мне я сам тогда выписал, читая литературу, а примерно 1000 знал из школы.

Alek_roebuck 8 дек 2017 в 23:37

Возьмем наугад детскую книгу. Например, «The Wind in the Willows». Считается, что она примерно для семилетних детей, хотя по меркам современной английской литературы она несколько сложновата и в плане языка подходит пятикласснику. В ней 60 тыс слов, из них 6700 разных. Сделаем поправку на словоформы, коих в английском не так много: вслепую выкинем все окончания -s, -es, -ed, -ing, -ly. Остается 5 тысяч уникальных слов. Допустим, мы где-то облажались, и на самом деле там только четыре тысячи. Получается, целую тысячу слов в шестидесятитысячном детском произведении наш читатель, освоивший 3000 слов, не поймет.

Возьмем детский текст посовременнее и попроще. «Charlotte's Web» — 2900 слов. Допустим, на самом деле еще меньше, где-нибудь 2000. Как думаете, сколько из них совпадают с вашими 3000 самыми частотными?

Возьмем современную взрослую массовую литературу типа Марининой: Джон Гришем, «The Firm». 140 тысяч слов, из них после обрезания конечных (es|s|ed|ing|ly) остается 6800 уникальных.

По «Гарри Поттеру» я сам считать не стал, процитирую чью-ту чужую работу (стемминг там не использовался, так что делите на полтора):

The number of unique words also increases with the series. In HP 1 there are 5687 unique words compared to 12624 unique words in HP 5, so the writing is more sophisticated or J.K. Rowling is introducing new words (could be character names, new locations, spells, etc.) to readers.

А теперь что-нибудь серьезное.
Апдайк, «Кролик, беги», 106 тыс слов, из них 7 тыс уникальных.
Драйзер, «Американская трагедия», 360 тыс слов, 10 тыс уникальных.
Беллоу, «Герцог», 130 тыс слов, 10 тыс уникальных.
Дос Пассос, «42 параллель»: полмиллиона слов, 18 тыс уникальных.

И эти наборы слов не совпадают. Если взять все четыре вышеназванные книги, то будет уже 27 тыс уникальных слов.

KiloLeo 9 дек 2017 в 14:42

Вы считаете слишком механистически, а я делюсь лишь личным опытом изучения двух иностранных языков. Следует учесть ещё следующие факторы
— 3000 слов — критический рубеж, позволяющий без словаря читать и догадываться о смысле не знакомых слов по контексту
— есть масса производных слов, образованных из известных, (wonder-wonderful, doubt-doubtful, conductor — semiconductor, sonic — supresonic, division — sudivision и пр.), которые вам известны, даже если вы их не включили в 3000
— имена собственные и географические названия, не требующие перевода
— аналоги русских англицизмов и латинизмов (computer, integration, submarine, stop, machine) и производных от них, которые не требуется даже выписывать и учить
— прочие слова о смысле которых легко догадаться (computer — compute — computational)
— приставки (understanding — misunderstanding, expected — unexpected)
— технические термины, которые часто одинаковы во многих языках

lair 10 дек 2017 в 07:29

Ну то есть пассив-то у вас, на самом деле, сильно больше, чем 3000 слов (особенно учитывая, что вы знаете, что conductor — это не только проводник, который билеты в проверяет, и что semi — это половина).

Но я подозреваю, что (реальная) разница у вас и вашего оппонента в том, какие тексты читать, и в том, сколько позволять себе "додумывать".

KiloLeo 10 дек 2017 в 19:30

Да, примерно так. Только я не знал, что semiconductor — это полупроводник, а догадался, когда встретил это слово и пытался понять текст без словаря. Догадываться по контексту — очень полезно при освоении языка.

lair 10 дек 2017 в 21:57

Догадываться по контексту — очень полезно при освоении языка.

Несомненно, но далеко не всегда работает. Особенно в худлите.

Skyeng-Habr 11 дек 2017 в 10:42

Возьмем пример Гарри Поттера. В число уникальных слов будут входить magic wand, cast a spell и т.д. Если вы фанат Гарри Поттера и фантастической литературы в общем, конечно, здорово знать такие фразы и выражения, но в повседневном разговоре или при чтении текста на какую-то другую тематику они вряд ли пригодятся. А частотные слова из списков встречаются, как в Гарри Поттере, так и в разговоре в магазине или в газетной статье. Безусловно, мы не говорим о том, что можно выучить 3000 слов и остановиться, решив, что этого достаточно. Это база, с которой нужно начинать изучение языка, а затем добавлять слова, связанные с вашей работой или интересами. Поэтому подобные списки особенно полезны тем, кто только начинает изучение языка. Если вы уже владеете английским на высоком уровне, вам может быть интересно просто просмотреть список и понять, все ли частотные слова вам знакомы.

lair 11 дек 2017 в 10:45

В число уникальных слов будут входить magic wand, cast a spell и т.д. Если вы фанат Гарри Поттера и фантастической литературы в общем, конечно, здорово знать такие фразы и выражения, но в повседневном разговоре или при чтении текста на какую-то другую тематику они вряд ли пригодятся

То есть вы никогда не слышали в повседневной речи фразы she cast a spell on them?

Skyeng-Habr 11 дек 2017 в 11:02

В повседневных разговорах эта фраза встречается совсем не часто и на начальном этапе изучения языка вполне можно отдать предпочтение более распространенным и практичным выражениям.

lair 11 дек 2017 в 11:05

Есть разница между "отдать предпочтение" и "они вам вряд ли пригодятся". И да, "повседневные разговоры" зависят от собеседника (а "текст на другую тематику" — от автора).

ka10k 8 дек 2017 в 18:44

Чтобы «свободно общаться на английском» нужно общаться на английском. Выучив 3000 слов вы сможете в процессе разговора или чтения в лучшем случае вспоминать/понимать что вам говорят или что читаете. Это пост призван для привлечения клиентов. Не более и не менее того. Фильмы в оригинале вам тоже не помогут говорить. Все просто. Хотите разговаривать — нужно практиковать спикинг, понимать что говорят — лисенинг и тд. Простое тупое заучивание 3к слов и базовой грамматики из 5ти наиболее часто используемых времен вам не дадут желаемого результата. У меня все.

Ontaelio 8 дек 2017 в 19:22

Помнится, изучение английского в советской спецшколе начиналось с грампластинки про алфавит, потом базовый словарь и базовая грамматика, потом все посложнее, и так девять лет. Где-то к десятому классу можно было начать пробовать читать неадаптированную литературу (не Джойса, конечно, но хотя бы Агату Кристи). Конечно, чтобы свободно общаться, нужна практика (так же как и для «свободно читать», «свободно писать» и «смотреть кино без перевода»), но это уже совсем другая история. Базу никто не отменял, а это какой-то словарь и какая-то грамматика. Лучше, чтобы словарь был максимально эффективный, все остальное придет по мере надобности.

Skyeng-Habr 11 дек 2017 в 10:48

Вы совершенно правы, что для свободного общения нужна практика языка. Нужно видеть как слова работают в контексте, а для этого слушать, читать и говорить на английском. Мы не говорим, что заучивание слов — это путь к овладению языком. Мы говорим, что для того, чтобы начать говорить нужно иметь хоть какую-то базу из слов. И вот, когда вы думаете, а какие же слова учить в первую очередь, на помощь приходит список самых частотных слов. Это та самая база, с которой начинается изучение языка, а потом вы можете добавлять слова, связанные с вашей работой, увлечениями, возможно выражения, типичные для людей, с которыми вы общаетесь на английском.

martin_wanderer 15 дек 2017 в 09:46

Было исследование, где показывали, что для лисенинг и спикинг — взаимосвязанные умения. Что оба навыка вместе развиваются быстрее, чем по отдельности. Хотя, конечно, «чтобы научиться плавать, нужно плавать».

AlexanderAnisimov 8 дек 2017 в 19:55

Вы меня извините, но такой анализ словарного запаса и fluency не выглядит достаточно осмысленным.
Способность свободно выражать мысли определяется не только знанием отдельных слов, но и навыком применения фразовых глаголов и речевых оборотов.
Если я знаю слова «get» & «done» то само по себе мне это никак не поможет выразить мысль, которая выражается фразой «get smth done». Что бы выразить такую мысль мне нужно знать именно эту фразу, а не отдельные слова, которые ее составляют.
Т.е. можно знать хоть 100000 отдельных слов, но если при этом не знаешь фразовых глаголов, то с точки зрения fluency можно так и остаться посредственностью. Поэтому мне кажется не очень полезным составлять частотные словари и анализировать словарный запас в таком виде как это предлагается в статье.
Мне кажется в идеале в частотном словаре должны быть упорядочены некие «лексические единицы» — такой единицей может быть либо слово, либо фразовый глагол, либо устойчивое словосочетание. Это, конечно, из области фантастики, но кто знает, может быть компьютерная лингвистика когда-нибудь найдет способ сделать сказку былью.
В связи с этим чем лично я пытаюсь заниматься: беру литературу и выписываю из нее «разговорные фразы» которые лично мне кажутся потенциально полезными (типа «are you in the middle of something?» ~~или «estirar la pata»~~). Т.е. пытаюсь составлять разговорник, кастомизированный для моего текущего уровня словарного запаса и навыков.
Отдельные слова в таких фразах в 96% случаев не будут для меня новыми, а полезными для fluency являются как раз неочевидные сочетания этих слов передающие определенный смысл.
Дальше нужно понять как это лучше вызубрить и «перевести в актив»…

Skyeng-Habr 11 дек 2017 в 10:57

Вы совершенно правы, что для свободного общения недостаточно знание отдельных слов. Нужно знать, как эти слова употреблять в контексте. Но когда вы находитесь в самом начале изучения языка, список частотных слов может указать направление. Например, если вы знаете, что глагол take намного более частотный, чем глагол switch, это подсказывает вам, что стоит обратить внимание в первую очередь, на распространенные вариации использования в контексте глагола take, а затем уже перейти к глаголу switch.

AlexanderAnisimov 11 дек 2017 в 18:41

Во-первых, в заголовке статьи у вас написано про свободное общение и в самой статье написано про знание 1500-3000 слов. Это не имеет никакого отношения к самому начальному уровню. Это вопрос перехода с В1 на В2. Т.е. подзаголовок вашей статьи должен быть таким: Что нужно сделать со словарным запасом что бы перейти с В1 на В2. И вы даете на этот вопрос неправильный ответ — учить слова по частотному словарю. Это может ввести кого-то в заблуждение. Я что хочу сказать: двигаться нужно не по частотному словарю отдельных слов, а по частотному словарю фразовых глаголов и сходных с ними оборотов. А ввиду отсутствия в природе такого словаря (такой словарь это умозрительная конструкция — как Random Oracle в криптографии) нужно изобретать какие-то костыли на свой вкус и цвет.
Во-вторых, не соглашусь с логикой что если take сам по себе является частотным то и обороты с ним нужно учить с большим приоритетом чем обороты со switch. Очевидно ведь что switch on-off является более частотным и приоритетным чем множество (большинство?) оборотов с take, типа take over или take smth for granted.
Ещё раз повторю свой поинт: нужен частотный словарь в котором будут упорядочены слова и обороты:
1. take (сам по себе, без учета его вхождений во фразовые глаголы)
2. switch (сам по себе, без учета его вхождений во фразовые глаголы)
3. switch on
4. switch off
5. take over
6. take smth for granted
И вот по такому словарю надо двигаться, а не по частотному словарю отдельных слов.

tivita 9 дек 2017 в 20:50

Идея заучивания перевода иностранных слов как основного занятия при изучении иностранного языка не подтверждатеся практикой.
Большинство слов в любом языке, кроме разве точных научных терминов и имен собственных, имеют в разных языках сильно отличающиеся семантические поля, сочтетаемость, управление и прочее. Однозначные соответствия скорее исключение, чем правило.
Разнообразные программы и методы по заучивнию слов исходят из совершенно наивной предпосылки что у каждого иностранного слова есть четкий и однозначный перевод. Поэтому изучение вырванного из контекста отдельного значения слова, как предлагается в большинстве сервисов такого типа, — скорее ритуал, чем реально полезное занятие.
Вот и в вашем примере an attitude — это не только отношение, а и позиция, поза, положение, стойка, осанка, положение. Причем и в прямом смысле, по отношению к телу, и в переносном, по отношению к мыслям, идеям и убеждениям.
И это просто многозначное слово с близкими значениями. А в случае омонимии вообще все запутывается окончательно…
Вот и получаются после такого изучения фразы типа:
«I have bought in the lake...» — Я покупался в озере…
«Я к вам пишу, чего же боле» — I am pissing on you…

ALexhha 13 дек 2017 в 16:26

А потом получаем ситуацию — «У всех разговорников есть один фатальный недостаток — они не учитывают то, что вам могут и ответить» (с)

Конечно для общения нужен словарный запас, но так как англ-кий очень контекстно зависимый, а так же что они очень любят идиомы, то знание слов самих по себе мало что будет вам давать в реальном общении с носителями языка.

Skyeng-Habr 18 дек 2017 в 15:45

Вы абсолютно правы, освоение 3000 слов не приравнивается к свободному владению языком. Тем не менее тот, кто учил частотные слова легче читает тексты в New York Times, смотрит BBC и общается с носителями. Со списком 3000 слов легче приоритизировать на что тратить собственные ресурсы, особенно если вы еще не дошли до уровня Intermediate.

lair 18 дек 2017 в 15:56

Тогда зачем же вы в заголовке пишете "Сколько английских слов надо выучить для свободного общения и чтения статей?"

Ontaelio 19 дек 2017 в 09:15

Все-таки общение и владение — разные вещи. Общаться (и уж тем более понимать) можно и с минимальным знанием грамматики, тут главное словарный запас — могу сказать по собственному опыту с чешским и латышским. А вот, например, писать письма — тут надо знать грамматику, а слова можно и в словаре посмотреть.

lair 19 дек 2017 в 09:20

Общаться (и уж тем более понимать) можно и с минимальным знанием грамматики, тут главное словарный запас — могу сказать по собственному опыту с чешским и латышским.

Так мы о словарном запасе и говорим, вроде как.

Ruddymetor 15 дек 2017 в 05:55

Много фишек с устойчивыми выражениями и фразовыми глаголами. С опытом все приходит. Эх, мне еще многое надо постигнуть

Skyeng-Habr 18 дек 2017 в 15:49

Так приходите в Skyeng, с нами учить язык в разы эффективнее

ka10k 22 дек 2017 в 15:31

Сделайте адекватные цены, тогда люди пойдут. Дешевле носителя по скайпу нанять чем у вас учиться.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий