Некоторое время назад у меня появилась идея КАК можно качественно улучшить и закрепить свои знания иностранного языка. Ею и хочу поделиться ниже. Возможно, сама идея далеко не нова и, возможно, давно уже реализована в том или ином виде, тогда буду признателен за наводку и ссылки. Самому же мне пока ничего подобного найти не удалось.
Далее в тексте для простоты я буду говорить об английском языке, но вместо слова «английский» можно подставить любой другой иностранный язык, смысл от этого не изменится.
Суть моей идеи состоит в следующем. Думаю, многие согласятся, что одним из лучших способов повышения уровня понимания устной английской речи является просмотр иностранных фильмов, прослушивание аудиокниг или же подкастов на английском. Если же говорить о понимании языка в общем, то к этому списку можно еще добавить статьи, газеты, обычные книги, блоги и т.п. Чем больше мы будем читать и слушать — тем лучше будет развит наш навык понимания языка на уровне интуиции, не прибегая к «переводу в голове».
Но основная проблема обучения по такому методу в том, что когда мы встречаем незнакомые слова или словосочетания в новом тексте нам приходится отвлекаться от чтения книги (просмотра фильма) и лезть в словарик за переводом. И если в случае с текстом периодическое «прерывание на словарик» еще можно стерпеть (хотя это может оказаться очень раздражающим фактором при большом проценте незнакомой лексики), то в случае с фильмом или аудиокнигой частые прерывания просто убивают все желание продолжать просмотр или прослушивание.
Поэтому мне кажется, что было бы очень неплохо иметь возможность заранее узнать какие незнакомые слова (или даже правила грамматики) встретятся в просматриваемом фильме (читаемой книге). После чего можно подробно изучить всю неизвестную лексику и грамматику и спокойно приняться за любимое дело, не отвлекаясь уже в каждом новом абзаце на неизвестные выражения.
Подумав над этим я решил создать небольшую программу, которая бы могла делать следующее:
В программе имеется несколько словарей. Один большой — основной, который содержит все слова выученные пользователем, остальные — учебные, которые привязаны к какому-то конкретному тексту, и в них как раз и попадает незнакомая лексика, найденная в текстах. После того как пользователь выучил слово(а) из какого-либо учебного словаря, он помечает его как «знакомое», и слово автоматически заносится в основной словарь. В дальнейшем при сканировании новых текстов программа уже не будет учитывать выученные слова и будет выбирать лишь новые и незнакомые, которых еще нет в основном словаре.
Естественно так же нужно подумать о различных функциях работы со словарями. Т.е. о возможности печати, самопроверки и прочих «вкусностях», но это уже нюансы.
Интересно мнение Хабрасообщества по поводу данной идеи. Возможно, кто-то сможет посоветовать какие либо алгоритмы или библиотеки для анализа текста (имею ввиду грамматику), так как самому пока еще с такими задачами работать не приходилось. На первом этапе основной проблемой я думаю является нахождение устойчивых выражений в тексте типа «go out». Так как слова составляющие подобные словосочетания не обязательно должны находится рядом, и не сразу очевидно, что они являются цельной грамматической конструкцией.
Буду рад вашим комментариям.
Далее в тексте для простоты я буду говорить об английском языке, но вместо слова «английский» можно подставить любой другой иностранный язык, смысл от этого не изменится.
Суть моей идеи состоит в следующем. Думаю, многие согласятся, что одним из лучших способов повышения уровня понимания устной английской речи является просмотр иностранных фильмов, прослушивание аудиокниг или же подкастов на английском. Если же говорить о понимании языка в общем, то к этому списку можно еще добавить статьи, газеты, обычные книги, блоги и т.п. Чем больше мы будем читать и слушать — тем лучше будет развит наш навык понимания языка на уровне интуиции, не прибегая к «переводу в голове».
Но основная проблема обучения по такому методу в том, что когда мы встречаем незнакомые слова или словосочетания в новом тексте нам приходится отвлекаться от чтения книги (просмотра фильма) и лезть в словарик за переводом. И если в случае с текстом периодическое «прерывание на словарик» еще можно стерпеть (хотя это может оказаться очень раздражающим фактором при большом проценте незнакомой лексики), то в случае с фильмом или аудиокнигой частые прерывания просто убивают все желание продолжать просмотр или прослушивание.
Поэтому мне кажется, что было бы очень неплохо иметь возможность заранее узнать какие незнакомые слова (или даже правила грамматики) встретятся в просматриваемом фильме (читаемой книге). После чего можно подробно изучить всю неизвестную лексику и грамматику и спокойно приняться за любимое дело, не отвлекаясь уже в каждом новом абзаце на неизвестные выражения.
Подумав над этим я решил создать небольшую программу, которая бы могла делать следующее:
- принимать на вход текст на английском языке (в качестве текста могут быть и субтитры к фильму);
- находить в тексте незнакомые пользователю словосочетания и, возможно, грамматические конструкции;
- автоматически делать перевод всех новых найденных слов и словосочетаний (например, с помощью Google Translate);
- уметь запоминать слова, которые пользователь уже выучил.
В программе имеется несколько словарей. Один большой — основной, который содержит все слова выученные пользователем, остальные — учебные, которые привязаны к какому-то конкретному тексту, и в них как раз и попадает незнакомая лексика, найденная в текстах. После того как пользователь выучил слово(а) из какого-либо учебного словаря, он помечает его как «знакомое», и слово автоматически заносится в основной словарь. В дальнейшем при сканировании новых текстов программа уже не будет учитывать выученные слова и будет выбирать лишь новые и незнакомые, которых еще нет в основном словаре.
Естественно так же нужно подумать о различных функциях работы со словарями. Т.е. о возможности печати, самопроверки и прочих «вкусностях», но это уже нюансы.
Интересно мнение Хабрасообщества по поводу данной идеи. Возможно, кто-то сможет посоветовать какие либо алгоритмы или библиотеки для анализа текста (имею ввиду грамматику), так как самому пока еще с такими задачами работать не приходилось. На первом этапе основной проблемой я думаю является нахождение устойчивых выражений в тексте типа «go out». Так как слова составляющие подобные словосочетания не обязательно должны находится рядом, и не сразу очевидно, что они являются цельной грамматической конструкцией.
Буду рад вашим комментариям.