Частотный анализ украинского языка

    Понадобилась мне для благого дела таблица частот пар букв (так называемых биграмм или диграмм) для украинского языка. Причем не просто украинского языка, а современного живого интернет-языка, именного того, на котором происходит современное общение в украиноязычной среде. Единственные известные мне результаты были построены на довольно малой выборке, отличной от того, что мне нужно было, да и серьезная преобработка текста в них могла повлиять на результат (и наверное таки повлияла, но об этом далее).

    Задача в общем не сложная, единственной серьезной проблемой является источник материала для обработки — того самого большого куска текста, который можно перелопатить.

    Первая идея была сдампить кусок какого-то IRC канала. К сожалению ни одного активного живого флейма с отсечкой по языку я не нашел.

    Следующая идея: форум.

    В качестве жертвы был выбрано несколько больших украиноязычных форумов. Все админы на просьбу о дампе текстовой части из базы отреагировали негативно, а некоторые даже довольно резко…

    … Сами виноваты, сказал я и запустил wget.

    Собственно проблем особых не было. Убедится в том, что wget тянет только то, что нужно (только страницы форума, не страницы отдельных сообщений — на форуме-жертве была и такая опция), чуток подтянуть знание powershell-а чтобы перегрести тонну полученых страниц из html в xhtml где-то найденной одноименной утилиткой, опять таки чуток подтянуть xslt для того, чтобы выгрести нужные текстовые элементы, и одновременно отсечь цитаты, а также повторяемые элементы. Результат этого дела уже можно было анализировать, для чего была создана маленькая программа на C#. В целом это все заняло две недели по несколько минут-часов в день.

    Немного о результатах.

    При помощи wget-а было выкачано около двух гигабайт чистого html, что заняло около полутора суток (точнее не скажу, файлов уже нет:))
    После отсечки всех вспомогательных страниц, индексов, содержаний и форумов, перегонки в xhtml и отсечки файлов содержащих ошибки получилось 49492 файла общим размером 2.2GB.
    После прогона xslt количество файлов не изменилось, а вот объем уменьшился существенно — до 160MB, при том все равно большую часть этого объема составляют пробелы, оставшиеся после xslt. Чистый размер после удаления сдвоенных пробельных символов, собственно база обработанного текста — 65 525 151 символ, более чем в 10 раз больше чем в предыдущем исследовании.

    Собственно результат можно посмотреть здесь. В архиве четыре файла: соответственно обработанный и сырой диграммный и монограммный результаты. Из обработанных результатов выброшено все не относящиеся собственно к алфавиту украинского языка + диграммный результат превращен в таблицу. Если сравнивать с предыдущими результатами, видим отличия уже в первой десятке. Единственное предположение о таком различии состоит в том, что в упомянутом исследовании формы слова канонизировались.

    Ниже на рисунке сравнительный график частот букв в русском и украиснком языках по фонетическому критерию:


    Открытые вопросы.

    1. Отсечка включений на сторонних языках. В основном — русский, английский. Их немного, но все-таки заметно. Даже исходя из того, что можна резать пост по наличию в нему букв из других алфавитов, гарантировать точность результата все равно нельзя. Можно написать довольно длинную строку по-русски, которая не будет содержать ни единого символа отсутствующего в украинском алфавите. И предыдущих четыре предложения тому в подтверждение.

    2. Редкие символы «ґ» и «’» (апостроф). Первый практически повсеместно заменяется на «г», поскольку «ґ» на большинстве клавиатур отсутствует как клас, а способ набора через AltGr практически неизвестен. Более того, буква очень сама по себе очень редкая, а много людей так и не привыкли к ней (она была возвращена в алфавит в 1990 году).
    В качестве апострофа (аналог русского твердого знака) в основном используется единичная кавычка «'» (что типографически неправильно), но поскольку она отсутствует в раскладках на старых версиях винды, а в новых очень очевидно находиться под эскейпом, также повально или пропускается, или заменяется на любой другой подходящий (или не очень) символ, например звездочку. При анализе я принимал в качестве апострофа единичную кавычку, но результаты в таблицах явно показывают, что она используется не только в качестве апострофа (апостроф по правилам должен идти после б, п, в, м, ф, р и перед я, ю, є, ї. В таблице же видно множество других вхождений).

    Заключение.

    Надеюсь результаты, размещенные в топике будут кому-то нужны или интересны.
    … Ну и одновременно буду рад идеям решения двух открытых проблем.
    Поделиться публикацией

    Комментарии 152

      +10
      Статье не хватает графиков
        0
        Да здесь собственно нечего представлять графически. В принципе можно частотную таблицу монограмм представить в виде столбцовой диаграммы, но только ради того, чтобы было. Полезность такого представления сомнительна.
          +2
          Хотя бы одной простой диаграммы с частотами по буквам. А лучше двух — для украинского и для русского.
            +2
            Готово
              +6
              теперь значительно лучше
                +1
                а чем объясняется такой разброс между є/е е/э
                  0
                  В украинском очень часто используеться «е», (звучит как русское «э»), собственно «є» (русское «е») довольно редкое. В русском же — наоборот. Поэтому и разброс. То же, чуть менее выражено в парах і/и — и/ы и г/ґ (в даном случае в русском алфавите вообще нет аналога украинского г).
                    +1
                    Думаю, это связанно с тем, что много русских и украинских слов имеют похожее написание, но при этом читаются буквы по разному. Пример, укр. «дерево» читается как «дэрэво». Т.е. фактически, при чтении меняются местами укр. «е» — рус. «э», и укр. "є" — рус. «е». И так во многих словах.
                      +1
                      Различиями в языках. В украинском значитель чаще используется украинское е (читается как русское э), тогда как в русском — русское е (то же, что и украинское є). Аналогично в парах і/и— и/ы, ґ/г—г/- — в последнем случае в русском алфавите вообще нет буквы для обозначения распостраненного украинского звука.
                        +1
                        Черт. Я думал предыдущий коментарий потерялся.
                          0
                          моего сообщения тоже долго не появлялось, уже было хотел еще раз написать его, но потом вспомнил про глюк матрицы и решил подождать…
                        0
                        Спасибо, так гораздо лучше :) А вообще было бы интересно сравнить с другими языками, использующими кириллицу: белорусским, болгарским, сербским, казахским и т.д.
                        +3
                        Кажется, в свете все коментариев, идея сравнительного размещения украинского и русского алфавитов была не наилучшей :(
                          0
                          интересно, позволяет-ли методика оценивать близость языков программирования (C и Java, например), анализируя исходники?)
                            +1
                            Меньше всего я пытался оценивать близость языков при помощи этой диаграммы.

                            Хотя думаю да, позволяет. В C и Java например найдутся общие фигурные скобки, у плюсов будет много двоеточий, а у C# появится выступ на знаке «больше».
                      +1
                      Мне кажется форум плохой источник, текст довольно специфический
                        0
                        мне кажется как раз наоборот. форум был выбран общей направленности, «о поболтать». А требовался именно текс болтовни.
                          +2
                          Думаете у «болтовни» статистическая картина будет сильно отличаться? Интересно было бы сравнить с той же Википедией.
                            +4
                            Кстати да… О википедии я почему-то не подумал!
                            (ушел читать как правильно травить ее роботами)
                              +2
                              У Википедии даже дампы есть.
                                0
                                Спасибо :) На самом деле идея о дампах пришла в голову сразу после написания коментария, но на хабре они не редактируются :)
                                +3
                                рекомендую глянуть сюда:
                                dumps.wikimedia.org/backup-index.html
                                здесь лежат дампы википедии ;)
                          +3
                          «по русски» по-русски пишется через дефис :)
                            +7
                            Исправляюсь) Я-то русского в школе не учил, вся надежда на спелл-чекер :)
                              0
                              А я думал, что в Украине русский во всех школах преподается. Еще завидовал, что дети не один, а два иностранных языка учат — русский и английский. В некоторых школах, как мне рассказывали, еще и польский учат.
                                0
                                Не знаю как дела на востоке, но за западе далеко не во всех, скорее наоборот — только в некоторых (спец. классы, спец. школы). Я учился в трех разных (обычна средняя школа, школа с классом с усиленным изучением математики, физико-математический лицей), ни в одной русского не было.
                            –1
                            В качестве апострофа (аналог русского твердого знака) в основном используется единичная кавычка «'» (что типографически неправильно), но поскольку она отсутствует в раскладках на старых версиях винды, а в новых очень очевидно находиться под эскейпом, также повально или пропускается, или заменяется на любой другой подходящий (или не очень) символ, например звездочку.

                            Мне кажется, под эскейпом находится все же апостроф, а одинарная кавычка совмещена на клавише с двойной.
                              +1
                              А нет, не совсем правду написал, но все равно, тот символ, что вы указали, находится не под эскейпом. Вместе с тильдой, как оказалось, расположен машинописный обратный апостроф.
                                0
                                Я имел в виду украинскую раскладку в Vista и Windows 7, так называемую Ukrainian (Enchanced). На ней под эскейпом размещена именно кавычка.
                                  –3
                                  Ну тогда извиняйте, у меня русская на уме.
                                    0
                                    я извиняюсь но в русской ё/Ё расположено под эскейпом… Вы наверно имели ввиду EN раскладку
                                      0
                                      Ай все, не слушайте меня) Соберись!!!
                                +3
                                До win7 майкрософт апостроф благополучно игнорировал. Вместо одного из важнейших в украинском языке символов (важней чем твердый знак в русском), на клавише под ESC находилась русская ё. И этот абсурд существует более 15 лет — в семерке нечто, похожее на апостроф, есть только в Украинской расширенной раскладке, а в обычной — все так же «ё». Вот и извращались все как могли — ставили то кавычку, то звездочку, то редактировали раскладки.

                                p.s. Лично я считаю что в раскладке должен быть символ ' — хоть это неправильно с точки зрения типографики (как ставить знаки дюйма вместо «елочек»), но правильно с точки зрения спелчекеров и словарей. И что превращением символа в нормальный апостроф должны заниматься разнообразные парсеры и пост-процессинг текста.
                                  0
                                  Разрешите не согласится. В наш век повального юникода экономить на одном байте как-то глупо. Почему сразу не делать правильно? Спеллчекеры и словари должны учитывать вариации в использованных символах, а не пользователь должен думать, как писать так, чтобы его спеллчекер понял.
                                    0
                                    Не в байте дело. Просто символ u+0027 в юникоде так и называется Apostrophe, и использовать его как апостроф — самое правильное дело. Но в шрифтах он обычно выглядит не сильно красиво, поэтому часто используют правую кавычку u+2019 — Right Single Quotation Mark. Это неверно семантически, но верно типографически. Так что я за то чтобы типографикой занимались специально обученные скрипты, а в текстах использовалась то, что в юникоде прямо предназначено быть апострофом.

                                    Но против того чтобы софт понимал все возможные апострофы, я, понятное дело, возражений не имею :)
                                –17
                                Скажите, а какое из наречий русского языка исследовалось? Насколько я знаю т.н. «украинских языков» несколько: суржик, западно-украинский и другие наречия.
                                  –10
                                  На всякий случай, сразу добавлю: ваша картинка наглядно отображает тот факт, что «украинский» и «русский» «языки» по сути наречия друг друга. Как бы статистически всё очень наглядно показано.
                                  Жаль нет картинки по биграммам, но, уверен, она лишь подтвердит этот тезис.
                                    +12
                                    Исходя из того что Вы говорите, наверное и белорусского языка нет, только наречие, и молдавского тоже. Только Вы попробуйте хоть раз послушать и понять всё, что написано на украинском языке, тогда поймёте, что все же это язык, а не наречие.
                                    А статистически, по звукам, венгерский от ромского (язык цыган), не сильно отличается. :-) то какой тогда тезис это подтвердит?

                                    Все таки полики хорошо всем мозги промывают.
                                      –11
                                      Можете сколько угодно минусовать коммент и плевать мне в карму — сути это не изменит.
                                      Посмотрите на график. Вы что, не видите, что языки практически идентичны?
                                      Что означает это сходство:
                                      1) почти полное сходство алфавитов (очевидно)
                                      2) сходство словарного запаса, вариации лишь в гласных е/э/и.
                                      Типичные свойства диалекта.

                                      С тем же успехом можно новгородские «окающие» говоры назвать отдельным языком и вот такая же частотная диаграмма бы показала вариации а/о, к примеру. Или, скажем, псковские «акающие» говоры — то же самое. В деревнях также чуть другой словарный запас. «Расстояние» примерно такое же, как от стандартного русского до суржика.
                                      Конечно, чем ближе на запад, тем больше черт польского и других заимствований. Там уже дистанцирование от русского более серьёзное.

                                      Но. Диалекты китайского, отличаются друг от друга неизмеримо сильнее. Но китайцы отлично понимают, что вместе они сила, а порознь погибнут. Потому и договорились.

                                      Да. И отрицать упрямые факты — это точно не ко мне, а к политикам.)
                                        +11
                                        Вы еще посмотрите типа «фильм» «документальный», который траслировался по ТВЦ — «Убить русского в себе» и потом рассказывайте обо всем этом.

                                        Я коренной украинец, со Львова, при этом русским владею очень хорошо, как и большинство людей живущих здесь. И у меня есть тоже много поводов считать русский наречием. Но это не значит, что русский язык станет от этого наречием. Языки это то, что развивается исторически, понятно, что у них общие корни, и Киевская Русь все же была. Но самое важное во всем этом — уважение к друг другу. И к нациям.
                                        И честно, очень не приятно, когда кто-либо, особенное если это образованный и умный человек (а я думаю здесь тотальное большинство, особенно те, кто могут писать на хабре), проявляет неуважение к нации, языку. Это реально очень неприятно.
                                          +4
                                          Здесь даже не в уважении дело. Хабратоварищ mt_ забывает, что если «языки» являются наречиями (один другого или кого-то еще), то их обладатели легко друг друга понимают (читай, минимум 80% словаря должны совпадать). Если же они друг друга понять не могут (отдельные фразы — одна на сотню — не в счет, конечно же), то хоть пусть у них абсолютно идентичный алфавит и частотные характеристики, — но все же это разные языки.

                                          Вот простой критерий: вам нужен переводчик?
                                            0
                                            Мне лично не нужен, потому что я очень хорошо знаю русский.
                                            Точно также я знаю и украинский.
                                            Хотя мне и для английского не нужен переводчик.
                                            Большинство людей в Украине понимают русский язык, потому что исторически это было необходимо.
                                            Я сам не понимал, как это можно не понимать русский, если знаешь украинский. Но однажды ехал в поезде, и со мной в купе ехала канадка, из украинской диаспоры. Она украинский знала идеально. Когда я рассказал ей анекдот на русском — она реально его не поняла.
                                            Просто родители её только украинскому учили. В Украине телевидение и радио процентов на 60, а может и больше вещают на русском. поэтому его овсе понимают.
                                              +6
                                              Пардон, ну не стоит же понимать настолько буквально. :) Речь не конкретно о вас, а о человеке, который разговаривает на одном языке и не знает другого. Если таковые люди смогут практически свободно (т.е. отложим в сторону общение «на пальцах») общаться без переводчика, то мы имеем дело с одним языком. Иначе, — логично предположить, нет.
                                              Я бы, например, совсем не отказался от переводчика, если бы мне потребовалось выслушать украинскую речь.
                                                0
                                                На самом деле поднимаемая проблема не так проста, как вы ее пытаетесь осветить. Львовщина это сильно отдельное явление — она в Российскую империю то практически не входила никогда — больше в Австро-Венгрию, Польшу, Речь Посполитую. Моя бабушка родилась на Украине (такой всегда была литературная норма) и она вполне естественно прекрасно знает украинский язык, так вот она всегда утверждала, что есть существенная разница между тем, как говорят на Востоке и на Западе Украины — прежде всего из-за обилия польских и литовских слов. И сейчас в качестве государственного насаждается именно западный вариант — вполне естественно, что девушка из Канады, куда уехали самые ярые националисты, не понимает русского. Потому что она и говорит не на том украинском, на котором говорил Гоголь, к примеру.
                                                Я не знаю правильно ли говорить о наречиях или нет, но если вы почитаете летописи XII — XIV вв. очень похож на тот, на котором говорят на Востоке Украины. И не хочу быть Капитаном Очевидность, но все буквы, которые есть в украинском языке, были и в русском алфавите — просто их последовательно исключали для упрощения и внешнего облагораживания письменной речи.
                                                  +4
                                                  Я прошу прощения, но как житель восточной Украины категорически отрицаю ваш тезис «сейчас в качестве государственного насаждается именно западный вариант», как не соответствующий действительности. Когда 20 лет назад я учил украинский литературный в школе, он был точно таким же, какой преподается (а не насаждается, будьте уверены) в школах сейчас и какой мы слышим по телевидению. В быту и в обществе у нас используется русский, даже для общения с госорганами и написании официальных бумаг. Составление их на украинском желательно, но я не встречал никакой обязательности и никогда не слышал, чтобы бумажку завернули из-за того, что она написана на «неправильном» украинском. Говорить про насаждение западной разновидности живого украинского языка в качестве официального и литературного нет никаких предпосылок. Говорю это со всей ответственностью.
                                                    0
                                                    Это впечатления моей бабушки, которая учила украинский язык еще в 30-е годы, она отмечает значительно возросшее количество польских слов. Возможно это ее субъективное впечатление. Насчет восточной Украины все понятно, у меня родственники в Луганской области и они рассказывают о положении дел. Но вот то, что слышно с западной Украины — запреты отмечать день освобождения Украины от фашистских захватчиков, например, это ужасно. У меня прадед погиб в окружении под Киевом, дед освобождал Украину и я такие вещи воспринимаю как личное оскорбление.
                                                      0
                                                      Вот это и есть то, как политики людям мозги промывают.
                                                      Есть факты:
                                                      Есть страна Украина
                                                      Есть страна Российская Федерация
                                                      Украина <> Российская Федерация.
                                                      Есть общие корни — Киевская Русь.

                                                      Из этого всего ничего не следует.
                                                      Просто есть 2 языка. А все остальное — это интерпретации, которые всегда, по определению, субъективны.

                                                      Я сам бываю в России, и могу сказать точно — русский язык больше «насаждается» в России, чем украинский в Украине.
                                                      Хотя это, очевидно, только моя интерпретация :-)
                                                        0
                                                        Мы были единой страной, единой империей в течение сотен лет. Со средних веков, а может и раньше, и вплоть до века XXI. Как и во всякой семье, были и проблемы, и радости. Но была единая культура, информационное поле, и даже политическая воля, при всех неизбежных конфликтах, была общей.

                                                        Был полководец Богдан Хмельницкий (сам называвший Укранину «Малороссией»). Был Тарас Шевченко, за которого вступался граф Толстой. Был Николай Васильевич Гоголь, хорошо понимавший сродство малоросской и великоросской культур. Были великие учёные, поэты, исследователи, работавшией в единой команде со своими великорусскими коллегами в течение последних нескольких веков, а особенно — в XX веке, который кому-то нужно представить в виде непрерывного ада ))
                                                          +3
                                                          Понимаете в чем проблема. Вот вы говорите «есть страна Украина». Но ведь проблема в том, что такое государство появилось только в XX веке.
                                                          Чисто исторически очень сложно отделить — что является Россией, а что Украиной. Ведь Московское государство появилось только потому, что престол Великого князя, переехал сначала во Владимир, а потом собственно в Москву. Грубо говоря непосредственная связь никогда не прерывалась и такого разделения — Украина и Россия никогда не было. Были земли русских княжеств, захваченные ВКЛ, но ведь это тоже нельзя назвать Украиной.
                                                          Дальше возьмем область расселения казаков но простите, туда же бежали преимущественно православные люди, которые сами себя называли русскими.
                                                          В общем я не хочу никого обидеть, но проблема это гораздо сложнее, чем кажется и со временем она будет нарастать все интенсивнее, т.к. проблема выживания тесно связана с интеграцией, си речь со сближением, а не разделением.
                                                          Насчет того, есть ли деление на западноукраинский диалект и восточноукраинский диалект, в википедии я нашел следующее:
                                                          «Современный украинский литературный язык — это смесь элементов трёх главных диалектов[источник не указан 304 дня], с преобладанием влияния полтавских говоров, то есть юго-восточной группы диалектов, и в меньшей мере — юго-западной группы. Бытует мнение о существовании двух вариантов литературного языка: западного и восточного. Западный вариант литературного можно проследить в текстах И. Я. Франко, В. С. Стефаника, О. Ю. Кобылянской и др., восточный же, основанный на киево-полтаво-слобожанских наречиях представлен в творчестве И. П. Котляревского («Энеида»), Т. Г. Шевченко, Леси Украинки и др.»
                                                          Грубо говоря, в научных кругах такое мнение есть, поэтому отметать его так легко и скоро, я бы не стал.
                                                            0
                                                            Я решил сам посмотреть — взял одно стихотворение Тараса Шевченко, Думка.
                                                            Тече вода в синє море,
                                                            Та не витікає;
                                                            Шука козак свою долю,
                                                            А долі немає.
                                                            Пішов козак світ за очі;
                                                            Грає синє море,
                                                            Грає серце козацькеє,
                                                            А думка говорить:
                                                            «Куди ти йдеш, не спитавшись?
                                                            На кого покинув
                                                            Батька, неньку старенькую,
                                                            Молоду дівчину?
                                                            На чужині не ті люде,—
                                                            Тяжко з ними жити!
                                                            Ні з ким буде поплакати,
                                                            Ні поговорити».
                                                            Сидить козак на тім боці,—
                                                            Грає синє море.
                                                            Думав, доля зустрінеться,—
                                                            Спіткалося горе.
                                                            А журавлі летять собі
                                                            Додому ключами.
                                                            Плаче козак — шляхи биті
                                                            Заросли тернами.

                                                            Не знаю, как остальным, но я не чувствую потребности в переводе — мне непонятно буквально пара слов, хотя из русских текстов XIX в. можно не понять и больше, т.к. не все слова сохранили значение и орфографию.

                                                            А вот стихи Ивана Франко, Чого являєшся мені У сні?

                                                            Чого звертаєш ти до мене
                                                            Чудові очі ті ясні,
                                                            Сумні,
                                                            Немов криниці дно студене?
                                                            Чому уста твої німі?
                                                            Який докір, яке страждання,
                                                            Яке несповнене бажання
                                                            На них, мов зарево червоне,
                                                            Займається і знову тоне
                                                            У тьмі?

                                                            Чого являєшся мені
                                                            У сні?
                                                            В житті ти мною згордувала,
                                                            Моє ти серце надірвала,
                                                            Із нього визвала одні
                                                            Оті ридання голосні —
                                                            Пісні.
                                                            В житті мене ти й знать не знаєш,
                                                            Ідеш по вулиці — минаєш,
                                                            Вклонюся — навіть не зирнеш
                                                            І головою не кивнеш,
                                                            Хоч знаєш, знаєш, добре знаєш,
                                                            Як я люблю тебе без тями,
                                                            Як мучусь довгими ночами
                                                            І як літа вже за літами
                                                            Свій біль, свій жаль, свої пісні
                                                            У серці здавлюю на дні.

                                                            Хотя я понимаю большую часть текста, но воспринимается он заметно сложнее и чтобы понять его нужно заметное напряжение.
                                                            Я не призываю делать из этого какие-то далеко идущие выводы, но я лично вижу разницу.
                                                              +1
                                                              Заметьте — если Вы даже знаете русский, при чтении текстов, например, финансового анализа Вам может понадобиться переводчик.
                                                              А для меня, как для носителя украинского языка, эти два стиха, которые Вы предоставили ничем не отличаются. На двух стихотворениях Вы не сможете составить адекватное мнение о разнице или идентичности западного и восточного диалектов украинского языка.
                                                              Разница есть, однозначно, но она не в написании, она скорее в фонетике, произношении, расстановке слов в предложении, даже в использовании временных форм глаголов она есть.
                                                              но это не приближает восточный диалект к русскому языку. просто это язык.
                                                                0
                                                                Скажите, а почему тогда вы суржик считаете наречием юго-западного, а не отдельным языком? Или я не прав?
                                                                  0
                                                                  Я такого не утверждал.
                                                                  И, если честно, вопрос Ваш не понял.
                                                                    0
                                                                    Вы неправы. Юго-западное наречие — это один из диалектов украинского языка. Суржик же может базироватся на любом наречии. Они в разных измерениях, как твердый и синий.
                                                                      0
                                                                      Как скажете. Моя мысль в том, что наше родство — это длительный совместный исторический процесс. И это не просто сходство алфавитов, это нечто гораздо большее. Это, если хотите, напоминание о братстве народов.
                                                                        0
                                                                        Есть основания считать суржик отдельным языком. Он относится к т.н. смешанным языкам, но это не пиджин (так как пиджин не является ни для кого родным) и не креольский язык (т.к. креольским языком называется пиджин, ставший родным для определенного количества человек — с суржиком же ситуация принципиально иная). Как я понимаю, лексика в суржике в основном русская, а вот большая часть грамматики взята из украинского. Явления, подобные суржику и белорусской трасянке, встречаются и в других языках мира: допустим, в речи современных жителей Киншасы прослеживается тенденция вставлять французские слова в структуры африканского языка лингала.
                                                                        0
                                                                        Простите, но где здесь «финансовый анализ»? Два лирических стихотворения, написанные с временной разницей относительно небольшой. Можно читать и читать Ифана Франко и Тараса Шевченко, но лично для меня разница продолжает быть очевидной.
                                                                        Я не настаиваю на истине в данном вопросе, но вполне возможно что такие вещи видны как раз со стороны, а не привычным взглядом.
                                                                          +1
                                                                          У каждого поэта есть определенный набор слов, которыми он пользуется при написании стихов. У Шевченко стиль более повествовательный, у Франко — приукрашен сравнениями, этитетами, более сложный сам по себе, вне контекста наречий. Слова в стихе Франко на 99% те же, которые звучат и в центре, и на востоке Украины. Просто Шевченко их не использовал
                                                                            +1
                                                                            Да просто Шевченко талантливей Франка.
                                                                            Пушкина тоже легче читать и понимать, чем Маяковского.
                                                                    0
                                                                    запрет на отмечание дня освобождения Украины от фашистских захватчиков связан не с любовью к фашизму, а из практических соображений безопасности. Мы еще не забыли, чем обернулось предыдущее празднование во Львове — проще запретить, чем терпеть наезды россиян и востока Украины на националистическую жестокость и прочую фигню
                                                                      0
                                                                      Это настолько гнилая по своей сути отмазка, что даже обсуждать не хочется.
                                                                        +3
                                                                        Да не отмазка это. Вполне разумный ход. Очевидно же, что кроме провокации ничего не получится. Провокаторы приедут дразнить идиотов, в результате получится драка, и опять будут кричать что во Львове ветеранов избивают. В результате все идиоты и провокаторы сидят дома, все спокойно, все (кроме провокаторов) довольны.
                                                                          0
                                                                          Подождите. Ветераны, которые кровь проливали за вашу свободу и друзей потеряли, теперь не могут прийти к памятнику цветы положить. Так получается?
                                                                            0
                                                                            Опять подменяете понятия. Запрет был на массовые мероприятия. Дедушку с цветами никто трогал, да и не собирался… Если этот дедушка — один дедушка, а не толпа из 200 орущих и оскорбляющих местное население 20-25 летних мордоворотов.

                                                                            Давайте я обрисую контекст, чтобы не быть голословным. 9 мая во Львов приехала группа «Русского фронта» и еще каких-то ультра-левых. Их деятельность направлена против сувернитета страны, то есть противоречит конституции, но они не запрещены, потому что сегодняшние власти смотрят на это сквозь пальцы. Во Львове они начинают вести себя агресивно по отношению к местному населению. Приведу аналогию: представте себе группу московских скинов, приехваших, скажем, в Грозный, толпой валящих по улице, и криками обещающих надрать жопы черным. Достойно премии Дарвина, правда? Или Анонимуса, потому что троллинг налицо. Местные ультра-правые, конечно, уведомлены о действиях противника впредь, и заглатывают наживку: потасовка, кто-то из приезжих получил по морде, у кого-то сорвали георгиевскую ленточку…

                                                                            Вуаля, тролей покормили.
                                                                            Но самое интерересное начинается потом. Тролинг то в реальной жизни опаснее, по почкам схлопотать это не бан на форуме получить. Спрашивается зачем?

                                                                            А затем, что сразу же все «правильные» каналы начинают показывать Львов логовом нацистов, где избивают стариков, рвут зубами на части детей и даже памятник Бандере поставили. Репутация городу, да и вообще правым силам (не только ультрас) портится. Все левые тут же обещают приехать во Львов на 22 июня и устроить ходу с красными флагами. Ваш Лужков (персона нон-грата кстати в Украине) обещает привезти во Львов всю Россию, если понадобится.
                                                                            … Вы бы рады были приветствовать таких гостей у себя в городе, особенно учитывая возможные последствия?

                                                                            По всем параметрам мы имеем грязную политическую игру, и запрет был меньшим из зол.
                                                                              0
                                                                              Вот оно как. Мы же здесь на совершенно другом уровне общаемся — надеюсь вы это понимаете. Я никоим образом не «ультра-» и т.д. — да и вы тоже.

                                                                              Одного не понимаю. Вот смотрите. Во Львове живут ветераны. Эти ветераны хотят на праздник сходит к памятнику (считайте что на могилы друзей) и положить там цветы. Понятное дело, всё абсолютно неполитично и т.д. Очевидно же, что дело у ветеранов правое, тем более в праздник.
                                                                              С вашей точки зрения, этим ветеранам не должно ничего мешать положить цветы и отдать дань памяти погибшим? Здесь вы со мной согласны?

                                                                              Мы сейчас абстрагируемся от политических игр и провокаций и ищем общие точки соприкосновения. От вашего ответа будет зависеть мой — потому что мне пока непонятно на какой основе с вами можно это обсуждать.
                                                                                0
                                                                                Так я писал уже — будь ты ветеран, будь ты левый ультра, будь ты просто прохожий — хочешь положить цветы к памятнику, или на могилу — пожалуйста, никто не запрещает, никто не мешает. Просто не собирайтесь толпой, не нарушайте общественный порядок, и всем будет хорошо.
                                                                                  0
                                                                                  Понятно. Если так, то дедушек зачем атаковали?
                                                                                    0
                                                                                    На всякий случай — я не «подменяю понятия», я разбираюсь. Нам показали как на дедушек нападают здоровые молодые лбы. Было не так? На них никто не нападал?
                                                                                      0
                                                                                      Да — по поводу ультрасов из России вашу информацию я понял. Мне только непонятно, ветераны тут причём, то есть, на них зачем нападали. Или не нападали?
                                                                                        0
                                                                                        Именно. Не нападали. Хотя наши ультрас тоже на всю голову отморожены, но стариков бить не станут. Видео — обычный монтаж.
                                                                      +4
                                                                      Вот вам отличный контраргумент: украинский Котляревкого, Шевченко, Квиткы-Основъяненка ничем особо не отличается от сегодняшнего «насажденного».
                                                                      0
                                                                      Языки в диаспоре — это вообще отдельная тема. Зачастую в диаспоре, т.е. в изоляции от исторической родины, язык функционирует в «законсервированной форме», и многие процессы, имеющие место в регионах массового распространения этого самого языка, его вообще никак не затрагивают.
                                                                      Похожие процессы наблюдаются в французском языке, на котором говорят в англоязычных провинциях той же Канады: в речи франкоязычных жителей Онтарио или Нью-Брансвика до сих пор можно услышать выражения, которые во Франции уже более 200 лет не употребляются.
                                                                        0
                                                                        По поводу того случая с канадкой, который я описывал — могу сказать точно — язык у неё был перфект, даже без акцента. я в начале даже не догадывался, что она иностранка. Просто она русского там не слышала.
                                                                      +13
                                                                      От не треба тут про вісімдесят відсотків, більшість росіян, особливо у розмовній практиці, без попереднього знання української розуміють відсотків так 60 та й то зі скрипом і навантаженням на мозок.
                                                                        +4
                                                                        Так о том и речь, что русский и украинский — не наречия друг друга или кого бы то ни было.
                                                                          +5
                                                                          Ну да, немецкий и датский, испанский и итальянский тоже наречия. Да, да. Кстате украинский и польский, тоже наречия? Там степень устного понимания вполне сопоставима с русским, жаль алфавит другой.
                                                                          Не выдумывайте глупостей. Отдельные языки.
                                                                          Или — марш на филологию писать научную работу по этому поводу. Посмеемся вместе.
                                                                            +3
                                                                            Ой, простите, я наночь глядя недосмотрел ваш коммент. Мне показалось что вы настаиваете на том что это таки наречия.
                                                                            В общем, это к оппоненту:)
                                                                            +4
                                                                            Бiльше того, маю зауважити, що якщо провести частотний аналiз спiввiднонення россiйської та польськї, то результати будуть схожі. Проте я ще не бачив росіянина, який розумів більше 20 відсотків живої польської мови.
                                                                              0
                                                                              З іншого боку, знання української надає певний «бонус» до розуміння польської мови, що є непрямим підтвердженням наведених вище коментарів.
                                                                                +2
                                                                                Мать вашу, переводчика мне!
                                                                                  +2
                                                                                  что и требовалось доказать? :)
                                                                                    0
                                                                                    Да всё же понятно. Надо только читать внимательно.)
                                                                                    — «Больше того, магу заметити, что як провести частотный анализ… российской и польской, то результаты будут схожи...»
                                                                                    — «С иного боку, знания украинской даёт „бонус“ для понимания польской мовы, что является непрямым подтверждением написанных ваше комментариев.»
                                                                                      0
                                                                                      А где же ваша калька слова «певний»? Скажете имеет отношение к пению? :)
                                                                                        –2
                                                                                        Я выше писал, что сходство — порядка 80% (что подтверждается диаграммой). То есть понятны не все слова, но близко к тому.

                                                                                        Вообще, непонятно, из-за чего ваши коллеги так переполошились. Мной был проблематизирован вопрос, поднятый ещё три века назад учёной общественностью. У каждого свои аргументы. Понимаю ваши, предлагаю свои, привожу источники, привожу факты. По идее — нормальный научный спор. Всё это делается при крайнем уважении к обсуждаемой культуре (об этом я писал в посте ниже).

                                                                                        Какой смысл при этом минусовать карму и комментарии — от меня ускользвает.
                                                                                          0
                                                                                          Причина минусов очень проста — тексты у Вас и вправду правильные, научные (я думаю Вы умный и образованный человек) — но очень повахивают шовинизмом и превосходством.
                                                                                            –2
                                                                                            Мне очень, очень жаль что Вы воспринимаете их таким образом.
                                                                                            Я не зря написал развёрнутый ответ чуть ниже. Всё о чём я пишу — об историческом и культурном нашем сродстве. Да, я уверен в том, что мы — часть единого восточнославянского организма, по крайней мере, той его части, которая была Империей, но не страха, а совести. Это моё мнение, и я его высказываю, подкрепляю фактами и историей.

                                                                                            Заметьте, я НИГДЕ не пишу «мы главные» (да и кто «мы»? — если у меня одинаково великоросские и казачьи предки, которых я уважаю). С моей точки зрения, среди братьев не может и не должно быть подавления и главенства — может быть только поддержка, взаимовыручка и взаимоуважение. Да, бывает старший брат, бывает младший. И для первого это — ответственность, а не привилегия. Никакого превосходства, это всё пустой гонор.

                                                                                            Всё о чём говорю я — это родство, взаимное уважение, взаимная ответственность. Родство можно отрицать и жить без него. Но, как правило, человек от этого не становится счастливее.

                                                                                            Понимаете? Нечего нам делить, некому ставить ногу на грудь. Те кто предлагают это — действительно шовинисты. Я верю в то, что мы в одной лодке, и чтобы плыть, надо не ругаться, не искать главных (нет их!), а брать вёсла и грести. То есть, действовать сообща. У нас столько общего! При советах в/на Украине была сильнейшая Академия Наук. В Белоруссии — также сильнейшая. Вместе мы разрабатывали такие штуки, что у других шерсть на затылке дыбом вставала. Вот как надо действовать!
                                                                                              +3
                                                                                              Вот это и есть оно самое. «старший брат»
                                                                                              старше по какому критерию?
                                                                                              Количеству территорий завоёванных империей?
                                                                                              Да, может мы и братья, но скорее двойня(не скажу что близнецы), просто один брат решает что он старше, потому что ростом выше.
                                                                                              :-)
                                                                                                –1
                                                                                                Чисто потому что он «ростом повыше», как заметили здесь, в обсуждении.
                                                                                                Есть объективные вещи, такие как численность и территория. Понятное дело, что большой по численности народ, соответственно занимающий большую территорию, имеет больше возможностей для, например, отражения атак. Где вы здесь увидели шовинизм — не представляю.

                                                                                                Это количественное превосходство. А вы его, почему-то, путаете с качественным. Что уже — фашизм.
                                                                                                Качественно мы настолько одинаковы, что впору, как раз, говорить о едином народе. И уж совсем точно то, что даже качественные различия НЕ делают никого лучше или хуже.

                                                                                                Итак, мы качественно практически идентичные, но разные количественно. И в этом смысле, если хотим быть братьями, должны нести друг за друга ответственность. Имеющему бОльшие возможности (за счёт численности населения и прочих количественных вещей) — и бОльшая ответственность. Вот и всё.
                                                                                                  0
                                                                                                  Только вы обратите внимание — что Российская Федерация, которая именно федерация, давным давно уже не русская. В большинстве своем.
                                                                                                  У меня был бизнес в Татарстане — сказать что татары — это русские. Сомнительно. Особенно сомнительно то, что они братья с украинцами. (хотя очень хорошие и интересные люди, и мне лично было с ними интересно и легко работать и общаться). То же самое можно сказать о большей части территорий РФ.
                                                                                                    0
                                                                                                    При этом татары — это россияне.

                                                                                                    Для политиков РФ Латвия, Литва, Эстония — перестали быть предметом желания, Украина, пока все ещё остается. Вот и переписывают регулярно книги по истории, чтобы создать логическое подтверждение братства.
                                                                                                    Это и есть Империя. Жаль что умные люди в это вовлекаются.
                                                                                                      0
                                                                                                      Всё верно говорите, я с вами согласен.
                                                                                                      Отгадка проста.
                                                                                                      Россия исторически не является национальным государством. Россия исторически является империей. Поэтому русская (российская) нация, в случае российской империи, полиэтнична.
                                                                                                      Точно также, когда создавалась Великая Франция, были объединены окситанцы, фламандцы и прочие субэтносы.
                                                                                                      Когда создавался Китай, были объединены тысячи племён, чать из которых была не только субэтносами но и почти полноценными этносами.
                                                                                                      Когда создавалась объединённая Япония, были объединены сотни орденов, племён, субэтносов.
                                                                                                      Австро-венгерская империя — такой же полижэтнический сплав.
                                                                                                      Де-факто объединённая Европа представляет собой фактически полиэтническую империю.

                                                                                                      Тот факт, что положение славянских этносов в современной России — не самое лучшее, тот факт что есть большие пробелы в национальной политике — это правда, это факт, но их обсуждение несколько выходит за рамки нашей темы. Да, проблемы есть, и проблемы очень серьёзные.
                                                                                                        0
                                                                                                        Вы вообще понимаете разницу между этносом и нацией? Нация не должна быть моноэтничной. Во Франции французом считается любой, кто приобрел гражданство Франции. С понятием русский очень непросто — это и историческая категория, и обозначение этноса и обозначение принадлежности к одной нации.
                                                                                                        Кстати генетические исследования показывают существенную близость генофонда татарского этноса и русского. А если говорить об Украине, то есть мнения что отличить русский этнос от украинского очень сложно — они слишком близко.
                                                                                                        Брать этнические связи за основу оценки невозможно — важны прежде всего культура, традиции, вероисповедание. На этой базе четко прослеживается чрезвычайная близость левобережной Украины и областей России, которые находились в пределах Московского княжества. С правобережной Украиной все сложнее и это причина того, что Украину периодически раздирают серьезные противоречия.
                                                                                                          0
                                                                                                          Я прекрасно понимаю разницу между этносом и нацией.
                                                                                                          Именно это и важно. Тогда у меня вопрос: украинцы кому братья: нации России или русским?
                                                                                                          Потому что это как раз и запутано. То что украинцы и русские как этнос близки — это очевидно. я с этим полностью согласен. И даже горжусь этим.

                                                                                                          Горжусь тем, что могу поехать в несколько соседних стран и чувствовать себя вполне комфортно, как в плане культуры, так и в плане взаимопонимания.

                                                                                                          Основной посыл, контекст обсуждений братства русских и украинцев такой:
                                                                                                          «Так как мы братья, почему бы нам не объединиться в одну нацию? Присоединяйтесь к старшему брату!»
                                                                                                          А вот это и есть политика.
                                                                                                            0
                                                                                                            Безусловно и тем и другим, хотя бы потому что, провести четкую черту — здесь украинцы, а здесь русские с любой точки зрения очень непросто.

                                                                                                            Насчет «присоединяйтесь» к старшему брату. Это ведь по большому счету такая игра словами из серии а вот Россия по территории больше, а вот Украина меньше. Это какая-то примитивная трактовка, которая подменяет суть. Даже в том же СССР, вспомните сколько было людей во власти, которые являлись выходцами из мест, находящихся в современной Украине. И что из этого делать вывод что Украина оккупировала Россию?
                                                                                                            На мой взгляд, речь стоит вести о том, что серьезных альтернатив интеграции нет — в любом случае разница между кем-то определяется лишь масштабом нашего восприятия. Если мы его сужаем предельно — мы находим много отличий. Если мы его расширяем до более глобального, то обнаруживаем огромное количество сходства.
                                                                                                            На протяжении долгого исторического периода, происходил культурный и этнический обмен на территории Российской империи и СССР — это создало великую мировую культуру, где огромную роль занимают выходцы из мест, находящихся в пределах современной Украины.
                                                                                                            А когда мы начинаем это жесткое разделение у нас начинает и экономика хромать и культура приходит в упадок, скатываясь в местечковость.
                                                                                                            Невозможно отрицать взаимного тяготения, интереса, культурного обмена и экономической интеграции. Я не говорю, что это должно заключаться в политическом поглощении одного государства другим, но культурный и экономический союз между нашими странами и нациями должен существовать.
                                                                                                            В Европе есть тому примеры — Австрия и Германия сейчас вполне нормально разделяют большое культурное и историческое наследие и глубоко взаимно интегрированы.
                                                                                                              0
                                                                                                              По-моему, посыл вполне верный.
                                                                                                              К сожалению, политически на данный момент для многих неочевидно, что так будет лучше. В виду, прежде всего, больших проблем у самого «старшего брата» (старшего по росту: помним, что это лишь объективная количественная характеристика). Да, у старшему брату сломали хребет, он лежит полумёртвый, а в это время доброжелатели выносят последнюю мебель. И тут бы вспомнить о взаимовыручке и взаимной отвественности. Но, увы, доброжелатели от имени старшего брата громко матерятся на всех прохожих, и особого желания зайти в гости нет даже у младшего брата. Это всё вполне понятно.
                                                                                                                0
                                                                                                                В том и суть, старшим по росту не можно быть.
                                                                                                                старший от слов — стар, старее, тот кто прожил больше.
                                                                                                                младший — моложе, молодее — тот кто прожил меньше.

                                                                                                                Не подменяйте понятия.
                                                                                                                  0
                                                                                                                  Хорошо. Предложите ваш вариант.
                                                                                                                    0
                                                                                                                    Вариант очень прост — русские и украинцы.
                                                                                                                    это две нации. точка.
                                                                                                                    нации не бывают братскими или небратскими. Этот прием в литературе очень часто используется — перенесение качеств воодушеленного существа на неживой.
                                                                                                                    Нация — это понятие, институт, его ещё много как можно назвать. но к нации не применимы подходы типа брат-сестра. Это все равно что сказать: «Порш — старший брат Фольксвагена». Наверное у них очень много общего — но они не братья. Они автомобили.
                                                                                                                    У меня есть братья — это братья, и у меня чувства будут к ним как к братьям.
                                                                                                                    У меня не может быть чувств таких же к «братской нации». чувства бывают к конкретным людям, а не к понятиям. Любить или ненавидеть Сталина, Путина, Ющенка или Януковича можно. Любить или ненавидеть правительство — невозможно. Кто это конкретно? В даном случае то же самое. Именно поэтому я и говорю о подмене понятий.
                                                                                                                    Нация, народ, язык, наречие — это конкретные понятия, которые не являются чем-то «почти таким же». Они конкретны и имеют четкие определения.
                                                                                                                      0
                                                                                                                      «нации не бывают братскими или небратскими» — это очень спорное утверждение. Скажем так, это ваше личное видение мира. У меня другая точка зрения, и у неё также найдётся масса аргументов. По мне, если завязать глаза и не видеть света, это вовсе не значит что его нет.
                                                                                                                      Эту ветку можно закрывать, потому что мы натолкнулись на разницу наших с вами личных мировоззрений.
                                                                                                                      Пусть те из читающих, кому что ближе, выберут сами.
                                                                                                                    0
                                                                                                                    Кстати, «старший» я применяю вот в каком смысле: в истории так шло, что великороссы вступались за малороссов. Особенно в ходе польской оккупации, причём польские паны устраивали настоящий геноцид на малоросских территориях.

                                                                                                                    Более многочисленная ветвь русов регулярно вступалась за менее многочисленную. Это было как минимум необходимо, потому что поляки сами пользовались поддержкой (в том числе финансовой) католической Европы и Ватикана.

                                                                                                                    Так и повелось, что один брат вступался за другого. Отсюда я лично и говорю старший брат и младший, потому что так оно обычно и происходит. Но если вас это оскорбляет — предложите своё подходящее название, я совершенно не против им пользоваться. Главное — чтобы без обид на ровном месте. Я же не зря вам максимально прозрачно всё расписал.

                                                                                                                    Кстати, было много случаев, когда братья воевали вместе и на равных. Например, Великая отечественная война, в ходе которой и украинцы, и великороссы понесли одинаково страшнейшие потери как среди военных, так и среди мирного населения (белорусы, конечно же, тоже). Как бы там ни было, против врага воевали плечом к плечу и не разбирали на свой-чужой. И потому победили.
                                                                                                                      0
                                                                                                                      И никто ни за кого не вступался. Это просто игра слов. они просто воевали. Может это и было в одну сторону и против одного врага. Не факт что они вступались друг за друга. Это все не более чем Ваши интерпретации событий, которые по своей сути нейтральны.
                                                                                                                      Блин, как круто звучит — вступались. Да простые политические факты. Если бы сдали буферную зону, то враги были бы под границей. это называется теперь «вступались» :-) Политики и руководители не мыслят категориями «вступались» они мыслят категориями «выгодно» и «целесообразно».
                                                                                                                        0
                                                                                                                        «никто ни за кого не вступался» — это опять ваша личная интерпретация, которая берёт начало в вашем нежелании видеть очевидный факт, что кроме личной выгоды существует родство, которое учитывается как обычными представителями народа, так и правителями (при всём их стремлении к выгоде и сухой рациональности). Возможно, вам это настолько неблизко, что вы решительно не можете в это поверить. Но это уже, извините, ваши личные проблемы.

                                                                                                                        В данном случае могу порекомендовать обратиться к популярной исторической литературе Карамзина и Пикуля. Потом можно почитать более серьёзные исследования А. А. Андриевского, А. В. Соловьёва. Последних никак нельзя упрекнуть в предвзятости в пользу великороссов, однако же все описываемые мною доводы там есть.

                                                                                                                        Исторический процесс вы увидите не как череду формальных действий, а как поток свершений конкретных личностей со своими убеждениями, страстями и заблуждениями. Короче, живых людей.

                                                                                                                        Например (особое внимание — в начало и конец):

                                                                                                                        «Название «Малороссийский» охотно применяется Хмельницким и на Украине.
                                                                                                                        Так, еще осенью 1647 г. гетман пишет из Запорожья черкасскому полковнику
                                                                                                                        Ивану Барабашу о том, что надо просить короля и сенат о новой привилегии «на
                                                                                                                        утверждение прав и вольностей казацких и Малороссийских», что «такие привиле-
                                                                                                                        гии нужны всему народу Малороссийскому», но тут же говорит, что нужно сделать
                                                                                                                        что-либо «для погибающей Украины» и просить короля «за наших людей украин-
                                                                                                                        ских». Перед самой переяславской радой, 3 января 1654 г., запорожцы отвечают
                                                                                                                        гетману Хмельницкому: «А замысел ваш, щоб удатися и бути зо всем народом Ма-
                                                                                                                        лороссийским, по обоих сторонах Днепра будучим, под протекцию великодер-
                                                                                                                        жавнейшаго и пресветлейшаго монарха Российского, за слушный быти признава-
                                                                                                                        ем, и даемо нашу войсковую вам пораду, абы сте того дела не оставляли и оное
                                                                                                                        кончили, як ку наилутшей пользе отчизны нашей Малороссийской». А на самой
                                                                                                                        раде в Переяславле гетман Хмельницкий говорит 7 января: «Всея Русии самодер-
                                                                                                                        жец призрел на свою государеву отчину и на всю Малую Русь милостью своею…
                                                                                                                        Киев и вся Малая Русь вечное их государство величества достояние».»


                                                                                                                        — понятно о чём речь?
                                                                                                    +1
                                                                                                    В карму и в коментарии вы получаете за систематическую шовинистическую подмену терминологии. Есть принятая класификация: семейства, группы, языки, диалекты, наречия. Её придумали, смею заметить, умные люди. В этой класификации украинский и русский языки — на одном уровне. Так принято, так написано филологами в википедии и в умных словарях. Вы же систематически сдвигаете украинский язык до уровня наречия русского, и мешаете его с суржыком.

                                                                                                    И в этой точке поверить в ваше крайнее уважение становится сложно.

                                                                                                    Собственно терминологию лучше оставить специалистам (коими ни вы, ни я, смею заметить, не являемся), пусть они выясняют. Но здесь замешана политика. Ваше мнение шовинистично.

                                                                                                    Много лет царские, а потом советские чиновники делали все чтобы уничтожить украинский язык (иногда вместе с носителями), убедить всех в отсутсвтии его, ассимилировать. И неспроста. Язык — это основной критерий самоидентификации нации. Нет языка, есть только наречие — украинцы превращаются в почти русских, почти в россиян. А я не русский. И не россиянин. И, простите, не хочу им быть.

                                                                                                    Вы продолжаете эту линию. Фактически ваше мнение превращает меня из украинца в недо-русского. И это меня обижает. И за это я поставил вам минус в карму. При всем уважении.
                                                                                                      0
                                                                                                      А я, при всём уважении, не позволяю себе ставить минусы в карму тем, кто спокойно, без негатива, готов обсуждать вопросы, пусть даже и спорные. Но это личное дело каждого.

                                                                                                      Что касается вопроса классификации украинского — предлагаю почитать кое-что из списка литературы, который я привёл выше. Если абстрагироваться от политики, то с позиции лингвиста вопрос классификации до сих открыт (это чётко следует из первой ссылки, которая анализирует ход научной дискуссии в до-советское время).

                                                                                                      Исходя из этого, мне ближе аргументы той стороны, что декларирует историческую целостность, а равно и сродство великоросского, малоросского и белоросского наречий.

                                                                                                      Вы можете отрицать факт этого сродства, это ваше личное дело. С моей точки зрения, не полезно вычёркивать сотни лет своей истории и развития — но это ваше право.

                                                                                                      Что касается постоянных обвинений и обид — смею заверить, зря вы так. Я с большим уважением отношусь к этой части великой русской культуры. И мне очень затруднительно сказать, какая часть тела могла бы быть более важной — левая рука, правая рука, левая нога или правая нога. С моей точки зрения, всё это неотъемлимая (в идеале) часть единого организма.

                                                                                                      Споры о самоидентификации возникают только в том случае, когда народ желает вычеркнуть десяток веков из своей истории и тотально сменить самоидентификацию, перечеркнув естественный исторический процесс. С моей точки зрения, как я говорил, это не полезно, но это ваше личное право, право свободного человека.

                                                                                                      Я же хочу, чтобы вы это право предоставляли другим. И уважали его настолько же, насколько уважают вашу культуру.
                                                                                                        0
                                                                                                        Знаете в чем различие между вашей и моей точкой зрения? Мы оба уважаем культуру/страну/язык собеседника, только я считаю что наши культуры/страны/языки хоть и родственные, но разные, а вы — что моя культура/страна/язык есть подмножество вашей…
                                                                                                          +1
                                                                                                          Нет! Вы не совсем верно поняли. Мы как раз пишем об одном!
                                                                                                          Малоросские и великоросские культуры родственны. Везде пишу о том, что у нас единый культурный корень, но это не великоросская культура. Великоросская культура — тоже ответвление от старорусской, старой восточнославянской, такое же, как и малоросское. Понимаете?
                                                                                                          Да, великоросское ответвление — более многочисленное, потому что просто людей больше (т.е. «велико» следует переводить как «многочисленное»).
                                                                                                          О чём я и пишу: малоросская культура сохранила очень много аутентичных старорусских элементов, которые «не выжили» в великоросской культуре. Именно этим, мне, например, малоросская культура очень симпатична.

                                                                                                          Об этом дереве я везде и пишу (почитайте, пожалуйста, ещё раз мои комментарии). Я нигде не пишу о вторичности. Наоборот, я пишу о едином корне, из которого обе наши культуры равно выросли!
                                                                                                            +1
                                                                                                            Эта дискуссия ни к чему не приведет. Бесполезный трёп. Стоит его прекращать.
                                                                                                            История — это то в чем живут наши с вами интерпретации и стереотипы. Меняя взгляд на историю — меняются стереотипы и модели действий.
                                                                                                            Империя — это машина, которая всегда подминает под себя все вокруг.
                                                                                                            Поэтому мы никогда не прийдем к общему мнению, потому что находимся по разные стороны. Объединение — выгодно только для империи, каковой является Россия. Европейские объединения — Евросоюз например — действует совершенно наоборот.

                                                                                                            Обратите внимание, что в Евросоюз большинство стран просилось, а в Империю, как правило «попадают» или присоединяют.
                                                                                                              +1
                                                                                                              Зря вы, с professor_k мы фактически нашли общий базис, с которым оба согласны.

                                                                                                              Что касается империй — так они бывают разные. Если смотреть на Британскую империю, то её развитие шло в основном через захватнические войны.

                                                                                                              Российская империя не практиковала геноцида мирного населения там, где вела войны. А многие её части присодинялись и вовсе добровольно. Кроме того, нации в составе Российской империи имели право на самоопределение (что для Европейских империй было неслыханным подарком для присоединяемых народов). Так, например, кавказские князья, получая российское подданство, сохраняли право владений и прочего.

                                                                                                              Это вопрос непростой, и предлагаю эту тему для ясности замять.)
                                                                                                                0
                                                                                                                +1 за заминание
                                                                                                              0
                                                                                                              А буквально каментом выше вы писали: «Я с большим уважением отношусь к этой части великой русской культуры». То есть вся таки утверждали, что украинская культура — часть великой русской. В этом то вся и соль.
                                                                                                                0
                                                                                                                Тут для непосвящённых действительно легко запутаться в терминах.
                                                                                                                Смотрите.
                                                                                                                Вот была восточнославянская культура. Это тоже очень комплексное понятие. Мы берём только ту часть, которая относилась, если очень условно, к Киевской Руси (на самом деле, там всё гораздо шире, но примем для простоты).
                                                                                                                Из этой культуры, которую зачастую принято называть старорусской, пошла развиваться русская культура. Эта культура имеет несколько ветвей, поскольку её носителей несколько. Эти носители (совсем упрощённо — ветви русов) развивались вместе, то чуть-чуть по-своему. Это великороссы, белороссы, малороссы, чернороссы. Каждая ветвь россов (русов) несёт свою часть общей культуры. Вместе они — дерево великой русской культуры (культуры русов/россов).

                                                                                                                Великая русская культура — это дерево. Культура великороссов — наиболее многочисленная (толстая, если хотите) его ветвь — просто потому что её носителей больше, со всеми вытекающими.

                                                                                                                Всё. Никаких обид не может быть.
                                                                                                                Хотите — называйте братьями, хотите — ветвями одного дерева. Суть всё та же: уровень связанности настолько велик, что, я считаю, любые попытки разделить, что называется «развести» по сторонам — искусственны.
                                                                                                              0
                                                                                                              Итак, единый корень — старорусская культура (условно, «Киевская Русь»). Из неё пошло несколько ветвей: малоросская, белоросская, черноросская, великоросская. Каждая развивалась чуть автономно, но по сути — вместе с другими.
                                                                                                              Все ветви вместе — великая русская культура, наследница старорусской.
                                                                                                              Вот о чём пишу.
                                                                                                                +1
                                                                                                                Именно поэтому их есть смысл объединить под крылом старшего брата, который исторически живет в Москве :-)
                                                                                                                согласен :-)
                                                                                                                приятная перспектива. только для кого?
                                                                                                                  0
                                                                                                                  Этот вопрос слишком затрагивает политику. А у нас ресурс не политический, а скорее научный.
                                                                                                                  Поэтому я бы хотел остаться на позициях научного обсуждения, отчего предлагаю эту тему не обсуждать.
                                                                                                                  Хотите пообщаться о политике — пожалуйте в личку.
                                                                                                                    0
                                                                                                                    В том и есть суть. То что Вы говорите как раз оправдывает политику империи. Именно поэтому я и вступил в эту дискуссию.
                                                                                                                    Наука это беспристрастный инструмент, который оперирует фактами, а не подтасовками. Если присутствует какая либо подтасовка или направление «научной мысли» — это уже политика.
                                                                                                                    Политика связана с мировоззрением, наука с познанием.
                                                                                                                    Это взаимоисключающие вещи.
                                                                                                                      0
                                                                                                                      Так я и оперирую фактами. Привожу вам данные из истории, культуры, литературы. Привожу ссылки на конкретных лингвистов, в т.ч. из имперской России.
                                                                                                                      Показываю весь исторический процесс без «фильтрации» (которой занимаются в учебниках истории). Каждый волен делать свои выводы из этих данных.
                                                                                                      0
                                                                                                      Тот же польский ближе к украинскому чем русский. Польский — диалект украинского? Русский же очень близок к болгарскому, ближе чем к украинскому.

                                                                                                      Ну и благодаря какой логике украинский — диалект русского, а не наоборот? Русь была киевской. Это потом все порасселялись.
                                                                                                        0
                                                                                                        потому что старшый брат, разве не понятно?
                                                                                                          +1
                                                                                                          Скорее больше вымахавший.
                                                                                                            0
                                                                                                            Именно так. И не более.
                                                                                                    +3
                                                                                                    Не пiдкажете де тут поряд останiвка?

                                                                                                    [/гумор]
                                                                                                      +1
                                                                                                      Блін. Ну ніби хабр — найінтелектуальніше середовище яке тільки можна придумати. Але варто навіть тут згадати про українську мову, як обов’язково знайдеться хтось, щоб почати хохлосрач.
                                                                                                        +2
                                                                                                        I не кажiть, профессоре. Поки я писав свiй коментарiй, що вiдсилає нас до вiдомого анекдоту, дерево дискусiї виросло удвiчi.
                                                                                                      +2
                                                                                                      Ma Pan racje. Ukrainczycy rozumieja jezyk polski lepiej niz Rosjanie.
                                                                                                        0
                                                                                                        Но это больше относится к разговорному, читать тяжелее.
                                                                                                      +2
                                                                                                      Niektorzy Rosjanie nawet mowia, ze jezyka polskiego mozna nawet za trzy miesecy sie nauczyc. Dyskutowalem z jednym takim tutaj na Habrze.
                                                                                                        0
                                                                                                        Смотря о каких россиянах вы говорите. Я заметил, что есть большая разница в степени понимания между теми, кто живет между Украиной и Москвой, и теми, кого Москва от Украины закрывает. Я из второй группы, и когда я приехал в Украину, я понимал от силы процентов 15. Польский не понимаю совсем.

                                                                                                        При этом не могу сказать, что у меня какие-то проблемы с языками — как раз наоборот.
                                                                                                      0
                                                                                                      89 % в стословном ссылке, по критерию Корякова. Это больше, чем у русского с украинским.
                                                                                                        0
                                                                                                        Проблема разграничения диалектов и отдельных языков на самом деле гораздо сложнее. Взаимопонятность единственным критерием здесь не является. Например, таджикский и фарси вполне соответствуют предложенному Вами критерию (совпадение примерно более 80% лексики) — и при этом считаются разными языками. Конечно, фарси имеет ряд фонетических и грамматических отличий, в лексике арабизмов побольше, еще и письменность на основе арабской графики. Но таджики без труда понимают жителей Ирана в устном общении. Хинди и урду — это по сути один язык. Они считаются разными языками лишь по религиозным причинам. Носители урду исповедуют ислам, поэтому письменность в нем на основе арабской графики, а в лексике больше арабизмов. Все остальные различия между двумя языками минимальны. Молдавский и румынский — это ведь тоже по сути один язык; их считают отдельными языками исключительно по политическим причинам. Если во времена СССР постулировались различия между молдавским и румынским, то сейчас (да еще и после перехода на латиницу) внимание акцентируется на сходствах. Похожая ситуация наблюдается в бывшей Югославии: если раньше речь шла о существовании единого сербскохорватского языка, то сейчас все чаще говорят о сербском языке, хорватском языке, боснийском языке и т.п., причем в пользу этой позиции приводятся не лингвистические, а исключительно политические и культурно-религиозные аргументы. Хотя в случае с сербами, хорватами и боснийцами скорее следует вести речь о разных вариантах одного и того же языка.
                                                                                                        –4
                                                                                                        Судя по всему, российское телевидение вы смотрите гораздо больше меня. Что ж, ещё Булгаков говорил не читать советские газеты перед едой. Что касается т.н. «документальных» фильмов, обильно выпускаемых современной журналистикой — вы и сами прекрасно видите что это такое. Уровень примерно такой же, как то как показывают компьютерщиков в кино. Уровень погружения в остальные проблемы примерно такой же — поверхностный.

                                                                                                        Теперь что касается собственно украинского наречения. Во-первых, я никоим образом не стремлюсь принизить его значение для всей русской культуры (неотъемлимой частью которой оно является). Потратив несколько лет на изучение древнерусского и, отчасти, церковнославянского, становится ясно: украинский диалект сохранил в себе очень многие черты, слова, а где-то и строение, характерное для корневого нашего языка. Великорусское наречие претерпело гораздо больше морфологических и стилистических изменений. То есть, во-вторых, я с огромным уважением отношусь к самому диалекту. И считаю его, где-то, более аутентичным, что касается сохранения этнического и духовного зерна. Но это немного отдельная тема.

                                                                                                        Кстати, даже неглубокое знание древнерусского даёт возможность довольно легко читать все три основные современные наречия (великоросское, белоросское, малоросское — назовём их оригинально, как в Российской империи). Конечно, понятно не полностью, но процентов на 80% — точно. На слух воспринимать потруднее из-за вариаций в ударениях. Но всё равно можно. Ваши претензии к «ленивым москалям» считаю отчасти справедливыми — достаточно слегка изучить корневой язык, и наречия станут в принципе читаемыми.

                                                                                                        Далее. Сейчас, в виду политических моментов, восприятие наших народов как части одного народа, восприятие наших «языков» как единого языка, пытаются позиционировать как некую маргинальную точку зрения. Тем не менее, исторический процесс шёл именно в этом направлении. В XIX веке (когда мы были единым государством не только де факто, но и де юре) шла оживлённая дискуссия в кругах, близких к языковедению. Вопрос классификации малоросских наречий стоял уже тогда, и стоял очень остро.

                                                                                                        Если коротко, то малороссийское наречие (суржик) относилось к наречиям почти всеми специалистами. В то же время юго-западный диалект почитался языком целым рядом учёных (например известным этнографом Надеждиным). Очень справедливо и вы сейчас, и некоторые этнографы, замечали, что малоросское наречие менее понятно великороссам, чем тот же русинский диалект (или язык — как угодно). Как отмечал Милюков, разница здесь в том, что сам ход исторического прогресса, в котором украинцы и русские развивались вместе и являлись (и являются) по сути, единым народом, означает, что исторически и культурно наши культуры неразрывны.

                                                                                                        Гоголь, как человек глубоко любивший местную культуру, человек, перенёсший ядро украинской культуры и образы в «большой» свет — не только великоросский, но и мировой, очень много посвятил классификации украинского наречия. Всё глубже изучая культуру, Гоголь всё больше понимал, что противопоставление наших наречий абсолютно недопустимо. Здесь стоит сказать, что украинский язык в империи считался простонародным, крестьянским, то есть некий налёт уничижительности имеет вековые корни, что, конечно, абсолютно недопустимо. Понимая генетическую тысячелетнюю связь нашего языка, этносов и культуры, Гоголь сделал всё, чтобы не разобщить, а сплотить, избавить от конфликта наши русские ветви. Фактически, в свой «золотой век», Гоголь писал на великорусском наречии, гармонично вплетая в него слова, понятия и образы из украинской мифологии и украинской современной жизни.

                                                                                                        С моей точки зрения, Гоголь сделал гораздо большее, нежели написал несколько книг. Он постиг всю историческую связь народов и культур. Он, как мог, возвращал украинскому диалекту уважение — не силой, но умением,- именно так, как заслуживают настоящее уважение, а не страх.

                                                                                                        Извините, что получилось длинно, но я хочу быть правильно понятым. Обсуждаемый вопрос имеет очень длинную многовековую историю и не так однозначен. С моей точки зрения, худшее, что могут сделать братья — это считать друг друга чужими. С моей точки зрения, в вопросе единого исторического развития ещё не поставлена точка, и сиюминутные политические распри — это наносное, поверхностный песок истории, который будет сметён ветром, раньше или позже. Всё это я говорю с позиции крайнего уважения к украинской ветви славянства и глубокого понимания, что все мы — часть единого.

                                                                                                        Литература: раз, два, три, четыре.
                                                                                                        0
                                                                                                        Вы филолог?
                                                                                                    +11
                                                                                                    Исследовался украинский язык, если быть точнее — львовский диалект, в нем есть незначительные отличия от литературного (одно или два окончания).

                                                                                                    … и да, украинский язык существует. Называйте его как хотите, но сути это не меняет.
                                                                                                      +4
                                                                                                      Чем по вашему мнению наречие отличается от языка? Как поступить с чешским, польским или сербским языками?
                                                                                                        +5
                                                                                                        Из за подчеркивания не погу попасть в профиль. Подскажите как втулить вам минус в карму :)
                                                                                                        +1
                                                                                                        Просьба админам скинуть дамп баз оказалась смелым поступком :)
                                                                                                          +1
                                                                                                          А зачем сразу ломится в окно, если можно сначала попробовать постучать в дверь? :) От них не убыло бы, а мне бы работы убавилось.
                                                                                                            0
                                                                                                            Уверяю вас, они подумали, что вы хотите сделать клоны их серверов, и, полагаю, сильно прифигели -)
                                                                                                              0
                                                                                                              Но ведь я не просил ничего, чего не было в открытом доступе. Захочу — сделаю клон :)
                                                                                                        • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                          • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                            0
                                                                                                            Скажите, а что вы откладываете по оси ординат? Точнее в чем измеряете? Например, для буквы «а» это 8,5 процентов или чего?
                                                                                                              0
                                                                                                              Именно. Проценты.
                                                                                                              +1
                                                                                                              А как же дамп википедии?! :)
                                                                                                                0
                                                                                                                Очень интересно! Кто бы сподобился такие исследования провести и для российских нерусских языков, хотя бы представленных в сети. Так сказать снимок. Можно было бы с определенной периодичностью повторять (раз в пять-десять лет) и анализировать сдвиги.
                                                                                                                  0
                                                                                                                  Кстати россияне так же несильно понимают беларуску мову. Думаю что постоянное общение в белорусском (пассивное такое общение, у нас редко где на периферии встретишь вообще белорусский язык, в Минске и в глуши с этим получше) приводит к тому, что мы в той или иной мере понимаем оба языка, а поднапрягшись можно понять и украинскую речь, и польскую (немного лучше чем россияне)
                                                                                                                    +1
                                                                                                                    А классику не пробовали анализировать? Шевченко, Коцюбинский и т.п.? Было бы интересно сравнить литературный украинский и повседневный, хотя думаю разброс будет довольно небольшим.
                                                                                                                      0
                                                                                                                      Классику пыталиса анализировать мои предшественники. Не думаю, что были бы существенные отличия, но ради чистоты эксперимента можно попробовать.
                                                                                                                      0
                                                                                                                      а тригаммы для распознавания языка лучше всего катят.
                                                                                                                        0
                                                                                                                        Было бы здорово, если бы смогли выделить и опубликовать 50-100 тысяч наиболее часто используемых слов. Их можно было бы использовать для автоподсказок слов в мобильных устройствах. Еще было бы также интересно сравнить первые 50-100 наиболее часто употребляемых слов русского и украинского языка.
                                                                                                                          +1
                                                                                                                          50-100 тысяч? Шутите? :) Активной лексики в украинском языке меньше, а на форуме — так и тем более.
                                                                                                                          На самом деле задача уже много сложнее. Во первых тут нужно серьезное вовлечение морфологии. Во вторых — частота слов уже будет сильно от предмета разговора. В википедии она будет одна, в вашей скайп-инстории — другая, на форуме — третья, в зависимости от направленности форума — четвертая, пятая и шестая.

                                                                                                                          В конце концов есть частотные словари, составляемые учеными.
                                                                                                                            0
                                                                                                                            Если считать слова даже без учета падежей, то есть просто набор символов разделенных пробелами и знаками препинания, все равно лично мне интересно даже просто сколько различных слов в итоге получится, пусть даже на примере какого-то форума. Это бы сделало статью намного информативнее (имхо). А вам при наличии базы это должно быть очень просто сделать (опять имхо).
                                                                                                                              0
                                                                                                                              Да абсолютно не проблема. Пошуршим :)

                                                                                                                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                                                                        Самое читаемое