Pull to refresh

Comments 36

Вы решили повторить то, что в своё время делали большевики, они русский алфавит, а также татарский и башкирский, может быть ещё какой-то, начинали переводить на латиницу. Для татар и башкир создавать заново, эти два народа писали на арабском.

Да, были такие проекты, причем самые разнообразные. И как в сторону латиницы, так и в сторону кириллицы

надо ё (йо) надо транслитирировать не в ë, а в ö, тогда я и ю будут ä и ü

Ну, это в целом очень логично и последовательно по части диакритики. Концепт хороший, но это всё довольно чувствительно к нагромождению диакритических знаков в текстах и дело привычки, поэтому мне показалось, что лучше оставить как можно меньше диакритических знаков, чтобы оно казалось более кириллическим и естественным. В итоге их осталось всего два, - и они расположены ровно на тех же самых местах, где они уже и так были в кириллице, и сами значки тоже те же самые - кратка (бревис) и умлаут. Но ничто не мешает сделать по-вашему

Хотя, возможно, лучше вместо точек взять кратку (бревис) под вашу задумку, чтобы был всего один тип диакритики

У меня только 2 вопроса - зачем и на..я?

Кириллица прекрасно приспособлена к фонетике русского языка. Да, она странно выглядит для тех, чьи родные языки пишутся латиницей. Да, она заставляет переключать раскладку клавиатуры. Но это не те причины, ради которых стоит ломать действительно подходящую письменность. Как и экономия байт в раскладке utf-8 или страниц в книгах.

У нас перед глазами есть примеры славянских языков с латинской письменностью, в которых черт ногу сломит. Например, польского с д графами и диакритикой.

Так зачем?

У нас перед глазами есть примеры славянских языков с латинской письменностью, в которых черт ногу сломит. Например, польского с д графами и диакритикой.

Ну, в статье я вообще-то это затрагивал в критериях

  • Минимум диакритических знаков

  • Минимум диграфов и триграфов или ещё чего похуже

Минимум диграфов - это как минимум сломанных пальцев. Нормальное состояние - когда их нет, поскольку это костыли для приспособления чуждой письменности к языку.

В целом я с вами согласен. Но тем не менее есть, например, сочетание СЧ, которое на Щ не торопятся заменять.

Это я не упоминал явно, но соответствие один к одному мне выжать удалось. То есть диграфов и тем более триграфов нет вообще.

Но проблемы скорее типографические и с привыканием. А так в целом люди влспринимают письмо практически по памяти, но отказываться от звукового соответствия было бы слишком большой потерей целой связи, облегчающей восприятие

СЧ - это не диграф для звука Щ. Это сильная тенденция в беглой устной речи объединять два разных звука в один. Причем не только внутри слова, а и на границе "из чего" - "ищево". БОльшую часть слов с сочетанием СЧ мы можем произносить двумя способами: "расческа" и "ращеска".

ТС в данном отношении ещё слабее.

Тем не менее нам никак не мешает расхождение фактического произошения и написания слова.

У меня только 2 вопроса - зачем и на..я?

Ну, лично мне хотелось просто посмотреть, как это будет выглядеть, а все существующие варианты, которые мне всплывали в интернете и в том числе на Хабре, мне показались довольно уродливыми как раз по причинам, которые вы назвали - диграфы/триграфы, диакритика и несовместимость с текущей кириллицей...

А так вообще не за чем

Я не понимаю. Ресурс населён в основном программистами, причём не программистами на APL. Казалось бы, можно ожидать, напротив, подхода "всё должно записываться символами ASCII".

Да и вообще пора уже отказаться от архаичных естественных языков и перейти в общении на C или Python

С ЛЛМ неожиданно удобно общаться на perl. Может и с людьми, только не на питоне - а то вдруг захочется всех построить.

В русской кириллице как минимум три диграфа (Щ, Ы, Ю), которые за века употребления стали писаться безотрывно, а потом и печататься одной литерой. В юникоде предостаточно латинских диграфов единым code point: https://en.wikipedia.org/wiki/List_of_precomposed_Latin_characters_in_Unicode#Digraphs_and_ligatures -- любой из них можно считать полноценной отдельной буквой.

Так что разница между диграфами, лигатурами (вроде сербских Љ и Њ) и монографами субъективна: границы между ними можно провести где угодно, по вкусу проводящего.

Неважно, как там писалось раньше. Раньше и язык в целом тоже был сильно другой, и подавляющее большинство из нас его просто не смогло бы понимать. Мы рассматриваем современный русский язык и современную же кириллицу. И прямо сейчас никаких диграфов в русской кириллице нет. Один звук - одна буква.
Количество кодовых точек - это вообще дело десятое.
А границы вполне объективны. Диграф по определению делим, поскольку состоит из двух отдельных частей, каждая из которых имеет самостоятельное значение.
И при чтении мозгу необходимо выполнять дополнительную работу, чтобы понять, является ли этот конкретный символ частью диграфа или же нет. Даже если человек хорошо и быстро читает, это не значит, что мозг эту работу не выполняет. Зачем нагружать мозг бессмысленной работой, приделывая к языку чужой алфавит? Чтобы что?

Кроме одного лишь корейского, все алфавиты в мире -- чужие, и создавались для нужд одних языков, а потом приделывались к другим. И русский алфавит -- не исключение.

Хорошо приспособленный алфавит - это уже свой алфавит. Латиница даже близко не приспособлена к русской фонетике.
На главный вопрос (зачем?) ответа так и нет.

Кириллица прекрасно приспособлена к фонетике русского языка.

Это почему болгарско-греческий к чему-то там приспособлен, а латинская адаптация нет?

У нас перед глазами есть примеры славянских языков с латинской письменностью, в которых черт ногу сломит. Например, польского 

А может поляков спросим что они думают про то как греческо-болгарский алфавит подходит славянским языкам? Крайне подозреваю что на сохранившиеся одинаковые слова написанные на кириллице поляк так же будет смотреть и говорить что это какие-то непонятные кракозябры, как я смотрю на szczęście.

Так зачем?

Не зачем, точнее цена слишком велика - пару десятилетий назад еще, когда технологии были нерусифицированные, еще можно было поднять вопрос о латинице. Более того транслит использовался добровольно и с песней. То сейчас нет, никто не поймет зачем.

Во-первых, речь идет о современной кириллице, а не о непонятном "болгарско-греческом". И приспособлена она как ни странно именно потому что приспособлена: на каждый звук в языке есть своя отдельная буква. В отличие от латиницы.
Во-вторых, привыкнуть можно ко всему, даже к корявой записи латиницей звуков, для записи которых латиница не создавалась. И привычное, естественно, будет казаться проще и понятнее. Но очевидно, что система записи "один звук - одна буква" гораздо удобнее. Польская латиница кроме кучи диграфов для согласных имеет и чудесные носовые гласные, которые мало того, что не имеют ничего общего с очень похожими обычными гласными, так ещё и по-разному читаются в зависимости от окружения.
Ząb - почти заб, но хрен там - зОМб. Sprzątać - почти спшатач, но опять же хрен там - спшОНтач. Почему так? Где хоть какая-то логика?
Транслит использовался добровольно и с песней именно в силу отсутствия нормальной русификации, а более широко интернационализации. Когда нет возможности ходить на своих ногах, костыли - это намного лучше, чем ничего. Но это все равно костыли.
Итого. Никаких преимуществ латинизация не дает. Особенно сейчас, при наличии unicode.

И приспособлена она как ни странно именно потому что приспособлена: на каждый звук в языке есть своя отдельная буква.

Ага, легко разгибать его загадки (все пять букв Г произносятся по-разному). Домашнее задание: найдите примеры с шестым произношением этой же буквы.

Кроме массы уже приведённых примеров -- например, что для большинства мягких согласных в русском алфавите нет своих отдельных букв -- попытайтесь объяснить, почему одно и то же "в тесте" произносится с твёрдым Т, когда это ошибка в тесте, и с мягким Т, когда это сосиска в тесте. Почему так? Где хоть какая-то логика?

мало того, что не имеют ничего общего с очень похожими обычными гласными, так ещё и по-разному читаются в зависимости от окружения. Ząb - почти заб, но хрен там - зОМб. Sprzątać почти спшатач, но опять же хрен там - спшОНтач. Почему так? Где хоть какая-то логика?

Вы всерьёз спрашиваете, почему визуально похожие буквы обозначают совсем разные звуки? Это так же несерьёзно, как "enjoy -- почти эниой, но какого хрена хвостик под i так резко меняет произношение? Где хоть какая-то логика?"

Или вопрос про ассимиляцию при произношении? Русские правила ассимиляции намного сложнее, я их выше перечислял (одна и та же приставка с- шестью разными способами произносится в словах спал, стёк, сдал, сделал, сжёг, сшил) -- но вы ведь о них даже не задумываетесь.

Но очевидно, что система записи "один звук - одна буква" гораздо удобнее. Польская латиница кроме кучи диграфов для согласных

При вашей-то неприязни к диграфам -- вам нисколько не претит, что русские пары букв БЬ, ВЬ, ДЬ и т.д по алфавиту -- обозначают по одному согласному звуку каждый? Чем отвергаемые вами сербские диграфы LJ и NJ хуже равнозначных русских ЛЬ и НЬ?

Кириллица прекрасно приспособлена к фонетике русского языка.

Русская кириллица была приспособлена к той фонетике, которая была тысячу лет назад; а к нынешней не приспособлена вообще -- но вы настолько привыкли к расхождениям между написанием и произношением, что не замечаете их в упор. Так же и англичанам их орфография кажется понятной и естественной, хотя изучающим английский как иностранный выносит мозг по полной программе.

  • буква Ъ обозначает [j], ровно как и Й;

  • буквы Е, Ё, Ю, Я в зависимости от положения обозначают либо [e, o, u, a] либо [je, jo, ju, ja]; в первом случае те же звуки обозначаются ещё и буквами Э, О, У, А;

  • буквы И, Е, Ё, Ь, Ю, Я после некоторых согласных меняют его произношение, после других (Ж, Й, Ц, Ч, Ш, Щ) -- не меняют произношение, а пишутся вместо Ы, Э, О, ∅, У, А по изощрённым правилам, которыми школьниками дрючат несколько лет;

  • как выше упомянул @MainEditor0, сочетания ЖЧ, ЗЧ, СЧ все одинаково читаются как Щ; кроме того, ЗШ, СШ одинаково читаются как ШШ, а ЗЖ, СЖ -- как ЖЖ;

  • кроме этой ассимиляции свистящих, на письме также не отражаются ассимиляция по мягкости и по звонкости (сделай [z'd'elaj), конечное оглушение (съезд [sjest]), выпадение согласных во стечениях и редукция безударных гласных (поздно [pozna]);

  • ну и наконец, есть "исторически сложившиеся написания" -его, -ого для [-iva, -ivo, -ava, -avo, -ova] и -тся, -ться для [-tsa], которые не следуют никаким более общим правилам.

У нас перед глазами есть примеры славянских языков с латинской письменностью, в которых черт ногу сломит. Например, польского с д графами и диакритикой.

Потому что польская орфография почти такая же древняя и консервативная, как и русская. Комментаторы ниже справедливо предложили вместо поляков смотреть на сербов: их орфографии меньше двух веков, и она идеально соответствует фонетике -- всё как слышится, так и пишется.

У фонетики, которая была тысячу лет назад, и алфавит был другой.
Согласен с тем, что письменный русский язык не является абсолютно фонетическим.
Хотя не согласен с тем, что правила орфографии изощренные, и их нужно изучать несколько лет. При этом их вполне можно сформулировать, зная только устный язык и алфавит. Они есть в конце концов.
Английский же с точки зрения алфавита и орфографии - это полная каша и отсутствие всякой логики. Почему буква E называется "и", но в одиночку звук "и" не обозначает, а только когда их 2 подряд? Почему буква O "оу" обозначает кроме звуков "о", "оу" и "у" (tool) (в этих случаях хотя бы есть правила) ещё и "а" (blood)?
Одни и те же сочетания букв могут означать разные звуки. "Th" может быть звонким или глухим. А "ough" вообще читается как минимум 4 разными способами. "So" и "though" по произношению отличаются только первым согласным звуком. Но во втором случае букв втрое больше! И наоборот, с одинаковыми звуками [бай] есть 3 разных слова - by, bye и buy. Можно сконструировать как минимум ещё 2, которые должны звучать так же: bie (по аналогии с lie) и bigh (по аналогии с sigh). Итого 5(!) способов записать сочетание звуков [ай]. Примеры можно приводить практически бесконечно. И нет никаких правил как и почему происходит именно так. Исторически сложилось. Патамушта. Поэтому вряд ли даже англичанам их орфография кажется такой уж простой и естественной. Про логику я вообще молчу.

Уверяю, что англичанин будет точно так же, как и вы про русскую кириллицу, рассказывать, что всё подчинено простым и понятным правилам, которые он, правда, сформулировать не сможет - как и вы вряд ли сможете сформулировать русские. Толщину розенталевского свода правил русской орфографии видели?

Но я ведь предлагаю в качестве примера, к которому стоит стремиться, вовсе не английскую латиницу, а сербскую.

Мы говорим о разных вещах. Вы перешли от фонетики (2 варианта озвучки йотированных согласных, смягчение предыдущих согласных следующими гласными и т.п.), чьи правила существуют и элементарно формулируются, к орфографии в общем. В английском же правил фонетики нет. Одни и те же последовательности букв могут давать разные звуки, а одни и те же звуки могут записываться разными последовательностями букв. И почему так - никакой англичанин не скажет. Нет объяснения кроме патамушта.
В этом смысле английский близок к китайскому. Нельзя по начертанию узнать ни значение ни звучание нового иероглифа, увидев его впервые. В английском это конечно не настолько выражено, какие-то правила чтения есть. Но с русским даже сравнивать смешно.
И да, сербская латиница - это и диграфы и диакритика.
В который раз задаю вопрос - зачем? Чтобы что?

Нельзя по начертанию узнать ни значение ни звучание нового иероглифа, увидев его впервые. В английском это конечно не настолько выражено, какие-то правила чтения есть. Но с русским даже сравнивать смешно.

Ну тут смотря как сравнивать. Если корень неизвестен, то будет точно так же, разве что шанс на проблему с произношением ниже. В английском тоже есть некоторая синтетичность в некоторых аспектах, но если костяк слова неизвестен, то и общий смысл будет так же загадкой

сербская латиница - это и диграфы и диакритика

Поэтому мне она тоже не нравится, поэтому диграфы я исключил, а диакритику оставил на тех же местах

В который раз задаю вопрос - зачем? Чтобы что?

Зеркально это как, допустим, попробовать измерить что-то не в дюймах, а в сантиметрах, попробовав международный стандарт в обычной жизни, а практического смысла в этом мало

Мы говорим о разных вещах. Вы перешли от фонетики (2 варианта озвучки йотированных согласных, смягчение предыдущих согласных следующими гласными и т.п.), чьи правила существуют и элементарно формулируются, к орфографии в общем.

Вам мерещится, что "смягчение предыдущих согласных следующими гласными" -- это правило фонетики, а не орфографии, именно потому, что русская орфография это смягчение обозначает выбором гласных букв, а не согласных. (Противоположный подход принят, например, в сербской кириллице, где смягчение обозначается выбором согласной буквы, а гласная остаётся неизменной: угла, углу vs. угља, угљу "угля, углю").

В английском же правил фонетики нет. Одни и те же последовательности букв могут давать разные звуки, а одни и те же звуки могут записываться разными последовательностями букв.

Так и есть -- в точности как и в русском. И в точности так же, как вы в упор не видите такие места в русской орфографии, но отлично видите в английской -- так и англичанину кажется, что разные произношения одинаковых последовательностей английских букв -- это "правила фонетики, которые существуют и элементарно формулируются" (притом что сформулировать их он, конечно, не сможет), зато он отлично видит такое в русской орфографии.

И почему так - никакой англичанин не скажет. Нет объяснения кроме патамушта.

Можно подумать, у вас есть лучшее объяснение "особенностям" русской орфографии, чем "правила вполне можно сформулировать, но делать этого я не буду".

И да, сербская латиница - это и диграфы и диакритика.

К диакритике-то у вас какие претензии? И распространяются ли они на русские Ё и Й, или только на латиницу?

Слишком молодой.

Вот и выросло поколение, которое...

Очередной Франкенштейн на алфавитном поле

Možna vzjatj gatovuju sistjemu Vuka Karadjića i sljehka jijo adaptjiravatj pad ruskuju fanetiku, naprimjer ispoljzavatj j meždu saglasnimji dlja šva: mjlako.

Велосипед. Гораздо эффективнее взять алфавит любой славянской страны (например сербский, потому что у них натурально в ходу и кириллица и латиница) и доработать.

Postav'te sebe karel'skuü raskladku v Google klaviature i ne nado šamanit' polukirillicu polulatinicu.

Многовато диакритики, также апостроф довольно маленький, а мягкость звука имеет большое значение, мягкий знак достаточно крупный и выразительный, отображение не один к одному

Sign up to leave a comment.

Articles