Методы ввода иероглифов

Ввиду роста популярности китайского языка в последнее время, решил поделиться своим опытом и небольшими наработками в принципах и методах ввода этих самых загадочных иероглифов. Для начала немного теории, что это и с чем это есть.




Введение

Что представляет из себя китайское письмо? Слова образуются из одного или нескольких иероглифов, в свою очередь иероглиф может быть простым или составным из ключа(радикала) и графических элементов. Пример: уважительное приветствие 您好 (Nín hǎo), дословный перевод которого «Вы хороший». Первый составной иероглиф состоит из 2х – 你 (Nǐ)- «Ты» и 心 (Xīn)«сердце». 你 – тоже состоит из 2х частей, ключа 亻 ( сокращенное от 人 (rén) — человек) и графемы 尔 ((ěr) – в современном языке в самостоятельном виде не употребляется). В скобках я указывал произношение иероглифа, пиньинь (pīnyīn), черточки над гласными – это тона, в северном диалекте Китая «Путунхуа» их 4 + нейтральный. На Путунхуа (так же называют mandarin), разговаривают в Пекине и северо-востоке, и который пытаются распространить как стандарт устной речи по всей территории КНР. Диалектов множество, и если удастся выучить Пекинский, Шанхайский вы все равно не поймете. Но особо не пугайтесь – письменная речь везде одинаковая, так что в QQ, на форумах и читая тех. документацию особого дискомфорта вы не почувствуете.
То есть, как все уже догадались, произношение иероглифа с его написанием мало чем связано. Не получится, открыв незнакомый текст просто взять его и озвучить, даже не понимая смысла. Так что, если в наши умные головы забредет шальная мысль выучить китайский язык, предупреждаю сразу, иероглифы придется УЧИТЬ (читать – зубрить), и учить с произношением и тонами.
Итак, мы начали учить, создали новую папку на компе для наших материалов и пытаемся ее обозвать. На русском или английском? Не профессионально! Открываем Google Translate и переводим «Китайский язык» и получаем красивое «中国的» . Поздравляю, вы освоили 1ый метод ввода. Но поспешу вас огорчить, ни чего подобного. Китайский язык – 汉语 (Hànyǔ). А теперь еще раз открываем Translate, выбираем перевод с Chinese -> Russian и на английской раскладке вводим «hanyu», не забыв поставить галочку «Allow phonetic typing», вылезает окошко, на котором с помощью клавиш навигации можно выбрать нужный вариант.



Pinyin

Да, ввод иероглифов с помощью фонетического письма, который мы только что применили называется пиньинем. Это самый распространенный метод ввода в Китае. Довольно таки быстрый и простой. Достаточно знать произношение слова и помнить его начертание.
На Windows написано с десяток программ, которые помогут нам общаться с нашими братьями на их родном языке с помощью пиньиня. Я отдал предпочтение 2м из них: Google Pinyin, Sogou pinyin. Для обывателя разница не существенна, интерфейс обеих на китайском. Sogou подбешивает частой рекламой и кучей ненужных сервисов в комплекте. Гугловская таких недостатков не имеет. Обе добавляют новую раскладку, переключаясь на которую при вводе выскакивает окошко, подобное Google Translater.

Для примера попробуем написать我喜爱的哈伯尔阿哈伯尔 (Wǒ xǐ'ài de hā bó ěr ā hā bó ěr). Переключаемся на китайскую раскладку и смело вводим woxiaide (мой любимый). Пока мы вводили, программа подбирала подходящий вариант фразы, имеющей смысл.Стоить отметить, что иероглифов с одинаковым произношением тьма тьмущая, и лучше вводить их порциями в зависимости от степени сложности фразы. Нажимаем пробел и вуоля — на экране заветное 我喜爱的 .



Дальше сложнее. Имена собственные просто так ввести не получится. Букв то нет. Поэтому название города Волгоград будет выглядеть как 伏尔加格勒 и читаться Fú'ěrjiā gé lè. То есть мало того, что у них нету звуков «в», «р», так еще и нету возможности написать сочетание нескольких звуков, если нет такого иероглифа с подобным звучанием. Именно поэтому имя Миша будет состоять из 2х иероглифов 米沙 (Mǐ Shā) – дословно переводящихся как «рис» и «песок». Паника? Ни чего не понятно? Уверяю вас, китайцам тоже. При моей просьбе проверить правильно ли я написал слово 哈伯尔阿哈伯尔 (Хабрахабр) подружка китаянка впала в ступор. Что это имя собственное ясно только из контекста. Так что нам остается только скрепя сердцем для заветного признания нашему проекту в любви вводить следующую порцию пиньиня «habo»



и из выпадающего списка выбрать клавишами вверх – вниз «哈伯» , пробел. Далее по накатанной «er» — 尔 , пробел, «а» — 阿 , пробел, опять «habo» — заметьте что искомые иероглифы уже на первом месте, можно сразу жать пробел и «er» — 尔 . Все, проверяем. 我喜爱的哈伯尔阿哈伯尔 (Wǒ xǐ'ài de hā bó ěr ā hā bó ěr).
В чем плюсы данного метода – не нужно рисовать сам иероглиф, что занимает гораздо больше времени. Не нужно соблюдать тона. Нужно помнить как выглядит иероглиф и как звучит. Кстати, есть очень большая разница между: знать, как выглядит иероглиф и знать, как его написать. И поэтому мы начнем учиться их писать.

Рукописный ввод

Здесь немного проще. Представьте. Идем, значит, мы по улице, а на заборе вместо привычных нам записей что то вроде 出口 . И как нам с этим быть? Пиньинь мы этих иероглифов не знаем, значит предыдущий метод нам не помощник. Открываем замечательный сайт и рядом с кнопкой «Поиск» видим карандаш, жмем, открывается целое поле для художеств, вот туда то нам и нужно перерисовать по одному наши иероглифы.



Вот такой распознаватель. Тут же можно посмотреть и произношение, и перевод. Так что в следующий раз, если заблудимся в одном из торговых центров Пекина, можем смело задавать вопрос 出口在哪儿? Ну или хотя бы искать табличку с такими краказябрами.

Плюсы данного метода – поиск незнакомых иероглифов. Можно даже приноровиться и писать со сносной скоростью. Особенно способ практичен на современных мобильных устройствах с тачскринами, и реализован крайне удобно.
Существует подвид метода рукописного ввода, или

Stroke

Если способностей к рисованию нет, или нет желания, можно обратиться к этому методу. Суть его в том, что все иероглифы написаны с помощью нехитрых закорючек и линий. У каждой такой линии есть свое название например у горизонтальной «heng», вертикальной «shu», вертикальной вниз потом горизонтальной вправо как несложно догадаться «shu heng». Всякие косые «pie» и «na», точки «dian»,… вот вам таблица для устрашения.



И, соответственно, имеется правило, в какой последовательности эти составляющие иероглифа писать (если очень утрированно, то сверху вниз, слева направо). Зная сие правило, а так же соответствия между закорючками и буквами (в разных программах может отличаться, на моём смартфоне все красивее ) можно так же просто его вводить.



Плюсы – не обязательно являться счастливым владельцем устройства с тачскрином, возможно каждому элементу назначить свою клавишу. Не нужно рисовать, не обязательно вводить все элементы. Обычно после 3-4х вылезает нужный иероглиф.

Wubi

Метод сложный, далеко не все китайцы умеют им пользоваться. Но и далеко не все китайцы умеют вообще читать и писать. Так что если хотите покорить сердца миллионов и иметь скорость около 150 иероглифов в минуту – вам сюда. Для начало придется выучить ключи (радикалы), их не много, около 250. Как выучим, сможем раскладывать иероглиф на составляющие (графемы). Пример 输: 车, 人, 一, 月,刂.
Теперь придется выучить расположение этих составляющих на клавиатуре. Тут тоже все просто: 5 зон, отмеченные разными цветами, порядковыми номерами зон и номерами, соответствующих количеству черт в графеме.



Значит, что бы ввести наш иероглиф 输 , нам придется найти на клавиатуре 4 клавиши, соответствующие графемам: «车» — L, «人» — W, «一» — G, «刂» — J. (если графем больше 4х, используются первые 3 и последняя).
Казалось бы, все просто, но есть множество иероглифов, состоящих из 2 или 3 графем, сочетания клавиш которых очень часто совпадают. Тут нам придется вдобавок выучить 4 группы, на которые делятся все иероглифы (базовые, иероглифы с несоединенными графемами, с соединенными и с пересекающими), и порядковый номер последней черты иероглифы, которые составляют код для идентификации искомого иероглифа.

Есть еще несколько гибридных методов ввода, не столь распространенных; распознавание речи. Но для продуктивного обучения без особых затрат на заучивание ненужностей, мой выбор пал на пиньинь. Дело не только в том, что я очень ленивый. Нас с детства учили писать буквами, соответствующими звукам речи, и пиньинь в этом плане очень схож с традиционным фонетическим написанием.

Если кому то показалось, что это все не рационально, поверьте, Вы не первый, пришедший к этой мысли. Менталитет другой. Путь их тернист и непрямолинеен, но что бы они не делали, делают с большим упорством и самоотдачей. Чего и вам желаю.
Share post
AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 70

    +8
    А я всё думал, что у них громадная клавиатура на много тысяч иероглифов, и они отыскивают каждый символ по несколько минут.
      +9
      Боюсь, тратя столько времени на набор текста, это бы сказалось на их популяции.
        +3
        Они бы просто не тратили время на набор текста, а шли бы увеличивать свою популяцию дальше
        –9
        Вы просто не смотрели аниме и не интересовались этим.
          +3
          На самом деле я пошутил, у меня есть китайская клавиатура. Но шутка не была оценена.
            +20
            По моему, у каждого клавиатура китайская)))
              +1
              Я имею в виду с китайскими иероглифами
              выглядит так


              Для любопытствующих — сверху платка промышленного компа
          +2
          Видимо, Вы пропустили этот пост. Рекомендую :)
            +1
            А теперь подумают, что у нас корпоративная политика — отвечать на посты в час дня :)
              0
              О-о, какая прелесть. Большое спасибо!
              +3
              Бывает и такое.
              Мои коллеги когда-то подробно писали об этом :)
              0
              Тема cangjie не раскрыта, как и тема строчных o в середине текста.
                +8
                Как хорошо быть русским.
                  +41
                  А уж как хорошо быть англоговорящим. Им и раскладку переключать не надо никогда.
                    +9
                    «… человек, который распространил английский язык от мыса Винцента до Уральских гор, — это заурядный англичанин, не способный к изучению языков, не желающий запоминать ни одного чужого слова и смело отправляющийся с кошельком в руке в какие угодно захолустья чужих земель. Его невежество может возмущать, его тупость скучна, его самоуверенность сердит, — но факт остается фактом: это он, именно он англизирует Европу. Для него швейцарский крестьянин идет по снегу в зимний вечер в английскую школу, открытую в каждой деревне; для него извозчик и кондуктор, горничная и прачка сидят над английскими учебниками и сборниками разговорных фраз; для него континентальные купцы посылают своих детей воспитываться в Англию; для него хозяева ресторанов и гостиниц, набирая состав прислуги, прибавляют к объявлению слова: «Обращаться могут только знающие английский язык».

                    Если бы английский народ признал чей-нибудь язык, кроме своего, то триумфальное шествие последнего прекратилось бы. Англичанин стоит среди иностранцев и позвякивает золотом: «Вот, — говорит он, — плата всем, кто умеет говорить по-английски!» Он великий учитель. Теоретически мы можем бранить его, но на деле должны снять пред ним шапку — он проповедник нашего родного языка!»

                    (Джером К.Джером. Трое на четырех колесах; начало ХХ века)
                      +2
                      И все же, унификация идет только на пользу.
                        0
                        сейчас скорее американцы английский двигают, нежели англичане
                          0
                          Сейчас да, тексту где-то сто лет…
                          Американцы ещё испанский двигают, но это не так пока заметно на фоне раскрученного маховика английского.
                          0
                          Если бы английский народ признал чей-нибудь язык, кроме своего, то триумфальное шествие последнего прекратилось бы.

                          Хорошо, что английский народ не признал
                      0
                      Букально пять минут назад выяснял, что написно у меня на свитере. Вот что получилось: www.zhonga.ru/cn/9iyq5
                        +10
                        Вам повезло больше, чем этому парню
                        (на правах задания для практики)

                          0
                          Гы!
                            +2
                            С большим трудом, с 10 раза, получилось 痔. Правильно?
                              +2
                              По переводу в google translate, видимо, да. У меня не получилось нарисовать.
                              +1
                                0
                                Верно, даже по-японски :)
                                  +2
                                  страшно подумать, сколько ещё таких товаров со странными надписями существует в неазиатском мире ))
                                  +7
                                0
                                Может это по японски seishounen, переводится примерно так же.
                                +8
                                Попробуйте озвучить в гугл-транслейте вот такую фразу: 把手拿回,回到!和主。:)

                                Ещё добавлю, что символы традиционной китайской письменности содержат гораздо больше штрихов и потому их, думается мне, вводить потруднее будет. Вот для сравнения пример одной и той же фразы на упрощённом и традиционном китайском.

                                Tios, а будет ли достаточно 4-х клавиш для ввода традиционных китайских символов? Или это применимо только к упрощённым иероглифам?
                                  +1
                                  Cangjie описывает традиционные ханзи в 4 клавиши. Собственно, wubi обычно пользуются для упрощённых, если не устраивает пиньин (например, если в данном регионе Китая говорят не на путунхуа, но всё же пишут упрощёнными ханзями). Cangjie делался для традиционных. У него много минусов и он менее интуитивен, чем wubi, но всё же применяется.
                                    +4
                                    Вы предупреждайте, что не стоит прослушивать на людях.
                                    +3
                                    Клавиатура на фотографии, японская. Выставлена в мюнхенском музее науки и техники :)
                                      +1
                                      Вы сломали мне мозг
                                        0
                                        Вероятно, люди и Brainfuck бы учили массово, если бы это была или культурная традиция, или признавалось стильной особенностью, или бы давало возможность увеличить зарплату…
                                          0
                                          BrainFuck почти не отличается от RISC16, который учат во всех нормальных ВУЗах. Только запись странная, а так можно сделать компилятор RISC16 -> BrainFuck.
                                            0
                                            Пардон, а что там учить? Вы бы лучше какой-нибудь Ithkuil вспомнили, там всё намного веселее.
                                            0
                                            >То есть, как все уже догадались, произношение иероглифа с его написанием мало чем связано.
                                            Т.е. и китаец без другого китайца не может изучать китайский. Иероглифов ведь очень много. Увидел китаец в книжке новый для него иероглиф. Как оно его прочитает? Надо позвать другого китайца? Звук другими иероглифами то нельзя написать?
                                              +2
                                              Кстати! А обратная ситуация? Звонит один китаец другому, просит что-то записать. И как это у них происходит?
                                              — Так… Записываешь? Иероглиф как домик, иероглиф как мышь читающая книгу, иероглиф как дикий обезьян.
                                              — Ага, записал!

                                              А еще интересно, как у языка с помехоустойчивостью? Если очень шумно.
                                              «Харитон, Андрей, Борис, Роман, Андрей, Харитон, Андрей, Борис, Роман» — так можно?
                                                +2
                                                Во-первых, есть словари, как бумажные (с поиском по заранее определённым «ключевым» частям иероглифа), так и электронные (ищут по любой части). Иероглифы за очень редким исключением являются комбинацией ~200 базовых частей, чуть меньше в японском, да и после упрощения их немного.
                                                Во-вторых, в иероглифах, как правило, есть фонетик — часть, определяющая чтение. Это не строгое правило, но всё же помогает. У европейцев есть проблемы с чтением/смыслом незнакомых слов (куда ставить ударение, например).

                                                В японском помехоустойчивость обеспечивается тем, что в устной речи используют длинные синонимы вместо китайских коротких терминов. В том числе и синонимы английского происхождения. Устная и письменная речь серьёзно отличается. Китайцы могут обойтись просто за счёт фонетики, всё же тона — мощная вещь.

                                                Кстати, почему всем нужно озвучивать читаемый текст? Первый же шаг в скорочтении — отказ от этого. Идеографическая запись неплохо помогает в этом.
                                                  0
                                                  >Кстати, почему всем нужно озвучивать читаемый текст?
                                                  >Т.е. и китаец без другого китайца не может изучать китайский.

                                                  Речь про изучение. Т.е., чтобы прочитав, китаец мог иероглиф сказать.
                                                    0
                                                    Иностранцам всегда хватало словаря. Нативы учат в школе. В чём проблема?

                                                    Вообще есть фонетические азбуки, есть подписанное чтение (htmlный тег ruby сделали именно для этого), подписать чтение прямо в учебном тексте — вполне себе нормальная практика. В японском в каждой манге/книге для среднешкольников каждый иероглиф (ну, может кроме самых банальных) подписан, в китайском может быть то же самое.
                                                      0
                                                      Спасибо! Вот, собственно этого и не знал и хотел уточнить как происходит обучение.
                                                      +1
                                                      Раньше для целей обучения сами китайцы использовали слоговую азбуку бопомофо. Теперь уже почти полностью перешли на пиньинь. Сам по себе пиньинь придуман не так давно — в середине двадцатого века.
                                                +3
                                                Да уж, японский язык в сравнении с китайским сразу выглядит куда проще.
                                                  +3
                                                  Ну если говорить про устную речь, то она схожа с нашей.(:
                                                  +1
                                                  С чего лучше начать самостоятельное изучение китайского?
                                                    +7
                                                    Hànyǔ

                                                    Сразу так без ошибок и не прочтешь.
                                                      +3
                                                      В том и беда, что читается с ходу.
                                                      … Только неправильно.
                                                        –3
                                                        Те же яйца, только в профиль.
                                                      0
                                                      По-моему, подобные способы ввода называются IME и давно уже изобретены.
                                                        0
                                                        Прочитал, ужаснулся, решил вместо китайского языка учить автомат Калашникова.
                                                          0
                                                          Фонетический набор текста очень популярен в языках с иероглифическим письмом, самое тяжкое это необходимость знать какой именно иероглиф набирать, так как разные иероглифы могут звучать одинаково но писаться по разному.
                                                          Пример из японского языка:
                                                          niwa — может иметь значение как «птичка» так и «сад».

                                                          А методика набора сводиться лишь к правильному выбору иероглифов при наборе текста, и по хорошему в этом нет никаких проблем.
                                                          А с клавиатурами с методикой набора по «черточкам», ИМХО там сам черт ногу сломит, для и никакого набора для фонтазии и словообразованию.
                                                            0
                                                            Проблема в том, что нельзя печатать, не задумываясь о процессе. Теряется вся суть слепой печати. Плюс до сих пор не все в Китае знают путунхуа, следовательно, и пиньин.

                                                            wubizixing — вполне рабочий метод, пусть и требующий освоения. Он интуитивен. 5 зон на клавиатуре: левый склон, правый склон, горизонтальная черта, вертикальная черта, всё остальное/крюк; 1 элемент в центре (一/上), 2 чуть дальше, 3 черты в середине (как 三/川), прочее на последних двух клавишах каждой зоны. Есть клавиша z, которая работает как wildcard, если не уверен в какой-либо части иероглифа (в современных IME в этом случае показывается тот же выбор, что и в фонетических методах ввода) либо она не раскладывается в простые формы. Есть шорткаты для нескольких часто встречающихся иероглифов (смотреть на единичный иероглиф в углу каждой клавиши), есть обозначения для частых радикалов (на каждой клавише), а в последние лет 15 — ещё и словосочетаний. Каждый иероглиф строго определён максимум 4мя клавишами, для слепой печати — самое то.

                                                            Аналогично с wubihua, «телефонным» методом с пятью чертами на пяти клавишах. Порядок на 100% совпадает с порядком письма. Все грамотные люди знают, в каком порядке пишется каждый ключ и каждый иероглиф. Он не настолько быстр, но всё же он — самый простой способ, проще пиньина хотя бы из-за того, что достаточно форму, чтобы написать иероглиф (даже чтение не нужно).
                                                            0
                                                            Начиная с Windows 7 не обязателъно полъзоватъся сторонними программами для ввода пинъиня, достаточно добавитъ новую раскладку — китайский упрощенный (pīnyīn) и потом также переключатъся между тремя языками ввода. Макосъ тоже умеет, правда немного коряво. За ссылки на распознавалки рукописного ввода спасибо великое, а то я по старинке болъшим шанхайским словарем полъзуюсъ…
                                                              +4
                                                              Китайские клавиатуры всегда будоражили ум, но однажды я на коробке из-под дата-кабеля увидел, что там обычная клава, просто с 4мя символами на каждой кнопке и успокоился.
                                                              PS
                                                              Теперь, если где-то встречается не простыня, а немного иероглифов (китайских, само собой), то можно сделать так:
                                                              1. Сохраняем изображение.
                                                              2. Убираем фон
                                                              alt
                                                              3. Изменяем размер
                                                              alt
                                                              4. Ищем Chinese ocr
                                                              alt
                                                              5. Находим, качаем
                                                              alt
                                                              6. Запускаем, открываем файл
                                                              alt
                                                              7. Копируем результат в Google Translate
                                                              alt
                                                              8. Готово!
                                                                0
                                                                Этапы 4, 5 и 6 можно заменить на использование Google Docs — там есть OCR. Я именно таким образом переводил таблички из тойоты.
                                                                  0
                                                                  Спасибо, надо будет попробовать. А то осталось тут одно незаконченное дельце с иероглифами, может пойдёт…
                                                                  0
                                                                  Этапы 2-8 так же можно заменить камерой из GTranslate на каком нибудь andoid'e
                                                                  0
                                                                  У меня в Ubuntu очень удобно — по Alt+Shift переключается английская/русская раскладки, а по Ctrl+Space появляется ввод иероглифов (DBus вроде бы называется). В Windows XP мне такую красоту так и не получилось настроить. Настройки в Sogou и, вроде бы, в Google Pinyin тоже, все на китайском, а это пока не мой уровень. Посоветуете что-нибудь чтобы китайский в alt+shift'е не мешался?
                                                                    0
                                                                    punto switcher умеет это. Можно и через autohotkey.
                                                                    0
                                                                    Спасибо, теперь я знаю, что означает иероглиф у matousec :)
                                                                      0
                                                                      Кто-нибудь может помочь мне прочесть это, пожалуйста?
                                                                      habrastorage.org/storage2/285/b34/fbf/285b34fbfa0a5dacc28dfa6707221aa8.png
                                                                        0
                                                                          0
                                                                          Я не знаю китайского, но множественные символы человека друг над другом я бы перевёл как «великий руководитель».
                                                                            +1
                                                                            Вы явно лукавите насчет ваших знаний китайского.

                                                                            Вот еще одна задачка (переводчиками не пользоваться):
                                                                            Если 木 — дерево, то
                                                                            林 — ?
                                                                            森 — ?
                                                                              0
                                                                              Ну я бы сказал, что 林 — лес, 森 — природа (окружающий мир). Но я правда не знаю китайского совсем.
                                                                          +2

                                                                          Построил товарищ из японского гугла; барабанные палочки в комплекте.
                                                                            +2
                                                                            С недавнего времени изучаю китайский. До сих пор плююсь на неоптимальность такой письменности. После языков программирования, где логика возведена в абсолют, изучать язык, в котором ею вообще не пахнет, мучительно больно и тяжело. Ни логики, ни какой бы то ни было оптимальности. С точки зрения сегодняшней реальности этот язык (по крайней мере его письменность) требует конкретной такой реформации, но вряд ли это случится. Хотя Мао же провел упрощение и внедрение пиньина железной рукой. Кто знает, может появится в будущем новая железная рука и подарит благодать несчастному китайскому народу :)

                                                                            Кстати, на мобильниках и тачкаде макбуков есть возможность рисовать иероглифы пальцем, НО рисовать иероглифы — это не просто срисовать картинку. Это надо каждую черточку в определенной последовательности рисовать, иначе ничего не распознается. Итого, чтобы писать на китайском, надо знать:
                                                                            1) как выглядит иероглиф
                                                                            2) как читается (+ тон)
                                                                            3) как переводится
                                                                            4) как пишется (порядок линий)
                                                                            • UFO just landed and posted this here

                                                                              Only users with full accounts can post comments. Log in, please.