В китайском языке насчитываются десятки тысяч иероглифов. Кто-нибудь задумывался, как вообще можно набирать их все на клавиатуре, имеющей сопоставимые со стандартной размеры? Не такой, как на фото выше.🙂
Забегая вперед скажем, что сейчас это делается при помощи программного интерфейса Input Manager Editor (IME). Но еще 50-60 лет IME не было, а компьютеры в КНР, как и потребность в наборе текста, была. Как же выходили из ситуации? Тут на сцену выходит студент электротехнического факультета Вирджинского военного института Чан-хуэй Йе. Но обо всем по порядку.
Как обстояли дела с компьютерами в Китае в 50-х и 60-х годах
Многие полагают, что о компьютерах в Китае по-серьезному вспомнили только после событий на площади Тяньаньмэнь в 1989 году. Частично это правда. Технологический рывок Поднебесной начался именно в тот период, во многом из-за эмбарго США и Европы на экспорт высокотехнологичной продукции. Но все-таки и до 1989 года Китай, хоть и считался относительно небогатой страной, выпускал и использовал компьютеры, пусть и в значительно меньших масштабах. Давайте кратко пройдемся по основным вехам, которые пришлись на 50-е и 60-е годы.
В 1950 году СССР и КНР подписали всеобъемлющий «Договор о дружбе, союзе и взаимной помощи», почти сразу после победы сил Революции над Гоминьданом. Китай остро нуждался в новых специалистах и быстрой индустриализации после почти 25 лет непрерывной гражданской войны. В СССР потекли сотни инженеров на обучение по разным направлениям: от физики и биологии до механики и сельского хозяйства.
Одна из делегаций посетила Институт точной механики и вычислительной техники (ИТМиВТ), где в 1952 году увидела первый большой советский компьютер БЭСМ-1, построенный на архитектуре фон Неймана. В нем был реализован принцип параллельной обработки разрядов и возможность проведения операций над числами с плавающей запятой. Оперативная память имела объем 2047 39-разрядных ячеек, а также была возможность записи на внешние магнитные носители. Машина занимала целую комнату: была построена с использованием примерно 5000 ламп, 2000 диодов и потребляла около 35 кВт, при этом обеспечивая быстродействие до 8000 операций в секунду.
Надо отметить, что установка произвела неизгладимое впечатление на китайских коллег. Руководитель ИТМиВТ Сергей Алексеевич Лебедев был приятно удивлен интересом. Следующий визит состоялся в 1956 году — Лебедев показывал уже прототип БЭСМ-2. И к тому моменту Китай принял решение: использовать на первых этапах советскую помощь и наработки. Сначала за основу хотели взять компьютер М-20, но все-таки остановились на БЭСМ.
После недолгих переговоров приняли решение: группа китайских специалистов будет обучаться в вузах Москвы, пока наши специалисты будут читать лекции и помогать создавать первый китайский ЭВМ. Осенью 1957 года Лебедев выделил для долговременной командировки одного из своих самых толковых специалистов — Олега Константиновича Щербакова.
Китай создал собственный Институт вычислительной техники (ИВТ) и принялся за разработку копии БЭСМ-2. На тот момент в Поднебесной еще не умели производить нужные компоненты: полупроводниковые диоды, ферритовые сердечники и так далее. Часть нужных компонентов поставлялись напрямую из СССР, а часть решили производить на новом электротехническом заводе на месте, построенном также при нашем содействии. Налаживанием производства и организацией сборки компьютера руководил лично Олег Щербаков.
К началу 1958 года десятки тысяч нужных компонентов были готовы, а к маю первый компьютер БЭСМ-2 был собран — он получил название Model 103. Осенью того же года предприятие посетила комиссия, которая провела приемо-сдаточные испытания. Параллельно к проекту подключились еще несколько наших специалистов: А.А. Павликов и Ю.И. Визун. Спустя год была собрана и копия другого нашего ЭВМ M-3 — это устройство в Китае получило название Model 104.
Однако не все было так безоблачно. В 1953 году, сразу после смерти Сталина, известный китайский математик Хуа Логенг с подачи руководства КНР основал независимую компьютерную исследовательскую группу с задачей «изучения принципов и конструкции электронных компьютеров и экспериментирования с их основными компонентами». А после доклада Н.С. Хрущева на XX съезде КПСС, развенчавшего «культ личности Сталина», Мао Цзедун крепко задумался об отношениях с СССР. В 1959 году, после нескольких «колебаний линии партии» (вроде кампании «Ста цветов»), в отношениях двух стран наметился раскол.
По этой причине китайские специалисты обучались не только в СССР, но и в других странах — например, в США, чтобы перенимать как можно больше знаний. Цель — создать первый по-настоящему китайский компьютер, а не просто копию БЭСМ. В правительстве КНР понимали, насколько губительной может стать зависимость от СССР, политический курс которой довольно круто изменился с приходом к власти Хрущева.
Одной из лучших учениц Хуа Логенга, которая занималась разработкой первого китайского компьютера, была Ся Пейсу — выпускница Эдинбургского университета, позже прозванная «Матерью компьютерной науки в Китае». Она не только разработала курс компьютерной теории для китайских студентов, но и была в составе делегации, которая посещала ИТМиВТ в 1956 году.
Основываясь на опыте советских наработок (уже созданных Model 103 и 104), группа китайских ученых во главе с Ся создала Model 107 в 1960 году. Это также был компьютер на базе ламп и диодов, построенный на архитектуре фон Неймана. Объем памяти — 1024 байта, с возможностью выполнения 16 команд, начиная от базовых сложения и вычитания и заканчивая условными переходами и печатью. К сожалению, найти более подробное описание машины не удалось — поэтому сложно оценить степень заимствования от советских компьютеров M-3 и БЭСМ-2.
Факт в том, что дальше группа Ся Пейсу продолжила создание компьютеров в Китае. В 60-х годах произошел переход на транзисторы, а в начале 70-х — на интегральные микросхемы.
В 1972 году делегация под руководством Ричарда Никсона посетила Китай, что ознаменовало новую эру в отношениях двух стран. Спустя несколько месяцев группа из шести американских специалистов посетила Китай, чтобы познакомиться с компьютерами. Это были представители самых передовых университетов:
Томас Читэм (Гарвардский университет);
Уэсли Кларк (Вашингтонский университет);
Анатоль Холт (Massachusetts Computer Associates);
Северо Орнштейн (Болт, Беранек и Ньюман — ранее в Вашингтонском университете);
Алан Перлис (Йельский университет);
Герберт Саймон (Университет Карнеги-Меллона).
Когда комиссия оказалась в Шанхайском компьютерном институте, то была мягко говоря, шокирована. Компьютеры использовались для самых разных задач: от фундаментальной вычислительной математики и структурного анализа до прикладных задач вроде расчетов оптических линз, плотин и постов. А в Пекинском институте компьютерных технологий американцам показали самый продвинутый Model 111 — построенный на интегральных схемах мейнфрейм, имевший монитор с электронно-лучевой трубкой.
Шок специалистов нетрудно понять: про разработку компьютеров в Китае никто не слышал. А оказалось, что в закрытой социалистической стране, в которой тогда вовсю бушевала «культурная революция» со всеми вытекающими последствиями, есть столь продвинутые технологии.
Однако достаточно остро стоял другой вопрос — с вводом информации. В «Большом словаре китайского языка», изданном в 1916 году, насчитывалось 48 000 иероглифов. Очевидно, что это существенно отличается от 26 букв английского алфавита.
Для решения проблемы коммуникации использовали несколько так называемых систем романизации — методов передачи китайских слов с помощью латинского алфавита. Последней в 1958 году стала пиньинь, построенная на очень упрощённом сочетании символов инициалей (начальных слогов) и финалей (конечных слогов) разных китайских букв. Подробнее о ней можно почитать в статье на Википедии.
Но факт в том, что столь сильное упрощение китайской письменности, насчитывавшей тысячелетнюю историю, не всеми воспринималось как правильное решение. Одним из таких людей, противящихся внедрению концепции Ханьюй пиньинь, стал Чан-хуэй Йе — студент электротехнического факультета Вирджинского военного института (VMI). И мысль эта укрепилась в его голове во время лекции историка Арнольда Дж. Тойнби, посвященной культуре и самобытности Китая.
Появление системы ввода IPX
Смысл лекции Тойнби сводился к тому, что именно иероглифическая письменность — объединяющая среда для всех китайцев, одно из ее главных особенностей и достижений. И попытки романизации языка неизбежно приведут к тому, что китайская идентичность окажется под угрозой. Драматизм лекции был на таком уровне, что патриотично настроенный Чан-хуэй Йе подумал: «Китай погибнет из-за этого», намекая на засилье пиньинь.
Молодой студент вышел из зала с четким желанием спасти Родину. И он точно знал, что для этого нужно сделать. Шел 1958 год.
Чан-хуэй Йе окончил университет в 1960 году, получив степень бакалавра наук в области электротехники. После чего в 1963 году получил степень магистра ядерной инженерии в Корнеллский университет. В 1965 году Йе берут на работу в IBM — там он занимается вычислительным моделированием для АСУ разных предприятий вроде бумажных фабрик, нефтехимических, сталелитейных и сахарных заводов, и так далее.
Однако он не оставлял своих стремлений и после работы изучал варианты цифровой обработки китайских иероглифов. Начальство не было против чудачеств Йе, раз он занимался ими в нерабочее время.
Йе начал с самых сложных частей китайского лексикона и отталкивался от них. Он сосредоточился на конкретном символе — ying鷹 («орел»), одном из самых сложных. Чтобы нарисовать его вручную, требуется 24 движения кистью. Как можно оцифровать такое изображение? Проведя анализ, он пришел к выводу, что на такой сложный символ потребуется битовая карта из 25х20 точек, и занимать она будет порядка 60 байт памяти, не считая метаданных.
Если получится так оцифровать каждый иероглиф, зашить в память компьютера и вызывать его с помощью нужного сочетания клавиш, то это решит проблему. По сути Чан-хуэй Йе видел клавиатуру не просто как периферийное устройство, а как полноценный компьютер: управляемый микропроцессором «интеллектуальный терминал».
К 1968 году работа Йе продвинулась настолько, что он решился запатентовать свой проект, получивший прозвище «Железный орел». Деньги на разработку неофициально выделили тайваньские военные — и через четыре года в Саннивейле, Калифорния, была основана компания Ideographix. Основное направление производства — специальные клавиатуры, который Йе назвал IPX. Посмотрим на нее подробнее.
IPX имела скромные размеры: 59 сантиметров в ширину, 37 см в глубину и 11 см в высоту. Но при этом позволяла вводить аж 19 200 символов при помощи сложной системы сдвигового переключения, как при использовании SHIFT на обычной клавиатуре.
Сидя перед IPX, оператор смотрел на 160 клавиш (16 в ряд, 10 столбцов). Каждая клавиша содержала не один китайский символ, а кластер из 15 символов, расположенных в массиве 3 на 5. Эти 160 клавиш с 15 символами на каждой клавише давали 2400 китайских символов.
Интересно было то, что клавиши клавиатуры были пустыми — на них не было ни одного изображения. Вместо этого 2400 китайских иероглифов были напечатаны на ламинированной бумаге. Оператор клал ее сверху: над каждой из 160 клавиш оказывался свой набор символов, этакая карта. Дальше оператор нажимал клавишу с нужным ему иероглифом, продавливая через бумагу — это активировало из памяти компьютера нужный набор. Оператору оставалось только выбрать конкретный символ, используя дополнительную клавиатуру с цифрами от 1 до 15.
Но как мы помним, клавиатура позволяла печатать до 19 200 символов. Как этого добились? Использовались восемь листов ламинированной бумаги с разными наборами символов. Они скреплялись в виде буклета со спиральной пружиной посередине. Когда оператор переворачивал страницу, он активировал дополнительную клавишу SHIFT, эквивалентную номеру страницы. Да, вот так вот просто (надеюсь, читатель уловил сарказм автора):
Уровень 1: выбор нужной страницы, одной из восьми — на каждой по 160 наборов из 15 символов;
Уровень 2: выбор нужной клавиши из 160 наборов;
Уровень 3: выбор одного из 15 символов в выбранном наборе.
Конечно есть подозрение, что больше времени уходило бы на обучение даже одного оператора, чем на разработку самой системы IPX — но об этом история умалчивает. Возможно, существовали методы быстрого поиска символов на нужной странице.
Первые несколько лет клавиатуры активно использовались только военными на Тайване. Но после того, как секретность ослабела, Йе смог коммерциализировать свое открытие, предложив IPX двум организациями: Управлению телекоммуникаций Тайваня и Национальному налоговому бюро Тайбэя. Недостатка в рабочей силе на острове не было, поэтому через несколько месяцев сотни операторов уже оцифровали десятки тысяч деклараций и передали сотни тысяч телефонных счетов.
Но на самом деле продукция компании Ideographix была не единственной в мире.
Дальнейшее развитие китайских клавиатур
В октябре 1974 года, когда IPX уже вовсю использовался на Тайване, инженеры материкового Китая начали серьезно погружаться в проблему ввода информации с помощью иероглифов. Для этого при Пекинском университете даже открыли соответствующий отдел по созданию «Системы обработки и ввода информации китайских иероглифов
К 1975 году было сформировано 10 вариантов китайской клавиатуры. Все они делились на две большие группы:
Одна огромная клавиатура с тысячами кнопок;
Подход с маленькой клавиатурой в стиле QWERTY, со множеством режимов переключения между символами;
Первый вариант требовал компромисса — те же 20 000 клавиш, как в IPX, было нереально реализовать. Поэтому некоторые группы исследователей пытались создать клавиатуру на 2000 символов, наиболее часто употребляемых на письме. Из затеи ничего не получилось.
Второй вариант предполагал концепцию «одна клавиша, много применений» — yijian duoyong (кит.), что позволило бы уложиться в клавиатуру размером с QWERTY. Но у неё было бы не два режима по нажатию клавиши SHIFT, как мы привыкли, а больше десятка. Тогда возникал вопрос, как оператору не запутаться в этих режимах переключения?
В результате комиссия пришла к выводу, что нужно остановиться на некоем промежуточном варианте. Так появилась клавиатура с 256 клавишами, 28 из которых были выделены для различных функций вроде возврата каретки и пробел, а оставшиеся 228 применялись для ввода текста.
Причем использовался хитрый подход, когда для набора простых символов использовалась одна клавиша, а для сложных вроде ying鷹 («орел») — последовательное нажатие нескольких клавиш (до пяти) с компонентами символов. Это позволяло буквально «сложить» иероглиф по частям.
Каждое нажатие клавиши генерировало 8-битный код, сохраняемый на перфоленте — отсюда и выбор числа клавиш 256. Эти 8-битные коды затем переводился в 14-битный внутренний код, который компьютер использовал для извлечения нужного символа.
В итоге клавиатура Пекинского университета позволяла вводить 7282 иероглифа:
423 — наиболее простые и часто используемые полноразмерные иероглифы, для ввода которых нужно было нажать одну клавишу, а при необходимости дополнительно и аналог нашего SHIFT;
2930 — для ввода которых использовалось последовательное нажатие двух клавиш;
3106 — сочетание нажатий из трех клавиш;
823 — редко используемые, для которых требовалось четыре-пять нажатий.
Таким образом удалось найти баланс между частотой использования разных символов на письме и простотой ввода — чем сложнее иероглиф, тем больше нужно манипуляций для его изображения, как и в жизни. В итоге 7282 иероглифа закрывали примерно 90% всех используемых на письме символов.
Еще одним интересным примером стала разработка двух преподавателей из Кембриджа — Роберта Слосса и Питера Нанкарроу. Они познакомились в 1976 году, и их объединяла страсть к лингвистике. Нанкарроу предложил создать машину, которая будет автоматически переводить текст с китайского на английский при передаче сообщений. Проблема возникла с вводом иероглифов — как это правильно сделать? Выбирать вручную из тысяч символов — не самая удобная история.
В результате им пришла в голову идея — взять сетку размером 66х66 ячеек. Если в каждой расположить китайский символ, получится 4356 иероглифов, что вполне хватит для наиболее часто употребляемых вариантов. А каждой ячейке в сетке можно назначить код из двух чисел от 1 до 66, соответствующий координате ячейке. Например, 20 по горизонтали и 44 по вертикали, словно при игре в «морской бой». Таким образом, каждый символ будет иметь кодировку. При этом сетку они обернули вокруг вращающейся трубы, для компактности и удобства выбора ячейки.
Устройство получило название: «Генератор двоичных сигналов для кодирования китайских иероглифов в машиносовместимую форму». И работало оно так: оператор вращал ручку сбоку и двигал каретку влево или вправо в процессе «наведения» на нужный символ. После этого он нажимал кнопку подтверждения: координаты выбранной ячейки считывались и могли быть переданы в виде сообщения или отображаться на дисплее.
Этот метод получил название Ideo-Matic 66, а прототип обошелся Слоссу и Нанкарроу всего в 25 долларов — все собрали из деталей детского конструктора, на коленке. При этом аппарат был весьма компактным: весил 7 кг и легко умещался на рабочем столе.
Когда об этом изобретении написали в местной газете, системой Ideo-Matic заинтересовалась британская коммуникационная компания Cable & Wireless. Им как раз нужно было простое решение для обмена сообщениями с китайскими компаниями, например, посредством телеграфа. Однако, несмотря на начальный интерес и переговоры, проект не был реализован на массовом рынке. Система оказалась слишком сложной и дорогой для коммерческого использования, что в итоге привело к прекращению разработки. Проект Ideo-Matic остался лишь интересным экспериментом своего времени, не став практическим решением для телеграфной связи с Китаем.
Конец китайских клавиатур: появление IME
Однако с массовым распространением персональных домашних компьютеров в начале 80-х годов все разработки вроде IPX, Ideo-Matic 66 быстро стали частью историю и экспонатами музеев. Все благодаря появлению технологии Input Manager Editor: теперь любой носитель китайского языка мог использовать стандартную QWERTY-клавиатуру (обычно на 104 клавиши) для ввода любых символов.
Кратко суть: теперь разный порядок нажатия клавиш с латинскими буквами программно соотносился с конкретным иероглифом или несколькими наиболее близкими вариантами. Но неужели пользователь должен опять запоминать сложные комбинации или создавать специальные макросы? Совсем нет. Разработчики IME предусмотрели так называемый фонетический принцип ввода.
Например, вы хотите поздороваться с собеседником. Для этого нужно набрать 你好 — nihao, или «привет» на китайском. Вы вводите английские символы так, как они слышатся на родном языке. Дальше программа сопоставляет с базой иероглифов и выдает похожие — пользователю остается только выбрать нужные 你好, и все. Чем-то напоминает старую-добрую систему Т9.
По сути, IME воплотила опыт и наработки инженеров, пытавшихся в 60-70-е годы создать полноценную китайскую клавиатуру. Только теперь вместо сложных ухищрений и нестандартных конструкций реализовала все это на программном уровне, что значительно упростило жизнь носителям не только китайского, но и японского, корейского и многих других языков, в которых больше хотя бы сотни символов.
Но вопреки прогнозам историка Арнольда Дж. Тойнби и страхам студента Чан-хуэй Йе, такое упрощение и унификация не привели к краху китайской цивилизации. Напротив — сейчас Китай мировой лидер по многим направлениям, а иероглифическая письменность никуда не делась.
Более подробно про историю китайских клавиатур можно почитать в книге Томаса Малейни The Chinese Computer: A Global History of the Information Age издательства MIT Press. Эта статья основана на материалах из нее. К сожалению не нашел официального перевода на русский язык. Но не думаю, что для хабровчан это будет какой-то проблемой.
НЛО прилетело и оставило здесь промокод для читателей нашего блога:
-15% на заказ любого VDS (кроме тарифа Прогрев) — HABRFIRSTVDS.