Как стать автором
Обновить

Не каждый человек может написать своё имя в Юникоде

Время на прочтение 2 мин
Количество просмотров 47K
Казалось бы, в Юникод включили уже все возможные и невозможные символы. В последней версии Unicode 7.0 добавлено 23 новых письменности, включая древнепермское письмо и почти полностью расшифрованное линейное письмо А минойской цивилизации 2000 г до н.э., сотни экзотических эмотиконов.

Общее количество символов в Unicode превысило 110 000 штук. Казалось бы, там уже есть все распространённые символы. Оказывается, это не так. До сих пор остались люди, которые не могут написать в Юникоде даже собственное имя. Им приходится прибегать к разным трюкам.

О своей проблеме рассказал индийский IT-специалист, имя которого мы не можем правильно напечатать, разве что в транслитерации: Адитья Мукереджи.

Родной язык парня — бенгальский, это седьмой по популярности язык в мире, который значительно опережает по численности носителей даже русский. Вы можете представить, что не все символы русского языка представлены в Unicode? А вот для бенгальского это привычное дело.


Бенгальские символы

Бенгальский представлен в Unicode с самой первой версии, но с самого начала в нём не хватало символов. Жителям страны приходилось изобретать велосипеды, восполняя недостающие символы при письме комбинациями похожих букв и цифр, как в хакерском l33tspeak. Так, его собственное имя можно написать со сходной графемой из родственной письменности: আদিত্য.


Отсутствующая буква

В 2005 году некоторые символы добавили, но не все. В его имени до сих пор не хватает буквы, хотя оно — вовсе не какая-то экзотика, а повсеместно встречается в Индии и даже входит в 1000 самых популярных имён в США.

Адитья Мукереджи обвиняет в технической некомпетентности сотрудников консорциума Unicode, которые занимаются подготовкой стандарта. Смелый специалист даже делает расистские намёки. По его мнению, среди сотрудников слишком много белых англоговорящих людей. Дерзость можно понять: он как продвинутый пользователь цифровой техники немало уже натерпелся за свою жизнь из-за «неудачного» имени.

Адитья опасается, что консорциум Unicode не собирается изменять список из 224 024 символов, которые планируется включить в Unicode в ближайшие годы.

Эта история представляется ещё и интересным примером того, что современные технологии могут не только упростить жизнь, но и осложнить её.
Теги:
Хабы:
+52
Комментарии 120
Комментарии Комментарии 120

Публикации

Истории

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн