Как стать автором
Обновить

Кодировки must die

Время на прочтение1 мин
Количество просмотров1.6K
йНДХПНБЙХ ОПЕДЯРЮБКЧР ЯНАНИ НДМН ХГ МЮХЛЕПГЕИЬХУ НПСФХИ АНПЭАШ Я ПСМЕРНЛ.

«KOI8», — подумал Штирлиц.

Как подсказал Яндекс, в самом полном словаре иероглифов корейского языка, подготовленном около тысячи лет назад, было учтено около 53 тысяч знаков. Тяжело им, наверно, корейцам. В русском же языке другая проблема: всего 33 буквы, но зато кодировок… кто-то их считал? Я нет. В опере 4, файерфокс предлагает на выбор 7.

Не буду вдаваться в историю вопроса и копать, какой катаклизм породил какую из русских кодировок, скажу лишь только основной вывод, который я сделал для себя из этого безобразия: национальные кодировки — это зло. Рудимент, который Интернету (а в данном случае именно с большой буквы) следует отбросить за ненадобностью. Так и хочется ляпнуть «Да здравствует Великое Перекодирование Интернета в UTF-8!» :-)

Где же искать корень зла? Взглянем на протокол HTTP. Итак, что мы видим? Заголовки, строка запроса GET и данные POST кодируются в формате «url-encoded», который, в свою очередь, базируется на символах US-ASCII.

Легко представить, насколько приятнее было бы видеть адреса страниц вида habrahabr.ru/blog/Хабраблог, закодированные в UTF-8.
Теги:
Хабы:
Всего голосов 27: ↑22 и ↓5+17
Комментарии123

Публикации

Истории

Ближайшие события

19 августа – 20 октября
RuCode.Финал. Чемпионат по алгоритмическому программированию и ИИ
МоскваНижний НовгородЕкатеринбургСтавропольНовосибрискКалининградПермьВладивостокЧитаКраснорскТомскИжевскПетрозаводскКазаньКурскТюменьВолгоградУфаМурманскБишкекСочиУльяновскСаратовИркутскДолгопрудныйОнлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн
24 – 25 октября
One Day Offer для AQA Engineer и Developers
Онлайн
25 октября
Конференция по росту продуктов EGC’24
МоскваОнлайн
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань