Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Думаю, дело в финансовой стороне проблемы. Unicode требует в 2 раза больше памяти, а память стоит денег (и дисковая и ОЗУ)
Unicode <...> поэтому нет необходимости перекодироватьпочему это нету? юникод это просто [виртуальная] таблица символов, в компьютере остаются тоже «кодировки» (utf-8 или там utf-16, например).
(подробнее об Unicode см следующую запись в журнале)ой, как неловко спалился кросспостинг)
Ее особенностью было то, что если у русского символа пропадал 8-й бит, то получившийся в результате «обрезания» английский символ будет созвучен исходному русскому
Во как — на улице 21-й век, Unicode шагает по миру,а кто-то всерьёз задумывается о судьбе самого дорогого способа передачи 140 байт.
Мне ближе формулировка из Википедии: «Кодовая страница (англ. code page) — таблица, сопоставляющая каждому значению байта некоторый символ (или его отсутствие)».Википедия — не шибко авторитетный источник. Тут сразу, например, возникает вопрос — причём тут байт? Особенно в свете упомянутых кои-7, utf-8 итд. В той же английской википедии уже несколько по-другому: «a code page is a table of values that describes the character set used for encoding a particular set of glyphs», что более правильно, и ближе всё же к первой процитированной формулировке.
У видеоадаптера CGA таблицы знакогенератора, определяющие символы, которые можно отобразить на экране дисплея в текстовых режимах, находятся в ПЗУ, расположенном вне адресного пространства процессора. Программы не имеют возможности изменить или даже считать информацию из этих таблиц. Поэтому для русификации текстовых режимов видеоадаптера CGA необходимо перепрограммировать ПЗУ знакогенератора. Единственной возможностью отобразить на CGA русские буквы, не перепрограммируя ПЗУ, является использование графических режимов работы адаптера. В графических режимах вы можете сами определить образы символов с ASCII кодами от 128 до 255. Образы символов с ASCII кодами от 0 до 127 нельзя изменить, не перепрограммируя ПЗУ.
Я отмечал, что понятия кодовой страницы и кодировки близки, но не абсолютные синонимы, но выяснять различия выходит за рамки статьи.Тут просто небольшая путаница произошла. code page вообще несколько специфический (даже «проприетарный», скажем так) термин и стоит в стороне от character set и encoding, про которые в основном должна идти речь. И которые, разумеется, вообще нисколько не близки в статье любого уровня «популярности» про кодировки. НО при этому всё же code page ближе по контексту к термину character set. Хотя обычно он означает и способ кодирования (раньше одно другому соответствовало, т.к. вариантов особо не было). Видимо, про это имел в виду Moskus в своей формулировке о code page (которая мне тоже кажется несколько запутанной).
О кодировках и кодовых страницах