Ну на это я могу сказать что традиции славянских латиниц - это очень странный предмет, вроде бы они есть, но на самом деле их нет. К примеру, поляки и чехи [х] передают диграфом ch, а хорваты - одной буквой h, поляки [ч] cz, хорваты с чехами - č, ну [ш] sz - š. Так вот у чехов звук [в] передавался буквой w где-то до середины 19 века, ну и у всяких там хорватов и словенцев передача через w тоже вполне себе встречалась 8)
Меня таблицы в ТеХе тоже выбешивают, прочитав первый абзац я обрадовался, но в дальнейшем никаких примеров с использованием таблиц не увидел. Хотелось бы поглядеть именно на них.
Ну на самом деле это ИСО 9 (и не только его) я могу тоже долго критиковать. Например, буква ъ передаётся как ʺ (U+2BA) (в уникоде про этот знак прямо указано), явно подразумевается что он не может быть прописной буквой, т.к. не может идти в начале слова. Только вот современное болгарское слово ъгъл 'угол' всё это портит (ну и паровозы серий Ъ и Ь заодно). Можно ещё про кавказский знак палочка "Ӏ" вспомнить, который передаётся просто как "‡" (но кто тут больше налажал они или Unicode consortium я сказать не могу). А про часть кириллических букв я вообще не понял откуда они. Но в защиту его можно сказать одно - это стандарт. Всё.
Ну вот ХЗ, всю жизнь (когда мне было лень указать явно кодировку, т.е. достаточно часто) - я использую enconv и не жужжу (какие-то самописные скрипты не нужны).
Не факт что там есть какой-то БИОС. Там сейчас там UEFI вроде. P.S. Ещё в молодости прилично железок угробил, а теперь лезть вглубь никакого желания нет (если работает - не трожь)
Ну это я тоже заметил, хоть и очень далёк от всех этих CJK и пытаюсь вглубь даже не соваться. Сначала они добавляли всякие составные символы, хоть там диакритические знаки в два ряда могли идти (ṏ), но потом перестали. Видимо дошло, что так их можно хоть до бесконечности добавлять (мне символы с тремя рядами диакритических знаков в книгах попадались, и не раз). В общем, прекратили такие символы добавлять, но критерии добавления для меня не совсем ясны. А вот со всеми этими китайскими иероглифами всё обстоит иначе — их так и продолжают добавлять, хоть их и спокойно можно разбить на несколько знаков и даже в этом уникоде есть специальные значки для описания состава (⿲ и т.п.). Но их продолжают вставлять (хотя, повторяю, я от всего этого далёк). Ну и подозреваю, что с древнеегипетскими иероглифами, клинописными значками и проч. будут свои заморочки, например значки фестского диска помечены как Other Symbol ?
Создатели Unicode считали, что 65 536 символов будет достаточно для всех человеческих языков.
Вот ещё в детстве меня это удивило — я знал что только китайских иероглифов где-то 60 тысяч, т.е. для остального места могло и не хватить ? (а про всякие UTF-16 я узнал уже потом)
Способ «хакинга» такого телеграфа при помощи социальной инженерии (хитрость, подкуп, давление на слабые черты характера) описан в романе А. Дюма «Граф Монте-Кристо».
Блин, а я ведь воспринял упоминаемый там телеграф, как простой электрический. Хоть и прочитал совсем недавно.
А ведь тут ещё стоит упомянуть то, что для рисования могут использоваться не только ASCII-графика, но и другие символы: из Box Drawing, Block Elements и ещё из Symbols for Legacy Computing (правда это уже будет не из ASCII, особенно последнее).
Ну на это я могу сказать что традиции славянских латиниц - это очень странный предмет, вроде бы они есть, но на самом деле их нет. К примеру, поляки и чехи [х] передают диграфом ch, а хорваты - одной буквой h, поляки [ч] cz, хорваты с чехами - č, ну [ш] sz - š. Так вот у чехов звук [в] передавался буквой w где-то до середины 19 века, ну и у всяких там хорватов и словенцев передача через w тоже вполне себе встречалась 8)
Судя по наличию Й на месте j и В на месте w - именно так оно и было. Хорошо хоть Ц не на z и З не s :) (в результате больше похоже на польский)
Меня таблицы в ТеХе тоже выбешивают, прочитав первый абзац я обрадовался, но в дальнейшем никаких примеров с использованием таблиц не увидел. Хотелось бы поглядеть именно на них.
Ну на самом деле это ИСО 9 (и не только его) я могу тоже долго критиковать. Например, буква ъ передаётся как ʺ (U+2BA) (в уникоде про этот знак прямо указано), явно подразумевается что он не может быть прописной буквой, т.к. не может идти в начале слова. Только вот современное болгарское слово ъгъл 'угол' всё это портит (ну и паровозы серий Ъ и Ь заодно). Можно ещё про кавказский знак палочка "Ӏ" вспомнить, который передаётся просто как "‡" (но кто тут больше налажал они или Unicode consortium я сказать не могу). А про часть кириллических букв я вообще не понял откуда они. Но в защиту его можно сказать одно - это стандарт. Всё.
ISO 9:1995 🤦
Почему-то вспомнился Лёд-9 из романа Курта Воннегута "Колыбель для кошки" 🙃
Так, я не понял, а зачем тут PUA-область? Они уже давно нормально в уникоде есть: 𓀀 и ᛉ
Ну вот ХЗ, всю жизнь (когда мне было лень указать явно кодировку, т.е. достаточно часто) - я использую enconv и не жужжу (какие-то самописные скрипты не нужны).
Не факт что там есть какой-то БИОС. Там сейчас там UEFI вроде.
P.S. Ещё в молодости прилично железок угробил, а теперь лезть вглубь никакого желания нет (если работает - не трожь)
Ну да, вот про НЖМД и .30-30 Winchester я как раз забыл ?
Было уже нечто подобное со словом "браунинг" для обозначения пистолета. Возможно ещё чего подобное было, но это первое приходит в голову.
Кобол всё же слегка постарше будет - 1959, а ПЛ/1 только 1964 :)
Я тут слегка посмотрел и выяснил:
Что упоминающийся Йероен Коеккоек - это Jeroen Koekkoek (https://imap.nlnetlabs.nl/people/, https://github.com/k0ekk0ek), т.е. явно голландец;
И следовательно тут надо применять правила нидерландско-русской транскрипции;
И он получается скорее Йерун Куккук, там oe передаёт у.
P.S. Прошу меня извинить, просто странный набора знаков в глаза бросился ?
Мне, как самому ленивому, хватило стандартной записной книжки ?
Эээ??? Чего-то я не понял - ЦРУ создано только в 1947, т.е. после Второй мировой ?
Ну это я тоже заметил, хоть и очень далёк от всех этих CJK и пытаюсь вглубь даже не соваться. Сначала они добавляли всякие составные символы, хоть там диакритические знаки в два ряда могли идти (ṏ), но потом перестали. Видимо дошло, что так их можно хоть до бесконечности добавлять (мне символы с тремя рядами диакритических знаков в книгах попадались, и не раз). В общем, прекратили такие символы добавлять, но критерии добавления для меня не совсем ясны. А вот со всеми этими китайскими иероглифами всё обстоит иначе — их так и продолжают добавлять, хоть их и спокойно можно разбить на несколько знаков и даже в этом уникоде есть специальные значки для описания состава (⿲ и т.п.). Но их продолжают вставлять (хотя, повторяю, я от всего этого далёк). Ну и подозреваю, что с древнеегипетскими иероглифами, клинописными значками и проч. будут свои заморочки, например значки фестского диска помечены как Other Symbol ?
Вот ещё в детстве меня это удивило — я знал что только китайских иероглифов где-то 60 тысяч, т.е. для остального места могло и не хватить ? (а про всякие UTF-16 я узнал уже потом)
Запятая не только в русской, а точка не только в английской. И вообще "плавать" может не только запятая или точка.
Блин, а я ведь воспринял упоминаемый там телеграф, как простой электрический. Хоть и прочитал совсем недавно.
А ведь тут ещё стоит упомянуть то, что для рисования могут использоваться не только ASCII-графика, но и другие символы: из Box Drawing, Block Elements и ещё из Symbols for Legacy Computing (правда это уже будет не из ASCII, особенно последнее).
Просто из буквоедства.
У него имя читается явно как Гергей Орос.
https://ru.wikipedia.org/wiki/Венгерско-русская_практическая_транскрипция