Pull to refresh
4
0
Send message

Ну на это я могу сказать что традиции славянских латиниц - это очень странный предмет, вроде бы они есть, но на самом деле их нет. К примеру, поляки и чехи [х] передают диграфом ch, а хорваты - одной буквой h, поляки [ч] cz, хорваты с чехами - č, ну [ш] sz - š. Так вот у чехов звук [в] передавался буквой w где-то до середины 19 века, ну и у всяких там хорватов и словенцев передача через w тоже вполне себе встречалась 8)

Да, меня это тоже удивляет, и, думаю, каждого, кто с этим сталкивается. Вероятно, таблицу составлял кто-то, кто учил немецкий больше английского:))

Судя по наличию Й на месте j и В на месте w - именно так оно и было. Хорошо хоть Ц не на z и З не s :) (в результате больше похоже на польский)

Меня таблицы в ТеХе тоже выбешивают, прочитав первый абзац я обрадовался, но в дальнейшем никаких примеров с использованием таблиц не увидел. Хотелось бы поглядеть именно на них.

Ну на самом деле это ИСО 9 (и не только его) я могу тоже долго критиковать. Например, буква ъ передаётся как ʺ (U+2BA) (в уникоде про этот знак прямо указано), явно подразумевается что он не может быть прописной буквой, т.к. не может идти в начале слова. Только вот современное болгарское слово ъгъл 'угол' всё это портит (ну и паровозы серий Ъ и Ь заодно). Можно ещё про кавказский знак палочка "Ӏ" вспомнить, который передаётся просто как "‡" (но кто тут больше налажал они или Unicode consortium я сказать не могу). А про часть кириллических букв я вообще не понял откуда они. Но в защиту его можно сказать одно - это стандарт. Всё.

Почему-то вспомнился Лёд-9 из романа Курта Воннегута "Колыбель для кошки" 🙃

Будете создавать локализацию на древнеегипетский или руническое письмо викингов — обязательно используйте шрифт с PUA-областью.

Так, я не понял, а зачем тут PUA-область? Они уже давно нормально в уникоде есть: 𓀀 и ᛉ

Ну вот ХЗ, всю жизнь (когда мне было лень указать явно кодировку, т.е. достаточно часто) - я использую enconv и не жужжу (какие-то самописные скрипты не нужны).

Не факт что там есть какой-то БИОС. Там сейчас там UEFI вроде.
P.S. Ещё в молодости прилично железок угробил, а теперь лезть вглубь никакого желания нет (если работает - не трожь)

Ну да, вот про НЖМД и .30-30 Winchester я как раз забыл ?

Было уже нечто подобное со словом "браунинг" для обозначения пистолета. Возможно ещё чего подобное было, но это первое приходит в голову.

Кобол всё же слегка постарше будет - 1959, а ПЛ/1 только 1964 :)

Задача взята из проекта simdzone под руководством Йероена Коеккоека (NLnet Labs).

Я тут слегка посмотрел и выяснил:

  1. Что упоминающийся Йероен Коеккоек - это Jeroen Koekkoek (https://imap.nlnetlabs.nl/people/, https://github.com/k0ekk0ek), т.е. явно голландец;

  2. И следовательно тут надо применять правила нидерландско-русской транскрипции;

  3. И он получается скорее Йерун Куккук, там oe передаёт у.

P.S. Прошу меня извинить, просто странный набора знаков в глаза бросился ?

Мне, как самому ленивому, хватило стандартной записной книжки ?

В кульминационный момент Второй мировой войны ЦРУ выпустило потрясающую книгу Simple Sabotage.

Эээ??? Чего-то я не понял - ЦРУ создано только в 1947, т.е. после Второй мировой ?

Ну это я тоже заметил, хоть и очень далёк от всех этих CJK и пытаюсь вглубь даже не соваться. Сначала они добавляли всякие составные символы, хоть там диакритические знаки в два ряда могли идти (ṏ), но потом перестали. Видимо дошло, что так их можно хоть до бесконечности добавлять (мне символы с тремя рядами диакритических знаков в книгах попадались, и не раз). В общем, прекратили такие символы добавлять, но критерии добавления для меня не совсем ясны. А вот со всеми этими китайскими иероглифами всё обстоит иначе — их так и продолжают добавлять, хоть их и спокойно можно разбить на несколько знаков и даже в этом уникоде есть специальные значки для описания состава (⿲ и т.п.). Но их продолжают вставлять (хотя, повторяю, я от всего этого далёк). Ну и подозреваю, что с древнеегипетскими иероглифами, клинописными значками и проч. будут свои заморочки, например значки фестского диска помечены как Other Symbol ?

Создатели Unicode считали, что 65 536 символов будет достаточно для всех человеческих языков.

Вот ещё в детстве меня это удивило — я знал что только китайских иероглифов где-то 60 тысяч, т.е. для остального места могло и не хватить ? (а про всякие UTF-16 я узнал уже потом)

Запятая не только в русской, а точка не только в английской. И вообще "плавать" может не только запятая или точка.

Способ «хакинга» такого телеграфа при помощи социальной инженерии (хитрость, подкуп, давление на слабые черты характера) описан в романе А. Дюма «Граф Монте-Кристо».

Блин, а я ведь воспринял упоминаемый там телеграф, как простой электрический. Хоть и прочитал совсем недавно.

А ведь тут ещё стоит упомянуть то, что для рисования могут использоваться не только ASCII-графика, но и другие символы: из Box Drawing, Block Elements и ещё из Symbols for Legacy Computing (правда это уже будет не из ASCII, особенно последнее).

Information

Rating
Does not participate
Registered
Activity