Comments / Profile of roqin / Habr

How to become an author

User

Profile Publications Comments 62Bookmarks

Безразличие к регистру — ошибка на миллиарды долларов

roqin Dec 13 at 17:08

Ну на это я могу сказать что традиции славянских латиниц - это очень странный предмет, вроде бы они есть, но на самом деле их нет. К примеру, поляки и чехи [х] передают диграфом ch, а хорваты - одной буквой h, поляки [ч] cz, хорваты с чехами - č, ну [ш] sz - š. Так вот у чехов звук [в] передавался буквой w где-то до середины 19 века, ну и у всяких там хорватов и словенцев передача через w тоже вполне себе встречалась 8)

Безразличие к регистру — ошибка на миллиарды долларов

roqin Dec 13 at 14:43

Да, меня это тоже удивляет, и, думаю, каждого, кто с этим сталкивается. Вероятно, таблицу составлял кто-то, кто учил немецкий больше английского:))

Судя по наличию Й на месте j и В на месте w - именно так оно и было. Хорошо хоть Ц не на z и З не s :) (в результате больше похоже на польский)

typst: революция в вёрстке?

roqin Dec 5 at 15:12

Меня таблицы в ТеХе тоже выбешивают, прочитав первый абзац я обрадовался, но в дальнейшем никаких примеров с использованием таблиц не увидел. Хотелось бы поглядеть именно на них.

Адекватная латиница для русского языка

roqin Jul 27 at 13:28

Ну на самом деле это ИСО 9 (и не только его) я могу тоже долго критиковать. Например, буква ъ передаётся как ʺ (U+2BA) (в уникоде про этот знак прямо указано), явно подразумевается что он не может быть прописной буквой, т.к. не может идти в начале слова. Только вот современное болгарское слово ъгъл 'угол' всё это портит (ну и паровозы серий Ъ и Ь заодно). Можно ещё про кавказский знак палочка "Ӏ" вспомнить, который передаётся просто как "‡" (но кто тут больше налажал они или Unicode consortium я сказать не могу). А про часть кириллических букв я вообще не понял откуда они. Но в защиту его можно сказать одно - это стандарт. Всё.

Адекватная латиница для русского языка

roqin Jul 7 at 10:56

ISO 9:1995 🤦

Всё ещё нерешённая загадка замерзания воды

roqin Jun 26 at 16:41

Почему-то вспомнился Лёд-9 из романа Курта Воннегута "Колыбель для кошки" 🙃

Нереальная локализация

roqin Jun 24 at 16:13

Будете создавать локализацию на древнеегипетский или руническое письмо викингов — обязательно используйте шрифт с PUA-областью.

Так, я не понял, а зачем тут PUA-область? Они уже давно нормально в уникоде есть: 𓀀 и ᛉ

Нельзя предполагать, что все используют UTF-8

roqin May 2 at 20:24

Ну вот ХЗ, всю жизнь (когда мне было лень указать явно кодировку, т.е. достаточно часто) - я использую enconv и не жужжу (какие-то самописные скрипты не нужны).

Мы шутили над «опытными пользователями ПК», а ведь они вымирают

roqin Apr 5 at 15:22

Не факт что там есть какой-то БИОС. Там сейчас там UEFI вроде.
P.S. Ещё в молодости прилично железок угробил, а теперь лезть вглубь никакого желания нет (если работает - не трожь)

Взлет и падение Xerox: от легенды IT до прозябания

roqin Mar 7 at 23:28

Ну да, вот про НЖМД и .30-30 Winchester я как раз забыл ?

Взлет и падение Xerox: от легенды IT до прозябания

roqin Mar 7 at 21:13

Было уже нечто подобное со словом "браунинг" для обозначения пистолета. Возможно ещё чего подобное было, но это первое приходит в голову.

Не только дискеты, но и MS-DOS: ОС, которой несколько десятков лет, до сих пор востребована

roqin Feb 2 at 13:35

Кобол всё же слегка постарше будет - 1959, а ПЛ/1 только 1964 :)

Быстрый парсинг 8-битных целых чисел

roqin Dec 30 2023 at 17:06

Задача взята из проекта simdzone под руководством Йероена Коеккоека (NLnet Labs).

Я тут слегка посмотрел и выяснил:

Что упоминающийся Йероен Коеккоек - это Jeroen Koekkoek (https://imap.nlnetlabs.nl/people/, https://github.com/k0ekk0ek), т.е. явно голландец;
И следовательно тут надо применять правила нидерландско-русской транскрипции;
И он получается скорее Йерун Куккук, там oe передаёт у.

P.S. Прошу меня извинить, просто странный набора знаков в глаза бросился ?

Как программист статистику физической активности собирал

roqin Dec 24 2023 at 01:47

Мне, как самому ленивому, хватило стандартной записной книжки ?

Простой саботаж в мире ПО

roqin Dec 22 2023 at 15:36

В кульминационный момент Второй мировой войны ЦРУ выпустило потрясающую книгу Simple Sabotage.

Эээ??? Чего-то я не понял - ЦРУ создано только в 1947, т.е. после Второй мировой ?

Абсолютный минимум об Unicode на 2023 год (всё ещё — никаких оправданий!)

roqin Dec 4 2023 at 15:46

Ну это я тоже заметил, хоть и очень далёк от всех этих CJK и пытаюсь вглубь даже не соваться. Сначала они добавляли всякие составные символы, хоть там диакритические знаки в два ряда могли идти (ṏ), но потом перестали. Видимо дошло, что так их можно хоть до бесконечности добавлять (мне символы с тремя рядами диакритических знаков в книгах попадались, и не раз). В общем, прекратили такие символы добавлять, но критерии добавления для меня не совсем ясны. А вот со всеми этими китайскими иероглифами всё обстоит иначе — их так и продолжают добавлять, хоть их и спокойно можно разбить на несколько знаков и даже в этом уникоде есть специальные значки для описания состава (⿲ и т.п.). Но их продолжают вставлять (хотя, повторяю, я от всего этого далёк). Ну и подозреваю, что с древнеегипетскими иероглифами, клинописными значками и проч. будут свои заморочки, например значки фестского диска помечены как Other Symbol ?

Абсолютный минимум об Unicode на 2023 год (всё ещё — никаких оправданий!)

roqin Dec 4 2023 at 14:09

Создатели Unicode считали, что 65 536 символов будет достаточно для всех человеческих языков.

Вот ещё в детстве меня это удивило — я знал что только китайских иероглифов где-то 60 тысяч, т.е. для остального места могло и не хватить ? (а про всякие UTF-16 я узнал уже потом)

16-, 8- и 4-битные форматы чисел с плавающей запятой

roqin Nov 27 2023 at 14:16

Запятая не только в русской, а точка не только в английской. И вообще "плавать" может не только запятая или точка.

ASCII: от кодировки до бренда — необычные сценарии использования символов

roqin Jun 6 2023 at 22:55

Способ «хакинга» такого телеграфа при помощи социальной инженерии (хитрость, подкуп, давление на слабые черты характера) описан в романе А. Дюма «Граф Монте-Кристо».

Блин, а я ведь воспринял упоминаемый там телеграф, как простой электрический. Хоть и прочитал совсем недавно.

А ведь тут ещё стоит упомянуть то, что для рисования могут использоваться не только ASCII-графика, но и другие символы: из Box Drawing, Block Elements и ещё из Symbols for Legacy Computing (правда это уже будет не из ASCII, особенно последнее).

5 млн долларов за строчку кода: подробный разбор сбоя сервисов Datadog

roqin May 26 2023 at 13:31

Просто из буквоедства.
У него имя читается явно как Гергей Орос.
https://ru.wikipedia.org/wiki/Венгерско-русская_практическая_транскрипция

1