Комментарии 14
я подумал, что был единственным способом их закодировать.
Я подумал, что тут был надмозг.
автору еще предстоят интересные открытия:
public const ALL_SPACE_SYMBOLS = [
'tab' => '09',
'LF' => '0A',
'CR' => '0D',
'nbsp' => 'C2A0',
'WORD JOINER' => 'E281A0',
'SoftHyphen' => 'C2AD',
'TagHyphen-minus' => 'F3A080AD',
'EN QUAD' => 'E28082',
'EM QUAD' => 'E28083',
'ThreePerEM' => 'E28084',
'FourPerEM' => 'E28085',
'SixPerEM' => 'E28086',
'FIGURE SPACE' => 'E28087',
'Punctuation SPACE' => 'E28088',
'Thin SPACE' => 'E28089',
'Hair SPACE' => 'E2808A',
'ZeroWidth SPACE' => 'E2808B',
'NARROW NO-BREAK SPACE' => 'E280AF',
'Med Math SPACE' => 'E2819F',
'Tag Space' => 'F3A080A0',
'ZeroWidth WORD JOINER' => 'E2808D',
'Ideographic Space' => 'E38080',
];
И ещё в копилку: https://jkorpela.fi/chars/spaces.html
Добро пожаловать в волшебный мир юникода)
Есть плагины для поиска подобных вещей:
https://plugins.jetbrains.com/plugin/7448-zero-width-characters-locator
https://marketplace.visualstudio.com/items?itemName=nhoizey.gremlins
Или просто настройки отображения странных символов
Прошу хекс-отображения порой трудно переоценить. Я обычно с кодировками с его помощью разбираюсь)
Я обычно \s заменяю на пробел регуляркой, еще есть приколы когда й это два символа И и верхняя галочка, когда прайсы импортировал то много такого встречал.
Да что уж там, если даже для довольно нечасто используемого ‾надчёркивания¯ придумано несколько вариантов. Логично, что гораздо более часто употребляемому пробелу и достаётся сильнее. Остаётся дивиться, как японцы и китайцы справляются со вводом иероглифов, хотя бы по одному варианту кодирования на каждый.
И ведь все вот эти проверки, перекодировки и автозамены поедом едят ресурсы миллиадров компьютеров, не добавляя ни на йоту содержания.
Хорошо одно — что Кирилл и Мефодий когда-то договорились, и нам хотя бы не приходится кроме переключения клавиатуры на кириллицу нажимать ногами на отдельную клавиатуру с мефодиевицей. Бред? Нисколько — такой способ используется при исполнении на органе:
"Партию для ног почти всегда пишут на отдельном нотном стане под партией для рук.… На органной педали играют, нажимая клавиши каблуком или носком в зависимости от аппликатуры"
И ведь все вот эти проверки, перекодировки и автозамены поедом едят ресурсы миллиадров компьютеров, не добавляя ни на йоту содержания.
Хорошо одно — что Кирилл и Мефодий когда-то договорились, и нам хотя бы не приходится кроме переключения клавиатуры на кириллицу нажимать ногами на отдельную клавиатуру с мефодиевицей. Бред? Нисколько — такой способ используется при исполнении на органе:
"Партию для ног почти всегда пишут на отдельном нотном стане под партией для рук.… На органной педали играют, нажимая клавиши каблуком или носком в зависимости от аппликатуры"
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Пробелы бывают разные: ≠ C2A0