Как стать автором
Обновить

Комментарии 14

я подумал, что был единственным способом их закодировать.

Я подумал, что тут был надмозг.

Просто переводчик скопировал   не глядя и не посмотрел на результат

Тогда эта профессия не называется "переводчик", а как-то по другому. "Копипастер", например.
"Просто копипастер скопировал и не посмотрел".

Копипастер из Google Translate ¯\_(ツ)_/¯


(реально, последний абзац совпадает буква в букву)

автору еще предстоят интересные открытия:

 public const ALL_SPACE_SYMBOLS = [
        'tab' => '09',
        'LF' => '0A',
        'CR' => '0D',
        'nbsp' => 'C2A0',
        'WORD JOINER' => 'E281A0',
        'SoftHyphen' => 'C2AD',
        'TagHyphen-minus' => 'F3A080AD',
        'EN QUAD' => 'E28082',
        'EM QUAD' => 'E28083',
        'ThreePerEM' => 'E28084',
        'FourPerEM' => 'E28085',
        'SixPerEM' => 'E28086',
        'FIGURE SPACE' => 'E28087',
        'Punctuation SPACE' => 'E28088',
        'Thin SPACE' => 'E28089',
        'Hair SPACE' => 'E2808A',
        'ZeroWidth SPACE' => 'E2808B',
        'NARROW NO-BREAK SPACE' => 'E280AF',
        'Med Math SPACE' => 'E2819F',
        'Tag Space' => 'F3A080A0',
        'ZeroWidth WORD JOINER' => 'E2808D',
        'Ideographic Space' => 'E38080',
    ];
Добро пожаловать в волшебный мир юникода)

Каждый должен самостоятельно наступить на эти грабли. Немного не такой пробел, классика, хаха..

С табами аналогичная ситуация может быть?

Или просто текстовый diff - он как минимум покажет что один пробел не равен другому пробелу, даже если они выглядят одинаково.

Прошу хекс-отображения порой трудно переоценить. Я обычно с кодировками с его помощью разбираюсь)

Я обычно \s заменяю на пробел регуляркой, еще есть приколы когда й это два символа И и верхняя галочка, когда прайсы импортировал то много такого встречал.
Да что уж там, если даже для довольно нечасто используемого ‾надчёркивания¯ придумано несколько вариантов. Логично, что гораздо более часто употребляемому пробелу и достаётся сильнее. Остаётся дивиться, как японцы и китайцы справляются со вводом иероглифов, хотя бы по одному варианту кодирования на каждый.
И ведь все вот эти проверки, перекодировки и автозамены поедом едят ресурсы миллиадров компьютеров, не добавляя ни на йоту содержания.
Хорошо одно — что Кирилл и Мефодий когда-то договорились, и нам хотя бы не приходится кроме переключения клавиатуры на кириллицу нажимать ногами на отдельную клавиатуру с мефодиевицей. Бред? Нисколько — такой способ используется при исполнении на органе:
"Партию для ног почти всегда пишут на отдельном нотном стане под партией для рук.… На органной педали играют, нажимая клавиши каблуком или носком в зависимости от аппликатуры"
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории