
Комментарии 65

:)

github.com/unxed/oemcp/blob/master/oemcp.txt
А вот скрипт, показывающий, как правильно пользоваться этой табличкой, если вы — автор [раз]архиватора:
github.com/unxed/oemcp/blob/master/ziplist
А вот патчик к p7zip, реализующий эту логику, который не хотят принимать в Дебиан пока, увы:
bugs.debian.org/cgi-bin/bugreport.cgi?bug=965126
А вот .deb с p7zip, собранным с этим патчиком, для тех, кто задолбался ждать, пока его примут в Дебиан (amd64):
github.com/unxed/oemcp/blob/master/p7zip-oemcp.deb
продублирую здесь, авось кому поможет.
погуглил таки. добавили в 2006 году
https://pkwaredownloads.blob.core.windows.net/pkware-general/Documentation/APPNOTE-6.3.0.TXT
If general purpose bit 11 is unset, the file name and comment should conform to the original ZIP character encoding. If general purpose bit 11 is set, the filename and comment must support The Unicode Standard, Version 4.1.0 or greater using the character encoding form defined by the UTF-8 storage specification. The Unicode Standard is published by the The Unicode Consortium (www.unicode.org). UTF-8 encoded data stored within ZIP files is expected to not include a byte order mark (BOM).
и оказывается что кодировка должна быть cp437, но в действительности бралась та что имелась, уп-с…
Versions of the format prior to 6.3.0 did not support storing file names in Unicode. According to the standard, file names should be stored in the CP437 encoding, which is standard for the IBM PC, but in practice, DOS archivers used the system’s installed character encoding.
Unpacks .zip archives with non-latin filenames, using libnatspec patch from AltLinux.
П.С. Это был я, тот загадочный пользователь, который написал просьб.
�믮������ ������� ������ ��� � ࠧ�襭�� ����������ᨬ��⥩ ����� ��ꥪ⠬�…
Jenkins рисует такое… когда есть время, пытаюсь найти цепочку кодировок:) пока безуспешно.
襭 — Carry with the front of a robe
А если этих ошибочных преобразований было применено несколько… Тогда диаграмма должна распухнуть экспоненциально по их числу.
¶g^ЛЅVa6$•§Ј
єКВ`ЊЛе,°тV–еrй«тЦ є
Euд§юдЧT QЬКЌЋЛ^nЯM‰'Ю "‰Ћ–qпј l”{
ЂЮё‹+'JыP©ьЌrбuЄ”еюм°љ»Ў¦Р®ТйЬэ“ЪЧ8!mm
К!Ь6„ќn7E.$°љR0ЇЈbс`–Љvb<п«FQ©’ЏЃxђИDыo©жBЩэ:Љyir2ѕ‘¦ыkl,
ћчХ`О¬ ,U_HзџewћЏL°ќH$ Ў†,oB±Е95:i|®R4Bпo8‹ћ)O#lЮ)TSХj¶ПBЏNvB|/xhҐг–м&¤$^+›цkhєАК$А“э)uf‰±9RAж“)7Оqeжг1Ѓѕ<>
2ѓњЉ Ї§#餓jуПомогите пожалуйста разобрать, никак не могу. Или это уже не возможно?
Русские символы отображаются всегда так: ����� ��� ����� �� �������
Столкнулся с неверными кодировками в своём проекте, хотел по быстрому взглянуть в чём проблема (была там удобнейшая таблица)… А теперь шиш… пичалька…

drive.google.com/file/d/0B_9_8BPuiLXtdUwzUVE2VkczZTQ/edit?usp=sharing (полноразмерная)


Как распознать кракозябры?