Comments 13
По порядку:
Заголовок
Как Linux'овский sort сортирует строкипротиворечит тексту
Для объединения файлы были отсортированы юниксовской командой sort и поданы на вход юниксовской программе join, которая ...так юниксовое у вас хозяйство или линуксовое?
далее
или однобайтовая KOI8-R (если нужно ограниченное подмножестве Юникода)это с каких это пор KOI8-R имеет какое-то отношение к Unicode и каким именно подмножеством его является?
это с каких это пор KOI8-R имеет какое-то отношение к Unicode и каким именно подмножеством его является?
В unicode есть и 1-байтные символы. Латинская часть koi8-r совпадает с unicode :)
Unicode это не кодировка, а таблица поименованных символов. С этой точки зрения и UTF-8 и KOI-8 кодируют символы Unicode последовательностями битов. UTF-8 кодирует любые символы, а KOI-8 — ограниченное подмножество. И уж совершенно точно, что в KOI-8 нельзя закодировать символ, который бы отсутствовал в Unicode.
так юниксовое у вас хозяйство или линуксовое?
Ни то и не другое, а GNU sort и GNU join, а всё хозяйство, используемое автором, целиком: GNU/Linux. Удивительно, что к этому никто не придрался, но вы-то в след. раз будете знать, как правильно придираться.
А про подмножество — в математическом смысле.
Спасибо. Ради таких разборов и читаю хабр.
Потрясающе. Просто потрясающая работа.
От прочтения осталось впечатление "кино и немцы", "так вот ты какой, серверный олень...", "о сколько нам открытий чудных" и вообще детектив.
Спасибо.
Интересно было узнать такие тонкости. Похоже для работы с текстом стоит использовать более подходящие инструменты.
Как Linux'овский sort сортирует строки