Comments 17
Непонятно только почему импортируется одни класс, а используется другой.
+2
Попробуем, по тестю.
0
из ридми — «small sweat thing» — это маленькая потная хрень
+6
Эм… а почему у вас по-французски написано «мьет», а по-русски «митти»?
Кстати, для выдирания чистого текста из майкросвалки отлично годится Antiword.
Кстати, для выдирания чистого текста из майкросвалки отлично годится Antiword.
+2
А «новые» форматы — docx и компания?
Тем более что спецификация открыта… Но, тем не менее, я так и не нашёл нормальной библиотеки для генерации, а текст приходилось вручную через lxml выдирать.
Тем более что спецификация открыта… Но, тем не менее, я так и не нашёл нормальной библиотеки для генерации, а текст приходилось вручную через lxml выдирать.
0
Посмотрите мою старую статью. А в целом парсинг зазипованного xml совсем не сложная задача, поэтому её решение если и будет на python'е, так разве что когда-нибудь потом.
0
Так а на питоне разве нет ещё парсера OLE-документов, портированного с перла? На котором пхпшный Spreadsheet_Excel_Reader построен.
0
Вполне возможно, что я что-то проглядел. В целом мне требовался определённый способ чтения структуры OLE-хранилища, который я хотел бы «протащить» через все остальные надстройки, будь то doc, ppt или xls.
0
В пхп это pear.php.net/package/OLE
Т.к. это порт перлового первоисточника, то, в общем, вероятно, что и на питоне не стали делать то же самое заново.
Т.к. это порт перлового первоисточника, то, в общем, вероятно, что и на питоне не стали делать то же самое заново.
0
Т.е. когда вы на пхп это сами писали, я удивился, но на питоне это уже дважды велосипед :)
0
Sign up to leave a comment.
Текст любой ценой: Miette