Pull to refresh

Comments 25

Спасибо, очень полезная серия статей, боюсь показать очевидным и невероятным, но неужели следующая статья будет про xls?
Пока, увы, не требуется. Кроме того, я хоть и не разбирался с XLS вообще, но боюсь там будут серьёзные проблемы с формулами, что сделает реализацию достаточно дикой. Могу ошибаться.
А вообще, есть желание переписать свои наработки (WCBFF и иже с ним, и PDF) на Python'е, который сейчас изучаю. Есть мнение, что код получится меньше и понятней.
Есть одна правда — заключается в том, что для xls есть вплоне вменяемая библиотека — как для забивания, так и для потрошения…
http://www.codeplex.com/PHPExcel/. Использовал её для генерации прайсов.
XLSX only. Поправьте меня, если я не прав.
Нет, почему же?
«Read different file formats into your spreadsheet object

* Excel 2007 (spreadsheetML)
* BIFF5 (Excel 5.0 / Excel 95), BIFF8 (Excel 97 and higher)
* PHPExcel Serialized Spreadsheet
* Excel 2003 XML format
* Symbolic Link (SYLK)
* CSV (Comma Separated Values)»
Признаю свою ошибку, мельком лишь пробежался.
Да ничего, просто я её юзал для конкретных задач:)
Да ничего, просто я её юзал для конкретных задач:)
PHPExcel умеет как читать, так и писать xls разных версий
XLS хорошо поддерживается в Apache POI
А я вот делаю импортёр XLS. В пятницу показал первые цифры. Из целой кучи команд реализовал только две — NUMBER и MULRK. Завтра буду исправлять эту недоработку :)
Молодец, я рад, что есть люди, которые страдают занимаются подобными задачами, несмотря на кажущуюся их начальную сложность.
иногда проще купить готовый компонент в систему, чем тратить время(которое обычно — деньги) на создание собственного.

для XLS есть хороший продукт: XLSParserPro
XLSX only. Поправьте меня, если я не прав.
не прав, так как данной библиотекой приходилось пользоваться года 3-4 назад — тогда xlsx мы не видели :)
Ой, простите не Вам. Выше про PHPExcel. Миль пардон )
да. только что перепроверил — правильное название: Php Excel Parser Pro
Есть мнение что для всех перечисленных форматов файлов (кроме, наверное, pdf) можно использовать open office в headless режиме, как это и сделали парни из Alfresco. Понятно, что это куда более громоздкое решение, но, как говорится, 30 гектар леса разом и под корень.
Вы даже не представляете в каких стеснённых условиях у меня идёт разработка: save_mode, max_execution_time = 30, выключенные shell_exec и иже с ним. Но заказчик не хочет менять хостинг. Что ж работаем на том, что есть… Ясно дело, что можно использовать стороннее, отлаженное, классное. Но иногда не получается, хотя очень хочется.
Большое спасибо, пригодится не только для PHP.
Не понятно — как выстраивается последовательность того же текста?
на слайдах он может быть абсолютно не упорядочен.
Не получится ли на выходе (в некоторых случаях) текст не поддающийся анализу?
Это ещё предстоит выяснить. В худшем случае, придётся ещё и положение текста читать на странице и исходя из этого делать какие-либо предположения. Как уже говорил, скрипт ещё сыроват — в процессе доработки.
В свое время то же интересовался чтением из Майкросовтовских форматов.
Нашел класс ExcelReader и ExcelWriter, которые по-моему находятся в pear
Sign up to leave a comment.

Articles

Change theme settings