Comments 8
А Apache PDFBox или iText чем-то не устроили? Они все это умеют и без всяких ручных велосипедов. Например примеры для Apache PDFBox. Скажем выдернуть текст из pdf можно одной элементарной командой: ExtractText.main(new String[]{pdfFile, textFile});
P.S. Вообще, на все стандартные задачи в Java давно уже есть стандартные хорошо описанные и проверенные решения.
P.S. Вообще, на все стандартные задачи в Java давно уже есть стандартные хорошо описанные и проверенные решения.
Не первая уже статья на хабре с содержанием «смотрите, я нагуглил библиотеку! Вот, держите!». В чем проблема то? Что спецификация формата, что библиотека для его парсинга на java ищутся за 3 секунды. Описание структуры так же дано в том документе на первой же странице.
Да, на хабре нужно публиковать интересные библиотеки, интересные способы их использования, неординарные решения различных задач, причем чем выковыристее, тем лучше, но хабр не место, где стоит выкладывать ни спецификацию, которая ищется за 3 секунды, ни библиотеку с таким же временем поиска. Простите.
Да, на хабре нужно публиковать интересные библиотеки, интересные способы их использования, неординарные решения различных задач, причем чем выковыристее, тем лучше, но хабр не место, где стоит выкладывать ни спецификацию, которая ищется за 3 секунды, ни библиотеку с таким же временем поиска. Простите.
Сам довольно давно с этим мучался (с чтением PSD) — в итоге остановился на самом простом — подключаюсь через COM-объект к самому фотошопу и через его публичные методы читаю (ссылочку на сырцы могу скинуть в личку, кому интересно). Из минусов — нужен инстанс фотошопа. Думаю благодаря ссылоке на документацию проблему решу и сделаю ридер без непосредственного участия фотошопа, как-то раньше она (ссылка) не нагугливалась (руки кривые?), спасибо большое.
Из минусов — нужен инстанс фотошопаЭтим почти все сказано.
Sign up to leave a comment.
PSD parser или как разобрать файл Photoshop на Java