задача сама по себе уже решена, так что здесь я хотел бы рассмотреть именно общетеоретические вопросы. Т.е. системные требования к решению особо не принципиальны. Конечно хорошо, если это будет линух. Конкретно дебиан. Если нет - то можно будет это дело эмулировать, запустить на другой машине... или еще что придумать, в случае ежели понадобится реализовать. К языку тоже особо вопросов нет. На быстродействие там упор не ставится, а потому можно позволить себе это системными вызовами реализовать.
Как я понимаю, у вас задача все же несколько отличается - вам нужно почистить теги, которые появляются при копировании из ворда, не нарушив оформление? Или я не понял и у вас копировать из вордовского файла происходит как и у меня, не через буфер обмена?
Ну у меня как бы не проблема была :) Обсуждали одну инетересную идею и в процессе обсуждения возник вопрос: А есть ли такие средства? Ну вот и нашли. Дальше не копалоись - достаточно было информации о том что текст можно вытянуть.
Получение текста из.doc. Как это лучше сделать?