Можно поподробнее. Насколько я знаю для украинского мало нормальных стеммеров :( По крайней мере стеммер Портера в украинской версии выглядит очень убого.
Судя по описанию программа ориентирована прежде всего на славянские языки, для германских (английский, немецкий, ...) и романских (итальянский, испанский, французский, ...) в том же описании есть ссылки на более эффективные алгоритмы
Да именно cp1251. И я в этом не вижу проблемы, до сих пор для украинского языка нет нормального стеммера без огромных баз. А перекодировать с одной кодировки в другую очень просто.
Допустим, что пофиг. Но указать на страничке можно было кодировку? Нормальные браузеры по умолчанию считают UTF-8, если не указано. У вас не указано, поэтому нифига не работает.
(домашня)
Кстати чуть-чуть покопал в этом вопросе, накопал вот такую штуку: программа морфологического анализа текста на русском языке
Очень мне помогла =) Хотя грузит систему оччень хорошо :(
Вероятностный морфологический анализатор русского и украинского языков на PHP