Неплохо :) Насколько я понял, что то типа GATE/ANNIE, но открытое и более заточенное под data mining. Жаль что для русского языка таких инструментов не так много.
Действительно жаль, я как раз сейчас занимаюсь этой проблемой. Из открытого всё, что удалось найти и что нормально работает с русским языком — кое-какие аннотаторы uima (в основном те, которые не зависят от языка — токенайзеры итп).
О как, я пробовал эту штуку, когда IBM только анонсировала, не знал, что апачу отдали. ЕЕ кстати IBM использует в своих система семантического поиска по почте и базам
Машинная обработка естественных языков: Apache UIMA