Pull to refresh

Comments 13

Стоп-слов: 82
из них — половина примеры этих самых слов
Если из текста вырезать куски кода и примеры стоп-слов, все станет гораздо лучше.
Открою вам секрет. Хороший текст редактируется три-четыре раза с перерывом в пару часов. Итого целый день.
Я не успеваю довести до идеала все тексты :(
Причастные обороты, услажняют язык, но могут нести смысловую нагрузку.
«Чепмен, убившый Леннона, читал книгу»
С дичью дело, мы полагаем, закончено. Глава предприятия Хадсон, по сведениям, рассказал о мухобойках всё. Фазаньих курочек берегитесь.

Забил свой привычный пример и получил подсветку только одного слова — «закончено». Гм. Результаты отличаются от ожидаемых, — скажем так.
Остаётся надеяться, что автор не бросит развитие алгоритма и продолжит его совершенствовать. Меня заинтересовало. =)
Списки стоп-слов постоянно пополняются. Я стараюсь в день редактировать по тексту и вручную проверять алгоритм.

Подскажите, что выделить в вашем примере?
Шерлок Холмс, разгадывая шифр, оставил лишь каждое третье слово. Если же подходить к этой записке как к обычному тексту, нужно выделить «сомневающиеся» вводные обороты — «мы полагаем» и «по сведениям».
ух-ты спасибо! Утащил продолжительность чтения и «Оценку понятности и удобочитаемости» в план развития
Подскажите, а pyMorphy умеет работать с текстом целиком или же, как и phpMorphy, только с отдельными словами?
Sign up to leave a comment.