Comments 5
Интересный метод… Кстати, по прочтению, у меня родился такой вопрос: можно ли пойти дальше, и определять, допустим, тематическую направленность текста, что-то вроде элементов контент-анализа?
Ian Barber не разбивал статью на две части, зачем это сделали вы? Два подряд идущих и ссылающихся друг на друга топика — это повышение энтропии. Гугл покарает вас.
А вы читали вообще текст-то? :)
«Разбить на две части пришлось из-за большого объема текста с форматированием («Some error… We know...).» Хабр не любит статьи более 50-60Кб, как выясняется. Во всяком случае у меня такие длинные не постит на Хабре. Говорит, что возникла ошибка, что он знает о ней, но мне ничего про нее не скажет больше…
«Разбить на две части пришлось из-за большого объема текста с форматированием («Some error… We know...).» Хабр не любит статьи более 50-60Кб, как выясняется. Во всяком случае у меня такие длинные не постит на Хабре. Говорит, что возникла ошибка, что он знает о ней, но мне ничего про нее не скажет больше…
Sign up to leave a comment.
PHP: Определение языка текста с помощью N-грамм. Часть 2