Комментарии 9
очень круто! очень интересный инструмент получается. Вас теперь могут пригласить в Ленту аналитиком)
Любопытный подход.
Можно-ли определить каталог категорий для незнакомой области?
Или нужно начинать с некоторого списка категорий, а затем корректировать (сужать/расширять)?
У меня 600+к новостей из разных источников (банковские, с 1990) и определение трендов может быть полезен для читателей.
Интересно. но, я не понял цели Вашего исследования. Результаты полученны вполне ожидаемые и очевидные.
Я так никогда не делал, поэтому интересно, сколько времени заняла первая часть кода с парсингом 365 страниц и выделением 93к строк для дф?
Очень интересно! Всегда раздражала имитация новостей в играх - по-моему, отсюда можно что-то применить для хорошей модели блока событий в выдуманных мирах - события мира, недоинформированность СМИ, преднамеренные и непреднамеренные искажения и откровенные фейки в зависимости от культуры обществ и целей СМИ, утеря связующих событий между казалось бы несвязанными сообщениями.
Анализ новостей с помощью сегментации и кластеризации временных рядов