Pull to refresh
6
0
Send message

Интересный вопрос! Думаю, что есть более продвинутые методы выделения ключевых слов из новостей, и на основании этого уже можно будет определять либо сразу какие-то крупные высокочастотные категории, либо потом с помощью того же W2V более узкие

Парсинг страниц за одну дату занимает примерно 10-12 секунд

Тут скорее цель была продемонстрировать эти методы на реальных данных, для начала в учебных целях

Information

Rating
Does not participate
Location
Россия
Registered
Activity

Specialization

Аналитик по данным, Ученый по данным