Привет. В первую очередь спасибо за конструктивный фидбек. Нынче поведение "чайка" очень популярно (обосрал и улетел).
Это первый раз когда я что-то подобное делаю. И уже пост фактум понял что нужно было еще отделить новости, совсем старые статьи и всякий мусор. (код обновился с тех пор)
Поделить на популярных/не популярных авторов отличная идея. Возможно эти изменения когда-то дойдут до хабра:)
Кстати в GitHub есть еще кое-что, что не попало в статью. При помощи word2vec и K-means сгруппировал заголовки по схожести. И можно посмотреть заголовки с какой структурой и формулировкой преобретают больше всего просмотров. Либо CTR.
Привет. В первую очередь спасибо за конструктивный фидбек.
Нынче поведение "чайка" очень популярно (обосрал и улетел).
Это первый раз когда я что-то подобное делаю.
И уже пост фактум понял что нужно было еще отделить новости, совсем старые статьи и всякий мусор. (код обновился с тех пор)
Поделить на популярных/не популярных авторов отличная идея. Возможно эти изменения когда-то дойдут до хабра:)
Кстати в GitHub есть еще кое-что, что не попало в статью. При помощи word2vec и K-means сгруппировал заголовки по схожести. И можно посмотреть заголовки с какой структурой и формулировкой преобретают больше всего просмотров. Либо CTR.