Comments 4
Результаты исследования, если честно, на уровне очевидных: люди ходят на работу, смотрят в рабочее время развлекательные сайты меньше, чем во время отдыха. Я думал, аналитика будет более интересной и приоткроет факты и корреляции, которые не бросаются в глаза и не сильно очевидны.
Подтверждение известных паттернов — это лишь первый шаг. Хоть и он лично мне важен, очень часто в комментариях Пикабу сомневаются(в грубой форме) в возрасте брони. Теперь это подтверждено не только исследованиями в Интернете, но и лично.
Настоящая "глубина", о которой вы говорите, лежит в области предиктивной аналитики и ML, и этот проект — как раз подготовка плацдарма для нее.
Например, теперь, имея этот датасет, можно построить модель, которая ответит на неочевидный вопрос: "Что важнее для высокого рейтинга — популярный автор или популярный тег?". Или, как я упомянул в статье, проанализировать токсичность комментариев и найти корреляцию между темой поста и уровнем агрессии в обсуждении. Вот это уже будут те самые неочевидные факты. Этот дашборд — лишь первый шаг к ним.
В будущем я этим займусь и реализую
Анализируем MLP сообщество на Пикабу или как я спарсил 65 тысяч постов с Pikabu и построил интерактивный дашборд