Comments 23
- Очень ждал сопоставления источников и показателя надёжности.
- Чуть более развёрнутого вывода из сравнения рейтинга медузы и медиалогии.
- Рамблер и росбалт на 4 и 5 месте в медиалогии отсутствуют в диаграмме медузы. Почему?
- Источником «медуза» часто обозначены собственные материалы: интересно посмотреть, были ли настоящие новости с таким источником.
- Хорошо бы ссылки на все 23 новости с ненадёжными источниками, и список источников.
- В метаданных есть locale: у медузы есть отдельная англоязычная версия. В ней новости часто повторяют русскоязычные. Хорошо бы, во-первых, разделить, во-вторых, показать статистику по всем языкам и сравнить.
- Также интересны источники популярных новостей на основе количества лайков. Кто пишет новости интереснее: интерфакс или buzzfeed?
- Интересно, есть ли спонсированные новости (поле sponsored).
Еще интересно было бы взвесить данные на количество просмотров, расшариваний и (тут не знаю как точно обозначить термин) длительность экспозиции материала. Например, материал из раздела "карточки" будет значительно дольше представлен читателям, нежели рядовая новость.
Столько букв ради того, чтобы показать то, что и так всем известно.
Можно поподробнее, какие темы имеются ввиду?
как они агрегируют?
Вопросы по поводу как: для агрегации используется классификация или кластеризация? На основе источников или по тексту? Можно ли что-то почитать по методам кластеризации/классификации на медузе?
В смысле, как происходит кластеризация в статье? Взят топ и источники разбиты по категориям СМИ. В самой Медузе наверняка сидят люди, которые изучают источники, такие как информагентства и принимают решения стоит ли публиковать новость и в каком разделе.
Т.е. кластеризация здесь не автоматическая, а для классификации нужны размеченные данные и в общем-то, нужно понять что классифицировать — источник по тексту новости? То есть саму задачу нужно будет еще поставить.
Кого агрегирует Meduza?