Как стать автором
Обновить

Облако тегов: линейная зависимость vs логарифмическая

Время на прочтение2 мин
Количество просмотров3.5K
Этот пост меня сподвигли написать две вещи. Автокадабра и некто под ником napisal, кто активно не соглашался с моим постом

Дело было так: я зашёл в карту клубов Автокадабры и понял что она мне ни о чём не говорит. Создавалось впечатление, что пишут всего в трёх клубах. После изучения облака я пришёл к выводу что линейная зависимость размера тега (в данном случае блога) от количества публикаций совершенно не информативна. Клубы с одной публикацией выглядят так же как и с 15-ю.

Первоё что пришло на ум — заменить линейную зависимость логарифмической, что я и сделал. Результат мне так понравился, что я решил проделать то же с облаком тегов. После чего написал пост на Mmm… tasty.

Так изменилось облако тегов в компактном варианте (оно мение наглядно чем облако клубов, зато не такое большое):

Линейная зависимость (до)

Логарифмическая зависимость (после)


Собственно, почему я решил всё таки написать об этом на Хабре? Потому что, в процессе спора с napisal, я нагуглил вот такую любопытную статью. Любопытно в ней то, что в виде облака там показаны не теги, не блоги, а статистика использования доменов первого уровня. Что навело меня на глубокие философские размышления о логарифмах статистике и космосе :-)

Вот картинка из статьи:


UPD из Википедии: Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.

Собственно, теги (как и доменные имена), получается, подчиняются этому же закону распределения. Из этого и логарифмы…
Теги:
Хабы:
Всего голосов 2: ↑2 и ↓0+2
Комментарии47

Публикации

Истории

Ближайшие события

2 – 18 декабря
Yandex DataLens Festival 2024
МоскваОнлайн
11 – 13 декабря
Международная конференция по AI/ML «AI Journey»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань