Этот пост меня сподвигли написать две вещи. Автокадабра и некто под ником napisal, кто активно не соглашался с моим постом…
Дело было так: я зашёл в карту клубов Автокадабры и понял что она мне ни о чём не говорит. Создавалось впечатление, что пишут всего в трёх клубах. После изучения облака я пришёл к выводу что линейная зависимость размера тега (в данном случае блога) от количества публикаций совершенно не информативна. Клубы с одной публикацией выглядят так же как и с15-ю .
Первоё что пришло на ум — заменить линейную зависимость логарифмической, что я и сделал. Результат мне так понравился, что я решил проделать то же с облаком тегов. После чего написал пост на Mmm… tasty.
Так изменилось облако тегов в компактном варианте (оно мение наглядно чем облако клубов, зато не такое большое):
Собственно, почему я решил всё таки написать об этом на Хабре? Потому что, в процессе спора с napisal, я нагуглил вот такую любопытную статью. Любопытно в ней то, что в виде облака там показаны не теги, не блоги, а статистика использования доменов первого уровня. Что навело меня на глубокие философские размышления о логарифмах статистике и космосе :-)
Вот картинка из статьи:
UPD из Википедии: Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.
Собственно, теги (как и доменные имена), получается, подчиняются этому же закону распределения. Из этого и логарифмы…
Дело было так: я зашёл в карту клубов Автокадабры и понял что она мне ни о чём не говорит. Создавалось впечатление, что пишут всего в трёх клубах. После изучения облака я пришёл к выводу что линейная зависимость размера тега (в данном случае блога) от количества публикаций совершенно не информативна. Клубы с одной публикацией выглядят так же как и с
Первоё что пришло на ум — заменить линейную зависимость логарифмической, что я и сделал. Результат мне так понравился, что я решил проделать то же с облаком тегов. После чего написал пост на Mmm… tasty.
Так изменилось облако тегов в компактном варианте (оно мение наглядно чем облако клубов, зато не такое большое):
Линейная зависимость (до) |
Логарифмическая зависимость (после) |
Собственно, почему я решил всё таки написать об этом на Хабре? Потому что, в процессе спора с napisal, я нагуглил вот такую любопытную статью. Любопытно в ней то, что в виде облака там показаны не теги, не блоги, а статистика использования доменов первого уровня. Что навело меня на глубокие философские размышления о логарифмах статистике и космосе :-)
Вот картинка из статьи:
UPD из Википедии: Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.
Собственно, теги (как и доменные имена), получается, подчиняются этому же закону распределения. Из этого и логарифмы…