Есть проблема с попаданием торрентов не в ту категорию. Причины может быть две: либо запрос к индексу нужно испраить (за этим я слежу и скоро все поправлю), либо модераторы трекера проглядели, и контент действительно попал не в ту категорию. Во втором случае я ничего не могу сделать.
Зашел в раздел — Сериалы — tchart.ru/chart/series
Сразу обратил внимание на большое количество одинаковых сериалов, что мешает объективно оценить популярность. Например сериал «во все тяжкие breaking bad» — 2066.3 качающих.
Прокручиваю список вниз — «во все тяжкие breaking bad серия» — 243.0 качающих. Аналогично со всеми остальными разделами (и почему Доктор хаус в Кино О_о). Как вариант, можно было разделять английское и русское название сериала, сравнивать например расстояние Левенштейна и склеивать одинаковые раздачи.
Тестировались разные алгоритмы группировки и был выбран тот, который выдает наиболее адекватные результаты. Идеального алгоритма здесь не может существовать в принципе, потому что группируются заголовки и, в общем случае, пользователи пишут туда все, что им угодно, и только человек может отделить, где название, а где ботва.
Главный принцип алгоритма — лучше недогруппировать, чем перегруппировать. Если контент популярный, он попадет в рейтинг даже отдельными торрентами (как правило, среди торрентов одного контента, один на порядок популярней остальных). С другой стороны, если алгоритм будет группировать что попало, так «за ручку» в топ будет попадать всякая хрень.
Заголовок группы — это пересечение множеств тегов, извлеченных из торрентов. Поэтому, если в сгрупированных заголовках есть «Супер 8» и «Супер», то будет «супер». Алгоритм группировки исключает числа, правда, думаю, отдельные цифры стоит различать, поскольку могут означать номер части.
Про ссылки на торренты, если их добавить, сайт автоматически превращается как бы в трекер со всеми возможными юридическими и не только последствиями — отборами доменных имен и прочими наездами. А так, это просто исследовательский проект.
Логотип иначе как «Tohqyt» прочитать не могу. На главной простыня ни о чем. Кегль мелкий, при увеличении появляется горизонтальный скрол. Теги тут вообще не нужны. В теории, они дублирую функции самого рейтинга, а в таком виде бесполезны.
ИМХО, идея интересная, но к раскрутке на хабре сайт пока не готов. Загляну через месяц.
Я всяких Киркоровых имел в виду — тех, кого по телевизору показывают. :) Вообще, интересно, что присутствие исполнителя в телевизоре и присутствие его на трекере, похоже, имеют обратную зависимость.
Tchart — самый объективный чарт