Даже не знаю, куда писать, в «Стартапы», в «Блогосферу», в «SEO и SMO» или в «Я пиарюсь». Выбрал «SEO и SMO».
Суть проста. Все знают, что Яндекс объявил о закрытии своего топа записей в блогах, при этом предоставив всем желающим API для создания собственных рейтингов.
После этого сразу же появились клон Топа Яндекса на сайте Студии Лебедева, вроде бы, сделанный пока без использования API, а так же whoyougle.com/blogs уже с использованием последнего.
Посмотрев на эту ситуацию, я подумал, а почему бы не сделать свой топ блоговс го и гейшами, ведь всегда интересно делать что-то новое. Возможно, переоцениваю свои силы, ведь не являюсь ни Яндексом, ни Тёмой, ни Носиком, максимум ником последнего. Но, всё же, попробовать интересно, а даже если ничего не получится, появится ценный опыт.
Итак, как я представляю рейтинг на основе API Яндекса, что бы он мог стать хоть какой-то заменой оригинальному:
1. У него должно быть хорошее, запоминаемое имя, коим не являются ни www.artlebedev.ru/tools/blogs, ни www.whoyougle.com/blogs
В связи с этим, зарегистрированы 2 домена, TopBlogov.ru и BlogRating.org. Какой из них выбрать для сервиса, будет решено в ближайшее время.
2. К рейтингу должно быть доверие. Доверие к рейтингу будет только в том случае, если формула ранжирования будет общеизвестна и любой сможет по этой формуле проверить, что рейтинг ей соответствует.
3. Формула ранжирования должна максимально защищать от накруток и давать как можно более релевантный результат. Как это сочетается с её открытостью, пока не очень ясно.
4. Рейтинги по раздельным параметрам (числу ссылок, посещаемости, числу комментариев) не нужны. Нужен один, но хороший.
Конечно, что бы сервис «выстрелил», этого недостаточно, нужен вменяемый дизайн, нужна реклама, и что бы Лебедев уехал в очередную этнографическую экспедицию, планеты встали в ряд, а я бы более серьёзно отнёсся к этому пока просто фановому проекту. Но речь не об этом. Речь о формуле подсчёта. Возможно, данным обсуждением мы просто поможем улучшить Рейтинг Тёмы или Носика, что тоже хорошо. Ну а если проект будет запущен и интересен, по крайней мере нормальный сервер на колокейшене пока загружен процентов на 20, успеем купить второй.
Основные 2 вопроса, это какой алгоритм подсчёта выбрать и стоит ли делать формулу общедоступной.
Напомню, что Яндекс API предоставляет:
Что из этого стоит брать в расчёт, а что нет? Первая мысль, взять всё и перемножить, получив таким образом некий общий коэффициент. Потом приходит понимание, что «общее количество ссылок на запись за всё время её существования», а так же «общее количество комментариев к записи за всё время её существования» не должны иметь положительного веса, так как им мы увеличим в топе число старых боянов.
Так же непонятно, зачем нужен параметр links24, если есть links24weight. Можно использовать только его. А можно вычитать links24weight из links24 и использовать это как понижающий коэффициент для накрученных записей. На данный момент это кажется разумной идеей.
Ещё интересный параметр это число комментариев и комментаторов. Понятно, что число комментаторов важнее (т.к. можно написать любое число комментариев с 1 аккаунта), но всё-таки неясно, какое соотношение числа комментариев к числу комментаторов является наиболее правильным (привет шинглам).
Так же считаю правильным ввести понижающий коэффициент, если какой-либо из 3 положительных параметров проседает, т, е. является очень маленьким. Например, в свежевзвешенном топе whoyougle.com сейчас висит пост с 2 комментариями, что наводит на мысли. При этом, для того, что бы ввести такой коэффициент, требуется вычислить некое среднее значение каждого параметра, которое будет принято за эталон. Думаю, что это технически несложно (вычислять такое значение за месяц, к примеру, для каждого парамтра).
В итоге, получаем 3 основных параметра, которые стоит использовать:
Положительные:
Отрицательные:
Вот такие сумбурные мысли. На этом они заканчиваются и хочется услышать мнение общественности.
Суть проста. Все знают, что Яндекс объявил о закрытии своего топа записей в блогах, при этом предоставив всем желающим API для создания собственных рейтингов.
После этого сразу же появились клон Топа Яндекса на сайте Студии Лебедева, вроде бы, сделанный пока без использования API, а так же whoyougle.com/blogs уже с использованием последнего.
Посмотрев на эту ситуацию, я подумал, а почему бы не сделать свой топ блогов
Итак, как я представляю рейтинг на основе API Яндекса, что бы он мог стать хоть какой-то заменой оригинальному:
1. У него должно быть хорошее, запоминаемое имя, коим не являются ни www.artlebedev.ru/tools/blogs, ни www.whoyougle.com/blogs
В связи с этим, зарегистрированы 2 домена, TopBlogov.ru и BlogRating.org. Какой из них выбрать для сервиса, будет решено в ближайшее время.
2. К рейтингу должно быть доверие. Доверие к рейтингу будет только в том случае, если формула ранжирования будет общеизвестна и любой сможет по этой формуле проверить, что рейтинг ей соответствует.
3. Формула ранжирования должна максимально защищать от накруток и давать как можно более релевантный результат. Как это сочетается с её открытостью, пока не очень ясно.
4. Рейтинги по раздельным параметрам (числу ссылок, посещаемости, числу комментариев) не нужны. Нужен один, но хороший.
Конечно, что бы сервис «выстрелил», этого недостаточно, нужен вменяемый дизайн, нужна реклама, и что бы Лебедев уехал в очередную этнографическую экспедицию, планеты встали в ряд, а я бы более серьёзно отнёсся к этому пока просто фановому проекту. Но речь не об этом. Речь о формуле подсчёта. Возможно, данным обсуждением мы просто поможем улучшить Рейтинг Тёмы или Носика, что тоже хорошо. Ну а если проект будет запущен и интересен, по крайней мере нормальный сервер на колокейшене пока загружен процентов на 20, успеем купить второй.
Основные 2 вопроса, это какой алгоритм подсчёта выбрать и стоит ли делать формулу общедоступной.
Напомню, что Яндекс API предоставляет:
- links24 – количество ссылок на запись,
- links, – общее количество ссылок на запись за всё время её существования,
- links24weight – взвешенное количество ссылок на запись (с отфильтрованными накрутками и спамными ссылками),
- comments24 – количество комментариев к записи,
- comments – общее количество комментариев к записи за всё время её существования,
- commenters24 – количество разных русскоязычных комментаторов у записи,
- commenters – количество разных русскоязычных комментаторов у записи за всё время её существования,
- visits24 – примерное количество посетителей записи.
Что из этого стоит брать в расчёт, а что нет? Первая мысль, взять всё и перемножить, получив таким образом некий общий коэффициент. Потом приходит понимание, что «общее количество ссылок на запись за всё время её существования», а так же «общее количество комментариев к записи за всё время её существования» не должны иметь положительного веса, так как им мы увеличим в топе число старых боянов.
Так же непонятно, зачем нужен параметр links24, если есть links24weight. Можно использовать только его. А можно вычитать links24weight из links24 и использовать это как понижающий коэффициент для накрученных записей. На данный момент это кажется разумной идеей.
Ещё интересный параметр это число комментариев и комментаторов. Понятно, что число комментаторов важнее (т.к. можно написать любое число комментариев с 1 аккаунта), но всё-таки неясно, какое соотношение числа комментариев к числу комментаторов является наиболее правильным (привет шинглам).
Так же считаю правильным ввести понижающий коэффициент, если какой-либо из 3 положительных параметров проседает, т, е. является очень маленьким. Например, в свежевзвешенном топе whoyougle.com сейчас висит пост с 2 комментариями, что наводит на мысли. При этом, для того, что бы ввести такой коэффициент, требуется вычислить некое среднее значение каждого параметра, которое будет принято за эталон. Думаю, что это технически несложно (вычислять такое значение за месяц, к примеру, для каждого парамтра).
В итоге, получаем 3 основных параметра, которые стоит использовать:
Положительные:
- links24weight
- commenters24 и comments24 по какой-то формуле, допустим для начала (SQR (commenters24 * comments24))
- visits24
Отрицательные:
- links24 — links24weight
- какой-либо из положительно-влияющих коэффициентов меньше среднего более чем на X%
Вот такие сумбурные мысли. На этом они заканчиваются и хочется услышать мнение общественности.