А, это... Ну, всё не совсем так. Можно ведь самому создать группу и там хоть читерить, хоть ещё как... Другое дело, что толку с этого особо не будет и на небольшом количестве человек даже за пределы квалификации выйти не получится. Хотя распределить игроков по силе игры -- это запросто, с этим справляется.
По поводу уже готового бота для расчёта рейтинга настольного тенниса настоятельно рекомендую посмотреть https://t.me/tt_rating_bot -- там уже очень много всего предусмотрено и перепроверено на сотнях живых игроков.
А теперь поясню, почему в данной ситуации Эло всё же может показать себя лучше. В Эло прирост рейтинга (заметьте -- я не называю это инфляцией) осуществляется за счёт новичков. Добавился новичок к нашим двум игрокам, они его обыграли -- подняли себе рейтинг. Это не инфляция, потому что в какой-то момент разница между ними и новичком составит такое значение, что рейтинг практически перестанет расти.
Кстати, понимая эту особенность, я себе за счёт привлечения новичков рейтинг поднял на полтора разряда. В итоге за новичков мне рейтинг уже почти перестали давать, слишком большая разница... А игры с профи тут же меня втоптали обратно на мой реальный уровень игры, буквально за месяц. :)
Ваша система имеет изначальный дефект, который практически неустраним. Это не ваша вина по большей части. Никто не знает как именно и кто будет использовать вашего чат-бота. Много где его могут использовать совершенно закрытые небольшие локальные группки игроков (условные ребята с завода, играющие на перерыве) которые никак не будут привязываться к другим общим тусовкам. И эти ребята вдруг обнаружат, что за три года игр они явно прибавили в уровне, но отсутствие инфляции будет приводить к тому, что их рейтинг будет стоять на месте.
Простите, но RTTF-подобные рейтинги имеют точно такой же дефект, проявляющийся в малых закрытых сообществах. Вы ведь замечали, что при использовании по факту одинаковой формулы рейтинг игроков из России будет отличаться от рейтинга игроков из Украины или из Литвы? Имею ввиду, что два игрока с одинаковым рейтингом, но с разных стран, при встрече покажут разный уровень. Не обращали внимания?
Закрытое сообщество и в одной, и в другой рейтинговой системе формирует неправильные показатели. Отличие только в том, что будет на выходе.
Если в Эло 2 игрока будут друг с другом играть с переменным успехом, то через тысячу игр их уровень будет на уровне начинающих. Потому что Эло расставляет игроков относительно друг друга.
В случае использования РТТФ после тысячи игр их рейтинг будет на уровне мастеров спорта, потому что проигрывающий теряет в 2 раза меньше, чем выигрывающий. Хотя на деле они могут играть как полные лохи.
А теперь поясню, почему в данной ситуации Эло всё же может показать себя лучше. В Эло прирост рейтинга (заметьте -- я не называю это инфляцией) осуществляется за счёт новичков. Добавился новичок к нашим двум игрокам, они его обыграли -- подняли себе рейтинг. Это не инфляция, потому что в какой-то момент разница между ними и новичком составит такое значение, что рейтинг практически перестанет расти.
Что происходит с РТТФ? А там новичок почти ни на что и не повлияет, если он играет хуже. Он выигрывать не сможет, его рейтинг так и останется на начальном уровне. А "мастера" так и продолжат неконтролируемо расти в рейтинге, просто играя друг с другом. Вот это и есть инфляция, потому что сдерживающих границ не существует.
Так вот, мне кажется, что ваш бот будет плохо, даже очень плохо справляться с основной задачей - ранжированием. Малое число игроков, сомнительные начальные установки на игры (какие-то ничьи, обязательное условие умирать за столом даже при играх со слабыми), отсутствие контроля и возможность накруток, совершенно разные условия набора рейтинга у разных игроков (часть играет в парке, кто-то в зале, кто-то в тренажерке) - все это очень сильно будет мешать определению уровня игроков.
Видите ли, вы только предполагаете, а я наблюдаю. И статью эту я написал после полугода наблюдений.
У меня есть 3 независимых чата, где бот очень активно используется. В двух из них бот используется для расчёта как соревнований, так и обычных встреч, в третьем только для расчёта соревнований. Разные страны, пересечений очень мало.
Но вот что любопытно, после преодоления порога насыщения (когда рейтинг топовых перестаёт расти) во всех чатах появляется стабильность, игроки держатся примерно на своих уровнях. Т.е. уже можно говорить про отличную работу ранжирования, не так ли?
Но более того. Я ещё иногда перепроверяю спортивные разряды игроков, у кого есть известный мне РТТФ/ТТВ рейтинг: какой разряд им выставил бот и какой разряд у них согласно РТТФ. Вы удивитесь, но в большинстве случае разряды сходятся. :)
Поэтому можно много теоретизировать, но на практике я вижу, что это действительно работает. Главное условие -- чтоб ботом в чате начали активно пользоваться, потому что самый сложный этап в самом начале, когда у всех рейтинг на уровне начального.
Вы же обратили внимание на скриншоты в статье? Это реальные высказывания тех игроков, кто поначалу со мной очень сильно спорил, ругал, плевался на бота, приводил ваши же аргументы... А потом внезапно обнаружили, что всё отлично работает. И что если ты пойдёшь играть с игроком на 100 очков рейтинга выше тебя (аналог 50 в РТТФ), то выиграть его будет очень сложно, равно как и наоборот.
И это не такие любители, как я. Это МС, КМС, перворазрядники. Да, непривычно. Да, иногда раздражает. Да, заставляет выкладываться. Но -- отлично справляется с ранжированием!
Реал Мадрид не должен выходить на матч с Атлетик Бильбао с установкой выиграть 6:0, иначе они потеряют очки даже при 5:1.
Вот что меня удивляет в подобных дискуссиях, это когда профессионалы мне начинают говорить, что очень некорректно сравнивать шахматы с теннисом, но при этом сами спокойно сравнивают теннис с футболом. При этом могут даже про дополнительный состав упомянуть... Как по мне, так шахматы будут гораздо ближе к теннису, чем футбол. Хотя бы потому, что это индивидуальные, а не групповые игры.
Начну с конца. В НТ есть правила, их нужно уважать. Ничья - это не результат, ничьи там быть не может в принципе. Если это отрицать, то можно отрицать все что угодно. Любой рейтинг, который учитывает ничью в качестве допустимого результата не соответствует правилам тенниса и я не вижу смысла его всерьез обсуждать.
Вы мне сейчас напомнили детскую песенку "Жопа есть, а слова нет". :) Что поделать, что "ничьей не может быть в принципе", но на практике она нередко бывает.
Так и представляю, 2 игрока поиграли час времени, получили счёт 5:5, идут в Телеграм регистрировать результат, а бот им такое: "Э не, такого не бывает, давайте ещё дополнительно стол арендуйте и играйте решающий сет".
Я не понимаю мотивации вашего условного игрока. Он играет в парке, но вдруг должен выкладываться в каждой встрече как на коммерческом или официальном турнире, иначе будет терять баллы рейтинга даже при победах.
Да пожалуйста, никто ведь не заставляет играть на рейтинг. Если пришёл играть в пинг-понг, а не в настольный теннис, так и скажи. Действительно, зачем теннис, если пришёл просто мячик попинать. Зачем потеть, если по парку гуляешь.
Но так можно сказать, "зачем я должен выкладываться, если мне не заплатят", или "это какое-то соревнование города, а не международное".
Это всё лирика и к теме рейтинговых систем уже никакого отношения не имеет.
Вы почему-то всерьез считаете, что мастер обязан обыгрывать кандидата со счетом 3:0 в каждом матче. Не обязан и не должен. Любой играющий на этом уровне понимает о чем речь.
Да-да, возвращаемся к аргументам "почему я должен выкладываться".
Я уже за год наблюдений понял, что турнирная система и рейтинг РТТФ вполне могут расслаблять сильных игроков. Играем до 3 побед? Ну ок, я вроде сильнее, можно не особо напрягаться, 2 сета солью, но в итоге всё равно ведь выиграю.
А в итоге получается, что опытный игрок начинает терять квалификацию не только потому, что не имеет возможности играть с более сильными соперниками, но и потому, что отвыкает выкладываться, даже если играет на рейтинг. И вот рейтинговая система Эло в данном случае является хорошим стимулятором.
Я не совсем понял каким образом мотивация сильного игрока должна резко улучшиться от того, что он даже при выигрыше (по вашей системе) частенько будет оставаться в минусе? Да ему просто будет наплевать на такие игры и он будет сразу предупреждать, что играть на улице будет без всяких рейтингов.
А какая мотивация у такого игрока в РТТФ? Что играл, что нет, прироста рейтинга не видно. Да ещё и есть вероятность здорово потерять от какого-нибудь случайного выскочки.
А в Эло твоя победа принесёт тебе хоть немного баллов. Интересен рейтинг? Рискуй. Но при этом выкладывайся.
В РТТФ я такого стимула не вижу.
Что здесь удивительного? Так и должно быть. Перворазрядник будет расти за счет спарринга с сильным мастером спорта, а мастер будет постепенно деградировать из-за игры с игроком, уступающем в классе. Это очень частая история, я лично сам через такое проходил пару раз.
Ну вот тогда и возникает вопрос, почему в Эло эта предполагаемая деградация прекрасно отобразилась на рейтинге, а в РТТФ этот мастер по-прежнему на недосягаемых высотах? Ах, потому что он не играл со своим уровнем, который бы его на место поставил... Ну так об этом недостатке я и упоминал в статье. ;)
Если вы всерьез относитесь к таким играм, то договаривайтесь заранее о формате без ничьих, в НТ ничьих не бывает.
Это дополнительные ограничения, дополнительные условия, рамки. Можно их учитывать, конечно, но хотелось бы всё же больше свободы.
Да и в любом случае, ничья -- это тоже результат. Для равных по силе -- ожидаемый результат, для сильного и слабого -- результат не в пользу сильного. То, что Эло прекрасно умеет считать ничью -- это дополнительный аргумент в сторону именно этой рейтинговой системы.
Ради интереса сейчас посмотрел, сколько за полгода использования бота в нём было зарегистрировано "ничьих": 63 из 4370, 1.4%. Не так уж и мало, чтоб скидывать со счёта.
Спасибо за внимание к статье и обстоятельный ответ. Попробую сейчас вкратце дать пояснения по каждому вашему замечанию, чтоб вы видели, что все эти моменты я изучал и анализировал, даже если у вас сложилось обратное впечатление.
Вы постоянно подчеркиваете, что люди путают игру на рейтинг с тренировкой, но тут же указываете, что люди на улице играют как придется, вплоть до ничьих. Однако, если мы говорим о правилах тенниса, то там ничьих быть не может, а в заранее оговоренной игре на рейтинг (а не тренировочном междусобойчике со счетом 5:5) нет никаких проблем организовать привычный 5 или 7-сетовый формат.
Форматы игр, которые я встречал на улице:
Турнирный: играем матчи до 2-3 побед.
Матчевый: играем до 5 побед, потом тренируемся.
Временной: играем до конца арендованного времени.
Вот в последнем варианте ничья -- довольно частый случай, когда встречаются одинаковые соперники. Нередко они даже довольны ничьей, потому что друзья. И последний вариант игры среди уличных игроков встречается чаще всего. Первые два в основном используются теми, кто уже "испорчен турнирами". ;)
Рейтинговая система РТТФ очень сильно отличается от ТТВ. Разные коэффициенты, учет разницы в сетах, бонусы за призовые места, специфика присвоения опорного-начального рейтинга, другой подсчет первых турниров и всякие другие мелочи.
Насчёт "сильно отличается" - я бы не был так категоричен. У них одна база и один основной принцип. Отличие только в дополнительном коэффициенте, учитывающем разницу сетов (та-дам, небольшой РТТФ-костыль, который в Эло не нужен, потому что входит в состав самой формулы) и бонусы для победителей турниров. Т.е. принципиальной разницы нет, добавлено немного динамики.
Допустим, что играют двое с рейтингами 350 и 200. При выигрыше первого рейтинг не меняется, а вот при выигрыше второго мы получаем [(100 - (200 - 350)) / 10] * k * D = 25 * k * D. При k = 0,2 рейтинг изменится в пользу игрока с рейтингом 200 примерно на 5 баллов за одну игру. Почему вы утверждаете, что что перворазряднику в случае РТТФ никак не поднять свой рейтинг?
Вот тут вы продемонстрировали один из недостатков формулы РТТФ, который я не упоминал в статье. Если сильный выиграет, он остаётся на месте. Если проиграет, он потеряет рейтинг. В турнирах выбора нет, а вот на улице это может привести к тому, что сильный просто не захочет играть со слабым, потому что победа ему не даст ничего, а поражение приведёт к потере. В итоге те, кто гонятся за рейтингом, попросту не будут рисковать, что приведёт к дискредитации самой идеи любительского рейтинга.
Теперь рассмотрим ваш вариант с перворазрядником и мастером. Согласно Эло, при разнице в 1 разряд вероятность выигрыша составляет 75%. Вот внизу график, разница между разрядами 200 очков.
2 разряда -- это уже 90%.
Так вот, возвращаясь к моему примеру с мастером и 1-разрядником. Согласно графику, из 10 сетов перворазрядник выиграет у мастера только 1. Попробуйте теперь посчитать, сколько нужно провести матчей, чтоб перворазрядник выиграл хотя бы один из них, чтоб продвинуться в рейтинге по РТТФ. А в Эло, как я упоминал, вот этот 1 выигранный сет уже даст перворазряднику прирост.
Хотя нужно быть честным, в Эло тоже добавили определённый костыль, и при разнице больше 400 очков сильный игрок теряет меньше очков, чем полагалось бы строго по формуле -- типа, часть списывается на случайность.
Понимаете, о чём я говорю?
Приведу реальный пример, за которым с интересом наблюдал. Есть мастер спорта с рейтингом 1100 РТТФ. И есть перворазрядник с рейтингом 650 РТТФ. Их обычная статистика игр -- 3:1. Т.е. разница между ними -- 1 разряд, а не 4.
Изначально я импортировал их рейтинг исходя из рейтинга РТТФ. И потом с изумлением наблюдал, как у одного рейтинг постоянно растёт, а у другого постоянно снижается. Пока наконец-то один не поднялся на уровень КМС, а второй так и остался МС, но уже с разумной величиной рейтинга.
По матчам за всё это время упомянутый КМС ни разу у МС не выиграл. Поэтому несмотря на 20 прошедших турниров, он так и остался на уровне 600. А упомянутый МС, несмотря на 50 проведённых турниров, так остался на своём 1100. Т.е. 1-разрядник против МС. В то время как по Эло у нас уже есть КМС, который свою позицию постоянно подтверждает победами над другими игроками.
И это, кстати, не единичный пример, благодаря которому я на практике подтвердил первоначальный вывод, что РТТФ очень плохо считает рейтинг при большой разнице.
И еще одно. Я пока не смотрел формулу по которой вы считаете. Она предполагает какую-то инфляцию рейтинга? Что происходит, когда два абсолютно одинаково играющих спортсмена играют 10 встреч и каждый набирает по 5 побед? Я надеюсь, что оба растут в рейтинге, а не имеют дельту равную нулю?
Если они играют только между собой, то прироста рейтинга нет. Если 2 игрока стабильно играют в пропорции 1:3, то их растащит на расстояние 200 очков относительно начальных рейтингов и там оставит.
В этом есть минус для маленьких сообществ. Если 3 мастера начнут играть только друг с другом с начальным рейтингом, то их рейтинг так и будет в районе начального. В РТТФ же их рейтинг будет непрерывно расти, что является причиной инфляции.
В Эло тоже может быть инфляция за счёт новичков, у которых начальный рейтинг 1000. Какой-нибудь юниор, обыграв десяток новичков, может разом подняться до 3 разряда. При игре с настоящим третьим разрядом он свой рейтинг отдаст третьеразряднику, а третьеразрядник его отдаст выше и так далее, как круги по воде, хорошо хоть с затуханием.
Но тут ещё многое зависит от того, как считать рейтинг, получаемый с новичков. С одной стороны, он нужен, чтоб сильных игроков поставить на правильное место, с другой стороны, может привести к инфляции. Тонкий момент. Но на практике, наблюдая за двумя активными сообществами, где вовсю используется бот, я не могу сказать, что там есть какая-то очевидная инфляция. Нет, вначале идёт процесс насыщения рейтинга, а потом всё, люди достигают своих позиций и рейтинг больше не растёт (если только человек не начинает действительно лучше играть).
Я не хочу больше спорить на эту тему. Подозреваю, вы не очень часто играли в уличных условиях и склонны переоценивать сложности.
Могу только высказать мнение, что ваши суждения справедливы для сильного и слабого в пределах одного разряда. Там солнце может на что-то повлиять. Но когда между игроками разница в 2 и больше разряда, тут слабому уже попросту сложно как-то воспользоваться преимуществом, потому что для более опытного игрока его потуги будут читаться по одному только звуку удара, по силуэту движения.
Я сейчас говорю не про неудобных противников. И не про противников из разных замкнутых сообществ, в одном из которых рейтинг может быть занижен, потому что играют друг с другом и тянут друг друга вниз. Я говорю про гипотетическую ситуацию, когда у наших мастеров одинаковые соперники и предлагаю размышлять с точки зрения средних чисел, а не с точки зрения исключений.
Заметьте, в этой дискуссии не я первый начал подкалывать оппонента с первого же предложения.
Вы идете против концепции, давно принятой в спортивной среде, отсюда у вас будут проблемы с неприятием вашей системы среди игроков.
Поверьте, мне нелегко далось решение использовать непривычную (для НТ) рейтинговую систему. Было много дискуссий с гораздо более опытными игроками, чем я. Иногда это напоминало рассуждения про демократию: "Демократия — плохая форма правления, но остальные еще хуже". Вот только в нашем случае, в отличие от альтернатив демократии, есть явно более продуманная формула рейтинговой системы.
В итоге я понял, что как бы я ни дорабатывал формулу, без строгого следования турнирному формату всё равно будет "не то". Всё равно результаты будут отличаться от привычных, при этом и формула у меня будет изменённая, и все её недостатки тоже будут со мной.
Ну, а раз обвинений в криворукости всё равно не избежать, то почему бы в таком случае не расслабиться и не использовать более продуманную в математическом плане формулу?
Разумеется второй. Он может варьировать свои усилия, раскладываться на дистанции нескольких игр, да и вообще, в вашей концепции он побеждает, хотя и отдавая иногда сеты.
Полагаю, вы заблуждаетесь. То, что первый способен постоянно играть на максимуме, вовсе не означает, что он не умеет варьировать усилия. А вот второй постоянно на максимуме играть не умеет. В итоге их встреча наверняка завершится победой первого, который сможет доминировать от начала до конца, а второй наверняка где-то да дрогнет, либо по привычке, либо из слабости.
Вот ещё пример для затравочки. Есть два мастера, всегда выигрывающих. Друг с другом не играли. Первый всегда выигрывает со счётом 2:0, второй со счётом 2:1. Кто из них сильнее? ;)
Проблемы тут начинаются еще на уровне концепции. Вроде бы предлагается система для обсчета рейтинга товарищеских, уличных, производственных, школьных и прочих неофициальных мероприятий
Действительно, проблема начинается на уровне концепции. Вы ведь даже не поняли, что этот рейтинг никак не может являться "системой для обсчёта мероприятий". :) Мероприятия, турниры и так далее обсчитываются по другим принципам. И победитель турнира далеко не всегда получает больше всех рейтинга, что в РТТФ, что в Эло.
Да он может быть и не хотел побеждать уверенно - он же не на официальном турнире, а в парке. Он мог дать заведомо более слабому игроку просто поиграть, мог сам отрабатывать игру одной стороной, точить подачи или прием, кидать свечи.
Как и собеседник выше, вы путаете игру на рейтинг и тренировку. Если ты играешь на рейтинг, значит играешь серьёзно, на максимуме, показывая все свои возможности. А если нет, то зачем играешь на рейтинг в таком случае? И если будучи МС, слил несколько сетов третьеразряднику, почему удивляешься, что рейтинг просел?
Я так понимаю, это всё проявления некой деформации у тех, кто привык к турнирным форматам, когда в зачёт идёт только победа. Можно 2 сета ковыряться в носу, а потом слегка напрячься и 3 выиграть.
Но даже если рассматривать с этой стороны, то Эло опять же точнее считает: какой игрок лучше, кто всегда готов играть на максимуме, или тот, кто иногда вынужден отдыхать, сливая сеты? ;)
Кроме того, у шахматистов ветер очень редко сдувает фигуры с доски, а солнце очень нечасто светит настолько сильно, что игрок начинает путать итальянскую и испанскую партии. А вот в уличных играх в теннис все это случается с завидным постоянством. И фактор случайности тут работает вовсе не в пользу более сильного игрока - вероятность у всех одинаковая, но вот потеря рейтинга - нет.
О, шахматисты тут очень многое могли бы привести в качестве аргумента. И стул непривычный, и доска, и отвлекающий шум в зале... Но вот только они понимают, что когда что-то мешает одному, то оно же мешает и другому. Более того, сильному это иногда даже на руку, за счёт его опыта.
Рассмотреть ваши же примеры с ветром или солнцем. Они мешают обоим игрокам. Но вот сильный может использовать их в свою пользу: сделать накат при попутном ветре или подсечку при встречном, стараться позиционно играть так, чтоб в момент атаки соперник находился против солнца. Да даже сорванный с траектории мячик опытный игрок подхватит легче, чем неопытный. Странно, что вы этого не понимаете.
Мне кажется, вы путаете тренировку и игру на рейтинг (турнир). Никто ведь не заставляет регистрировать для рейтинга все игры. Вот до 5 побед поиграли на рейтинг, а дальше тренировка.
А то встречал таких: "Да я на уровне 1 разряда играю! Я тут с КМС поиграл, чуть его не выиграл, 5:2 итоговый счёт!" Начинаешь с ним играть, а он и на третьеразрядника не тянет. Потому что КМС играл не всерьёз, просто развлекался, привыкнув к тому, что имеет значение только итоговая победа.
И если бы считалось по РТТФ, то да, значение имела бы только итоговая победа. А вот по Эло была бы видна разница и вряд ли КМС так легко отдавал бы сеты.
Не всегда есть возможность участвовать в турнирах. Особенно в таких турнирах, где будут игроки твоего уровня. В небольших городах, особенно где НТ не очень популярен, с этим вообще может быть проблема.
Что до игры, я сейчас пришёл к такому формату игры: к примеру, договариваемся играть час, после разминки играм до 5 побед на рейтинг, а дальше уже со счётом, но без рейтинга. На рейтинг делаешь всё, что умеешь, особо не экспериментируешь, можешь убивать с подачи -- убиваешь. Это рейтинг и он должен показать реальную разницу.
И если в случае РТТФ здесь бы в финале считалась просто победа (которую сильнейший так или иначе всё равно получит), то в Эло тут уже важен каждый сет, на расслабоне не поиграешь даже с заведомо слабым соперником. По себе замечал -- игра на рейтинг в таком случае мобилизует и заставляет выкладываться гораздо сильнее, чем просто на счёт.
А вот потом уже играем остаток времени просто на счёт, без рейтинга. Появляется возможность "точить" приёмы, экспериментировать с новыми подачами и так далее.
И при игре на рейтинг лично у меня появилось гораздо больше интереса играть с соперниками, оказавшимися слабее. А если совсем слабый, то можно и для левой руки рейтинг покачать, бот левую руку тоже поддерживает. :)
Во-первых, на результат в таком случае сильно влияет порядок игр. Как в РТТФ, так и в Эло. Вот результаты двух игр 1:0, потом 0:1 для обеих рейтинговых систем (начальные данные 1500 Эло (400 РТТФ) против 1400 Эло (350 РТТФ)):
Игра 1:0: 1504 (401.2) - 1396 (349.4) Игра 0:1: 1497 (399.1) - 1403 (352.6)
А теперь обратный порядок (те же начальные данные 1500 Эло (400 РТТФ) против 1400 Эло (350 РТТФ)):
Игра 0:1: 1494 (398.2) - 1406 (353.6) Игра 1:0: 1498 (399.3) - 1402 (352.3)
Как видите, порядок игр влияет на конечный результат. Хотя можно было, конечно, попытаться распределить их как можно равномернее... Однако тут вступает в действие второй фактор. Рассмотрим те же игры, но для случая, когда разница между игроками составляет больше 1 разряда (1700 Эло (500 RTTF) и 1400 Эло (350 RTTF)):
Игра 1:0: 1702 (500) - 1398 (350) Игра 0:1: 1693 (497) - 1407 (356)
И в обратном порядке:
Игра 0:1: 1692 (497) - 1408 (356) Игра 1:0: 1694 (497) - 1406 (497)
Казалось бы, всё же одинаково? По итогу и там, и там минус? Вот только обратите внимание на выделенное. РТТФ не даёт бонуса за победу при разнице больше 1 разряда, но отнимает за поражение. :) Т.е. при счёте 11:1 итог будет всё равно не в пользу заведомо сильного победителя.
Конечно, можно было бы какие-то дополнительные условия тут ввести, а что если то, а что если это... Но честно, на тот момент меня уже потряхивало от костыльности этой формулы. И вместо изобретения дополнительных костылей я предпочёл переключиться на изучение другой формулы, которая подобные ситуации отрабатывает "из коробочки".
Погодите, а это разве не про ручное изменение говорится? Т.е. организатор переоценил/недооценил новичка, который на турнире показал себя совсем по-другому, и этот же организатор взял и изменил рейтинг задним числом. Разве это не так работает?
А, это... Ну, всё не совсем так. Можно ведь самому создать группу и там хоть читерить, хоть ещё как... Другое дело, что толку с этого особо не будет и на небольшом количестве человек даже за пределы квалификации выйти не получится. Хотя распределить игроков по силе игры -- это запросто, с этим справляется.
Хм, не видел приписки.
Не совсем понял, какие группы и какие администраторы имеются ввиду.
По поводу уже готового бота для расчёта рейтинга настольного тенниса настоятельно рекомендую посмотреть https://t.me/tt_rating_bot -- там уже очень много всего предусмотрено и перепроверено на сотнях живых игроков.
Подробнее про различия рейтинга Эло и RTTF написано здесь же, на хабре: https://habr.com/ru/articles/725708/
Кстати, понимая эту особенность, я себе за счёт привлечения новичков рейтинг поднял на полтора разряда. В итоге за новичков мне рейтинг уже почти перестали давать, слишком большая разница... А игры с профи тут же меня втоптали обратно на мой реальный уровень игры, буквально за месяц. :)
Простите, но RTTF-подобные рейтинги имеют точно такой же дефект, проявляющийся в малых закрытых сообществах. Вы ведь замечали, что при использовании по факту одинаковой формулы рейтинг игроков из России будет отличаться от рейтинга игроков из Украины или из Литвы? Имею ввиду, что два игрока с одинаковым рейтингом, но с разных стран, при встрече покажут разный уровень. Не обращали внимания?
Закрытое сообщество и в одной, и в другой рейтинговой системе формирует неправильные показатели. Отличие только в том, что будет на выходе.
Если в Эло 2 игрока будут друг с другом играть с переменным успехом, то через тысячу игр их уровень будет на уровне начинающих. Потому что Эло расставляет игроков относительно друг друга.
В случае использования РТТФ после тысячи игр их рейтинг будет на уровне мастеров спорта, потому что проигрывающий теряет в 2 раза меньше, чем выигрывающий. Хотя на деле они могут играть как полные лохи.
А теперь поясню, почему в данной ситуации Эло всё же может показать себя лучше. В Эло прирост рейтинга (заметьте -- я не называю это инфляцией) осуществляется за счёт новичков. Добавился новичок к нашим двум игрокам, они его обыграли -- подняли себе рейтинг. Это не инфляция, потому что в какой-то момент разница между ними и новичком составит такое значение, что рейтинг практически перестанет расти.
Что происходит с РТТФ? А там новичок почти ни на что и не повлияет, если он играет хуже. Он выигрывать не сможет, его рейтинг так и останется на начальном уровне. А "мастера" так и продолжат неконтролируемо расти в рейтинге, просто играя друг с другом. Вот это и есть инфляция, потому что сдерживающих границ не существует.
Видите ли, вы только предполагаете, а я наблюдаю. И статью эту я написал после полугода наблюдений.
У меня есть 3 независимых чата, где бот очень активно используется. В двух из них бот используется для расчёта как соревнований, так и обычных встреч, в третьем только для расчёта соревнований. Разные страны, пересечений очень мало.
Но вот что любопытно, после преодоления порога насыщения (когда рейтинг топовых перестаёт расти) во всех чатах появляется стабильность, игроки держатся примерно на своих уровнях. Т.е. уже можно говорить про отличную работу ранжирования, не так ли?
Но более того. Я ещё иногда перепроверяю спортивные разряды игроков, у кого есть известный мне РТТФ/ТТВ рейтинг: какой разряд им выставил бот и какой разряд у них согласно РТТФ. Вы удивитесь, но в большинстве случае разряды сходятся. :)
Поэтому можно много теоретизировать, но на практике я вижу, что это действительно работает. Главное условие -- чтоб ботом в чате начали активно пользоваться, потому что самый сложный этап в самом начале, когда у всех рейтинг на уровне начального.
Вы же обратили внимание на скриншоты в статье? Это реальные высказывания тех игроков, кто поначалу со мной очень сильно спорил, ругал, плевался на бота, приводил ваши же аргументы... А потом внезапно обнаружили, что всё отлично работает. И что если ты пойдёшь играть с игроком на 100 очков рейтинга выше тебя (аналог 50 в РТТФ), то выиграть его будет очень сложно, равно как и наоборот.
И это не такие любители, как я. Это МС, КМС, перворазрядники. Да, непривычно. Да, иногда раздражает. Да, заставляет выкладываться. Но -- отлично справляется с ранжированием!
Вот что меня удивляет в подобных дискуссиях, это когда профессионалы мне начинают говорить, что очень некорректно сравнивать шахматы с теннисом, но при этом сами спокойно сравнивают теннис с футболом. При этом могут даже про дополнительный состав упомянуть... Как по мне, так шахматы будут гораздо ближе к теннису, чем футбол. Хотя бы потому, что это индивидуальные, а не групповые игры.
Вы мне сейчас напомнили детскую песенку "Жопа есть, а слова нет". :) Что поделать, что "ничьей не может быть в принципе", но на практике она нередко бывает.
Так и представляю, 2 игрока поиграли час времени, получили счёт 5:5, идут в Телеграм регистрировать результат, а бот им такое: "Э не, такого не бывает, давайте ещё дополнительно стол арендуйте и играйте решающий сет".
Да пожалуйста, никто ведь не заставляет играть на рейтинг. Если пришёл играть в пинг-понг, а не в настольный теннис, так и скажи. Действительно, зачем теннис, если пришёл просто мячик попинать. Зачем потеть, если по парку гуляешь.
Но так можно сказать, "зачем я должен выкладываться, если мне не заплатят", или "это какое-то соревнование города, а не международное".
Это всё лирика и к теме рейтинговых систем уже никакого отношения не имеет.
Да-да, возвращаемся к аргументам "почему я должен выкладываться".
Я уже за год наблюдений понял, что турнирная система и рейтинг РТТФ вполне могут расслаблять сильных игроков. Играем до 3 побед? Ну ок, я вроде сильнее, можно не особо напрягаться, 2 сета солью, но в итоге всё равно ведь выиграю.
А в итоге получается, что опытный игрок начинает терять квалификацию не только потому, что не имеет возможности играть с более сильными соперниками, но и потому, что отвыкает выкладываться, даже если играет на рейтинг. И вот рейтинговая система Эло в данном случае является хорошим стимулятором.
А какая мотивация у такого игрока в РТТФ? Что играл, что нет, прироста рейтинга не видно. Да ещё и есть вероятность здорово потерять от какого-нибудь случайного выскочки.
А в Эло твоя победа принесёт тебе хоть немного баллов. Интересен рейтинг? Рискуй. Но при этом выкладывайся.
В РТТФ я такого стимула не вижу.
Ну вот тогда и возникает вопрос, почему в Эло эта предполагаемая деградация прекрасно отобразилась на рейтинге, а в РТТФ этот мастер по-прежнему на недосягаемых высотах? Ах, потому что он не играл со своим уровнем, который бы его на место поставил... Ну так об этом недостатке я и упоминал в статье. ;)
Это дополнительные ограничения, дополнительные условия, рамки. Можно их учитывать, конечно, но хотелось бы всё же больше свободы.
Да и в любом случае, ничья -- это тоже результат. Для равных по силе -- ожидаемый результат, для сильного и слабого -- результат не в пользу сильного. То, что Эло прекрасно умеет считать ничью -- это дополнительный аргумент в сторону именно этой рейтинговой системы.
Ради интереса сейчас посмотрел, сколько за полгода использования бота в нём было зарегистрировано "ничьих": 63 из 4370, 1.4%. Не так уж и мало, чтоб скидывать со счёта.
Про "вкратце" оказалось смешно. Увлёкся. :)
Спасибо за внимание к статье и обстоятельный ответ. Попробую сейчас вкратце дать пояснения по каждому вашему замечанию, чтоб вы видели, что все эти моменты я изучал и анализировал, даже если у вас сложилось обратное впечатление.
Форматы игр, которые я встречал на улице:
Турнирный: играем матчи до 2-3 побед.
Матчевый: играем до 5 побед, потом тренируемся.
Временной: играем до конца арендованного времени.
Вот в последнем варианте ничья -- довольно частый случай, когда встречаются одинаковые соперники. Нередко они даже довольны ничьей, потому что друзья. И последний вариант игры среди уличных игроков встречается чаще всего. Первые два в основном используются теми, кто уже "испорчен турнирами". ;)
Насчёт "сильно отличается" - я бы не был так категоричен. У них одна база и один основной принцип. Отличие только в дополнительном коэффициенте, учитывающем разницу сетов (та-дам, небольшой РТТФ-костыль, который в Эло не нужен, потому что входит в состав самой формулы) и бонусы для победителей турниров. Т.е. принципиальной разницы нет, добавлено немного динамики.
Вот тут вы продемонстрировали один из недостатков формулы РТТФ, который я не упоминал в статье. Если сильный выиграет, он остаётся на месте. Если проиграет, он потеряет рейтинг. В турнирах выбора нет, а вот на улице это может привести к тому, что сильный просто не захочет играть со слабым, потому что победа ему не даст ничего, а поражение приведёт к потере. В итоге те, кто гонятся за рейтингом, попросту не будут рисковать, что приведёт к дискредитации самой идеи любительского рейтинга.
Теперь рассмотрим ваш вариант с перворазрядником и мастером. Согласно Эло, при разнице в 1 разряд вероятность выигрыша составляет 75%. Вот внизу график, разница между разрядами 200 очков.
2 разряда -- это уже 90%.
Так вот, возвращаясь к моему примеру с мастером и 1-разрядником. Согласно графику, из 10 сетов перворазрядник выиграет у мастера только 1. Попробуйте теперь посчитать, сколько нужно провести матчей, чтоб перворазрядник выиграл хотя бы один из них, чтоб продвинуться в рейтинге по РТТФ. А в Эло, как я упоминал, вот этот 1 выигранный сет уже даст перворазряднику прирост.
Хотя нужно быть честным, в Эло тоже добавили определённый костыль, и при разнице больше 400 очков сильный игрок теряет меньше очков, чем полагалось бы строго по формуле -- типа, часть списывается на случайность.
Понимаете, о чём я говорю?
Приведу реальный пример, за которым с интересом наблюдал. Есть мастер спорта с рейтингом 1100 РТТФ. И есть перворазрядник с рейтингом 650 РТТФ. Их обычная статистика игр -- 3:1. Т.е. разница между ними -- 1 разряд, а не 4.
Изначально я импортировал их рейтинг исходя из рейтинга РТТФ. И потом с изумлением наблюдал, как у одного рейтинг постоянно растёт, а у другого постоянно снижается. Пока наконец-то один не поднялся на уровень КМС, а второй так и остался МС, но уже с разумной величиной рейтинга.
По матчам за всё это время упомянутый КМС ни разу у МС не выиграл. Поэтому несмотря на 20 прошедших турниров, он так и остался на уровне 600. А упомянутый МС, несмотря на 50 проведённых турниров, так остался на своём 1100. Т.е. 1-разрядник против МС. В то время как по Эло у нас уже есть КМС, который свою позицию постоянно подтверждает победами над другими игроками.
И это, кстати, не единичный пример, благодаря которому я на практике подтвердил первоначальный вывод, что РТТФ очень плохо считает рейтинг при большой разнице.
Если они играют только между собой, то прироста рейтинга нет. Если 2 игрока стабильно играют в пропорции 1:3, то их растащит на расстояние 200 очков относительно начальных рейтингов и там оставит.
В этом есть минус для маленьких сообществ. Если 3 мастера начнут играть только друг с другом с начальным рейтингом, то их рейтинг так и будет в районе начального. В РТТФ же их рейтинг будет непрерывно расти, что является причиной инфляции.
В Эло тоже может быть инфляция за счёт новичков, у которых начальный рейтинг 1000. Какой-нибудь юниор, обыграв десяток новичков, может разом подняться до 3 разряда. При игре с настоящим третьим разрядом он свой рейтинг отдаст третьеразряднику, а третьеразрядник его отдаст выше и так далее, как круги по воде, хорошо хоть с затуханием.
Но тут ещё многое зависит от того, как считать рейтинг, получаемый с новичков. С одной стороны, он нужен, чтоб сильных игроков поставить на правильное место, с другой стороны, может привести к инфляции. Тонкий момент. Но на практике, наблюдая за двумя активными сообществами, где вовсю используется бот, я не могу сказать, что там есть какая-то очевидная инфляция. Нет, вначале идёт процесс насыщения рейтинга, а потом всё, люди достигают своих позиций и рейтинг больше не растёт (если только человек не начинает действительно лучше играть).
Я не хочу больше спорить на эту тему. Подозреваю, вы не очень часто играли в уличных условиях и склонны переоценивать сложности.
Могу только высказать мнение, что ваши суждения справедливы для сильного и слабого в пределах одного разряда. Там солнце может на что-то повлиять. Но когда между игроками разница в 2 и больше разряда, тут слабому уже попросту сложно как-то воспользоваться преимуществом, потому что для более опытного игрока его потуги будут читаться по одному только звуку удара, по силуэту движения.
Я сейчас говорю не про неудобных противников. И не про противников из разных замкнутых сообществ, в одном из которых рейтинг может быть занижен, потому что играют друг с другом и тянут друг друга вниз. Я говорю про гипотетическую ситуацию, когда у наших мастеров одинаковые соперники и предлагаю размышлять с точки зрения средних чисел, а не с точки зрения исключений.
Заметьте, в этой дискуссии не я первый начал подкалывать оппонента с первого же предложения.
Поверьте, мне нелегко далось решение использовать непривычную (для НТ) рейтинговую систему. Было много дискуссий с гораздо более опытными игроками, чем я. Иногда это напоминало рассуждения про демократию: "Демократия — плохая форма правления, но остальные еще хуже". Вот только в нашем случае, в отличие от альтернатив демократии, есть явно более продуманная формула рейтинговой системы.
В итоге я понял, что как бы я ни дорабатывал формулу, без строгого следования турнирному формату всё равно будет "не то". Всё равно результаты будут отличаться от привычных, при этом и формула у меня будет изменённая, и все её недостатки тоже будут со мной.
Ну, а раз обвинений в криворукости всё равно не избежать, то почему бы в таком случае не расслабиться и не использовать более продуманную в математическом плане формулу?
Полагаю, вы заблуждаетесь. То, что первый способен постоянно играть на максимуме, вовсе не означает, что он не умеет варьировать усилия. А вот второй постоянно на максимуме играть не умеет. В итоге их встреча наверняка завершится победой первого, который сможет доминировать от начала до конца, а второй наверняка где-то да дрогнет, либо по привычке, либо из слабости.
Вот ещё пример для затравочки. Есть два мастера, всегда выигрывающих. Друг с другом не играли. Первый всегда выигрывает со счётом 2:0, второй со счётом 2:1. Кто из них сильнее? ;)
Это вы сейчас серьёзно? Про смену сторон вы не в курсе, что ли?
Действительно, проблема начинается на уровне концепции. Вы ведь даже не поняли, что этот рейтинг никак не может являться "системой для обсчёта мероприятий". :) Мероприятия, турниры и так далее обсчитываются по другим принципам. И победитель турнира далеко не всегда получает больше всех рейтинга, что в РТТФ, что в Эло.
Как и собеседник выше, вы путаете игру на рейтинг и тренировку. Если ты играешь на рейтинг, значит играешь серьёзно, на максимуме, показывая все свои возможности. А если нет, то зачем играешь на рейтинг в таком случае? И если будучи МС, слил несколько сетов третьеразряднику, почему удивляешься, что рейтинг просел?
Я так понимаю, это всё проявления некой деформации у тех, кто привык к турнирным форматам, когда в зачёт идёт только победа. Можно 2 сета ковыряться в носу, а потом слегка напрячься и 3 выиграть.
Но даже если рассматривать с этой стороны, то Эло опять же точнее считает: какой игрок лучше, кто всегда готов играть на максимуме, или тот, кто иногда вынужден отдыхать, сливая сеты? ;)
О, шахматисты тут очень многое могли бы привести в качестве аргумента. И стул непривычный, и доска, и отвлекающий шум в зале... Но вот только они понимают, что когда что-то мешает одному, то оно же мешает и другому. Более того, сильному это иногда даже на руку, за счёт его опыта.
Рассмотреть ваши же примеры с ветром или солнцем. Они мешают обоим игрокам. Но вот сильный может использовать их в свою пользу: сделать накат при попутном ветре или подсечку при встречном, стараться позиционно играть так, чтоб в момент атаки соперник находился против солнца. Да даже сорванный с траектории мячик опытный игрок подхватит легче, чем неопытный. Странно, что вы этого не понимаете.
Мне кажется, вы путаете тренировку и игру на рейтинг (турнир). Никто ведь не заставляет регистрировать для рейтинга все игры. Вот до 5 побед поиграли на рейтинг, а дальше тренировка.
А то встречал таких: "Да я на уровне 1 разряда играю! Я тут с КМС поиграл, чуть его не выиграл, 5:2 итоговый счёт!" Начинаешь с ним играть, а он и на третьеразрядника не тянет. Потому что КМС играл не всерьёз, просто развлекался, привыкнув к тому, что имеет значение только итоговая победа.
И если бы считалось по РТТФ, то да, значение имела бы только итоговая победа. А вот по Эло была бы видна разница и вряд ли КМС так легко отдавал бы сеты.
Согласен, нужно "обыграть", а не "выиграть".
Я в Грузии, мне простительно. А вам отдельно насыплю пропущенных запятых: ",,". ;)
Я с этим согласен, но мне есть, чем дополнить.
Не всегда есть возможность участвовать в турнирах. Особенно в таких турнирах, где будут игроки твоего уровня. В небольших городах, особенно где НТ не очень популярен, с этим вообще может быть проблема.
Что до игры, я сейчас пришёл к такому формату игры: к примеру, договариваемся играть час, после разминки играм до 5 побед на рейтинг, а дальше уже со счётом, но без рейтинга. На рейтинг делаешь всё, что умеешь, особо не экспериментируешь, можешь убивать с подачи -- убиваешь. Это рейтинг и он должен показать реальную разницу.
И если в случае РТТФ здесь бы в финале считалась просто победа (которую сильнейший так или иначе всё равно получит), то в Эло тут уже важен каждый сет, на расслабоне не поиграешь даже с заведомо слабым соперником. По себе замечал -- игра на рейтинг в таком случае мобилизует и заставляет выкладываться гораздо сильнее, чем просто на счёт.
А вот потом уже играем остаток времени просто на счёт, без рейтинга. Появляется возможность "точить" приёмы, экспериментировать с новыми подачами и так далее.
И при игре на рейтинг лично у меня появилось гораздо больше интереса играть с соперниками, оказавшимися слабее. А если совсем слабый, то можно и для левой руки рейтинг покачать, бот левую руку тоже поддерживает. :)
Хорошее замечание. Но увы, пришлось отказаться.
Во-первых, на результат в таком случае сильно влияет порядок игр. Как в РТТФ, так и в Эло. Вот результаты двух игр 1:0, потом 0:1 для обеих рейтинговых систем (начальные данные 1500 Эло (400 РТТФ) против 1400 Эло (350 РТТФ)):
Игра 1:0: 1504 (401.2) - 1396 (349.4)
Игра 0:1: 1497 (399.1) - 1403 (352.6)
А теперь обратный порядок (те же начальные данные 1500 Эло (400 РТТФ) против 1400 Эло (350 РТТФ)):
Игра 0:1: 1494 (398.2) - 1406 (353.6)
Игра 1:0: 1498 (399.3) - 1402 (352.3)
Как видите, порядок игр влияет на конечный результат. Хотя можно было, конечно, попытаться распределить их как можно равномернее... Однако тут вступает в действие второй фактор. Рассмотрим те же игры, но для случая, когда разница между игроками составляет больше 1 разряда (1700 Эло (500 RTTF) и 1400 Эло (350 RTTF)):
Игра 1:0: 1702 (500) - 1398 (350)
Игра 0:1: 1693 (497) - 1407 (356)
И в обратном порядке:
Игра 0:1: 1692 (497) - 1408 (356)
Игра 1:0: 1694 (497) - 1406 (497)
Казалось бы, всё же одинаково? По итогу и там, и там минус? Вот только обратите внимание на выделенное. РТТФ не даёт бонуса за победу при разнице больше 1 разряда, но отнимает за поражение. :) Т.е. при счёте 11:1 итог будет всё равно не в пользу заведомо сильного победителя.
Конечно, можно было бы какие-то дополнительные условия тут ввести, а что если то, а что если это... Но честно, на тот момент меня уже потряхивало от костыльности этой формулы. И вместо изобретения дополнительных костылей я предпочёл переключиться на изучение другой формулы, которая подобные ситуации отрабатывает "из коробочки".
Погодите, а это разве не про ручное изменение говорится? Т.е. организатор переоценил/недооценил новичка, который на турнире показал себя совсем по-другому, и этот же организатор взял и изменил рейтинг задним числом. Разве это не так работает?