Интересная идея про анализ кто с кем общается, благо обращений действительно много.
Кстати про классификацию по лицу очень крутая мысль. Недавно как раз была статья по определению сексуальной ориетанции по фото, довольно успешная.
Спасибо за большое количество интересных todo
1)Максимальный урон у орудия и максимальный он в смысле — наибольший среди всех возможных видов снарядов. Уже обсуждали выше, что это не совсем объективно. Но универсального способа для определения самого используемого типа снарядов для всех танков я не придумал. Параметры скоррелированы, но зависимость не линейная, и я решил оставить все параметры в модели.
2)Эта цифра означает, какой разброс снарядов (в метрах) будет через 100м, чем меньше тем лучше. «Т.е. по сути меткость = 1 — разброс», — не совсем так, разброс теоретически может быть больше 1.
3)Я исходил из того соображения, что сохраняются. Другой вопрос, что у каких то танков есть некоторые модули, а у других их в принципе поставить нельзя.
4)Немного, 78кб для 450 танков
>>Я почти уверен что большинство (95%+) всех низкоуровневых боев сыграно опытными игроками.
Пожалуй здесь я не правильно сделал выводы, действительно, вряд ли приток новых игроков сейчас такой большой, чтобы так сильно влиять на статистику. А вот положение внизу списка, это да.
Стеклянная пушка, а вот у Т95 наоборот, слишком много брони, только плюс ли это. Однако винрейт у них почти одинаковый 0.509 и 0.503 (правда одна ПТ10, а другая ПТ9).
Да, я не совсем понял ваше пред. сообщение, но теперь понятно, что вы имели ввиду. Я не играл на 10м лвл ПТ, но это объяснение мне кажется логичным. А вот про Е25 наслышан, не зря её вывели из продажи.
Может быть они провели не достаточное количество боёв. Я бы посмотрел на результаты такого эксперимента, проводимого взводом. Интересно, как бы падал винрейт от количества неактивных игроков во взводе (1, 2, 3).
Как раз для статистики по картам и придётся парсить реплеи. Благо один из сервисов по сбору реплеев это уже сделал, можно выбирать фильтр по уровню и типу техники, но не уверен про конкретные танки http://www.vbaddict.net/statistics_maps.php
Как раз недавно вышло видео от WG, в котором они рассказывают, как работает их балансер. И конечно же не слова про «Dynamic battle session matchmaking». Но всё же это коммерческий продукт. Кому интересно вот патент о котором говорит grey_rat http://www.google.com/patents/US8425330
Да я проверял, и там есть много интересных зависимостей. Но вся таблица здесь не уместилась бы. Ваша интуиция вас не подводит — это значение 0.73. Хоть эти признаки и сильно коррелируют, но в этой игре бывают случаи когда максимальная скорость очень большая, а танк очень медленный (маленькая мощность) и набирает её только с горки. Поэтому я решил не выбрасывать этот признак.
На самом деле мне тоже интересно было бы более глубоко разобраться в конкретных танках. Но для этого этого нужно много и много играть на разных танках, а сам я играл не очень много. Также для более глубокого анализа я задумывался о том, чтобы использовать не только открытое API, но и реплеи. Есть сайты, которые агрегируют их, позволяя потом любому скачивать их. Реплей это бинарник, но если поискать, то в нём можно найти json структуру с подробными результатами по бою. Но чтобы обработать такое количество реплеев простого ноутбука уже не хватит.
>>а есть танки, которые имеют смысл только при наличии грамотной(!) поддержки со стороны команды
Согласен, но ведь мы знаем, что такая поддержка бывает в меньше половины боёв. А поэтому когда статистика усредняется, то винрейт на таких танках получается не очень высокий. Также было бы интересно посмотреть на статистику игры одному и игры во взводе по разным танкам, жаль API не предоставляет пока такой возможности.
>>Эмм… а как же разделение на train/test? Вы валидацию модели сделали? И какая аккуратность получилась?
Посмотрите внимательней, конечно я делала кросс валидацию. В статье есть даже скриншот кода этого момента, получилось 0.013 mean absolute error — средняя ошибка 1.3%
>>1. Вы не разобрались в АПИ. Там есть несколько разных апи, самым полным был (режим вроде выпилили?) «Бой до последнего». После него идет Глобалка кажется. Это нужно добавлять в модель.
https://ru.wargaming.net/developers/api_reference/wot/account/tanks/ — вот здесь описание метода, которым я пользовался. Если я правильно понимаю, то API отдаёт сведения о боях всех типов за всё время на аккаунте. А рассматривать статистику по отдельным типам боёв, как вы уже заметили, это совсем другое исследование.
Ваше исследование более узкое, согласен. Чтобы разобраться с кланами надо самому поучаствовать в этом, для того чтобы лучше понимать область исследования. Мне не довелось вот.
А про R — наверняка есть библиотека для многопоточности или асинхронности, с помощью которой можно было бы здорово ускорить загрузку. В один поток выходит и правда очень долго.
>>С учетом механики игры, было бы немного логичнее считать не максимальный урон снарядами, а средний, и не фугасными, а бронебойными или подкалиберными.
Я тоже сначала так подумал, но потом вспомнил про арту, которая в большинстве стреляет только фугасами. Да и есть танки у которых нет бронебойных.
Интересная идея про анализ кто с кем общается, благо обращений действительно много.
Кстати про классификацию по лицу очень крутая мысль. Недавно как раз была статья по определению сексуальной ориетанции по фото, довольно успешная.
Спасибо за большое количество интересных todo
2)Эта цифра означает, какой разброс снарядов (в метрах) будет через 100м, чем меньше тем лучше. «Т.е. по сути меткость = 1 — разброс», — не совсем так, разброс теоретически может быть больше 1.
3)Я исходил из того соображения, что сохраняются. Другой вопрос, что у каких то танков есть некоторые модули, а у других их в принципе поставить нельзя.
4)Немного, 78кб для 450 танков
Пожалуй здесь я не правильно сделал выводы, действительно, вряд ли приток новых игроков сейчас такой большой, чтобы так сильно влиять на статистику. А вот положение внизу списка, это да.
Стеклянная пушка, а вот у Т95 наоборот, слишком много брони, только плюс ли это. Однако винрейт у них почти одинаковый 0.509 и 0.503 (правда одна ПТ10, а другая ПТ9).
Да, я не совсем понял ваше пред. сообщение, но теперь понятно, что вы имели ввиду. Я не играл на 10м лвл ПТ, но это объяснение мне кажется логичным. А вот про Е25 наслышан, не зря её вывели из продажи.
Может быть они провели не достаточное количество боёв. Я бы посмотрел на результаты такого эксперимента, проводимого взводом. Интересно, как бы падал винрейт от количества неактивных игроков во взводе (1, 2, 3).
Как раз для статистики по картам и придётся парсить реплеи. Благо один из сервисов по сбору реплеев это уже сделал, можно выбирать фильтр по уровню и типу техники, но не уверен про конкретные танки http://www.vbaddict.net/statistics_maps.php
Интересная визуализация, положение TVP для меня неожиданное.
>>а есть танки, которые имеют смысл только при наличии грамотной(!) поддержки со стороны команды
Согласен, но ведь мы знаем, что такая поддержка бывает в меньше половины боёв. А поэтому когда статистика усредняется, то винрейт на таких танках получается не очень высокий. Также было бы интересно посмотреть на статистику игры одному и игры во взводе по разным танкам, жаль API не предоставляет пока такой возможности.
Посмотрите внимательней, конечно я делала кросс валидацию. В статье есть даже скриншот кода этого момента, получилось 0.013 mean absolute error — средняя ошибка 1.3%
>>1. Вы не разобрались в АПИ. Там есть несколько разных апи, самым полным был (режим вроде выпилили?) «Бой до последнего». После него идет Глобалка кажется. Это нужно добавлять в модель.
https://ru.wargaming.net/developers/api_reference/wot/account/tanks/ — вот здесь описание метода, которым я пользовался. Если я правильно понимаю, то API отдаёт сведения о боях всех типов за всё время на аккаунте. А рассматривать статистику по отдельным типам боёв, как вы уже заметили, это совсем другое исследование.
Ваше исследование более узкое, согласен. Чтобы разобраться с кланами надо самому поучаствовать в этом, для того чтобы лучше понимать область исследования. Мне не довелось вот.
А про R — наверняка есть библиотека для многопоточности или асинхронности, с помощью которой можно было бы здорово ускорить загрузку. В один поток выходит и правда очень долго.
Я тоже сначала так подумал, но потом вспомнил про арту, которая в большинстве стреляет только фугасами. Да и есть танки у которых нет бронебойных.