All streams
Search
Write a publication
Pull to refresh
34
0
Евгений Кашин @digitman

Machine Learning

Send message

Интересная идея про анализ кто с кем общается, благо обращений действительно много.
Кстати про классификацию по лицу очень крутая мысль. Недавно как раз была статья по определению сексуальной ориетанции по фото, довольно успешная.
Спасибо за большое количество интересных todo

1)Максимальный урон у орудия и максимальный он в смысле — наибольший среди всех возможных видов снарядов. Уже обсуждали выше, что это не совсем объективно. Но универсального способа для определения самого используемого типа снарядов для всех танков я не придумал. Параметры скоррелированы, но зависимость не линейная, и я решил оставить все параметры в модели.
2)Эта цифра означает, какой разброс снарядов (в метрах) будет через 100м, чем меньше тем лучше. «Т.е. по сути меткость = 1 — разброс», — не совсем так, разброс теоретически может быть больше 1.
3)Я исходил из того соображения, что сохраняются. Другой вопрос, что у каких то танков есть некоторые модули, а у других их в принципе поставить нельзя.
4)Немного, 78кб для 450 танков
Подсвечивать весь бой внизу списка не у каждого терпения хватит.
>>Я почти уверен что большинство (95%+) всех низкоуровневых боев сыграно опытными игроками.
Пожалуй здесь я не правильно сделал выводы, действительно, вряд ли приток новых игроков сейчас такой большой, чтобы так сильно влиять на статистику. А вот положение внизу списка, это да.

Стеклянная пушка, а вот у Т95 наоборот, слишком много брони, только плюс ли это. Однако винрейт у них почти одинаковый 0.509 и 0.503 (правда одна ПТ10, а другая ПТ9).

Да, я не совсем понял ваше пред. сообщение, но теперь понятно, что вы имели ввиду. Я не играл на 10м лвл ПТ, но это объяснение мне кажется логичным. А вот про Е25 наслышан, не зря её вывели из продажи.

Может быть они провели не достаточное количество боёв. Я бы посмотрел на результаты такого эксперимента, проводимого взводом. Интересно, как бы падал винрейт от количества неактивных игроков во взводе (1, 2, 3).

Как раз для статистики по картам и придётся парсить реплеи. Благо один из сервисов по сбору реплеев это уже сделал, можно выбирать фильтр по уровню и типу техники, но не уверен про конкретные танки http://www.vbaddict.net/statistics_maps.php

Как раз недавно вышло видео от WG, в котором они рассказывают, как работает их балансер. И конечно же не слова про «Dynamic battle session matchmaking». Но всё же это коммерческий продукт. Кому интересно вот патент о котором говорит grey_rat http://www.google.com/patents/US8425330
Только среднее количество выстрелов для такого среднего дамага у них будет сильно отличаться
Да уж, у создателей XVM большие возможности по анализу данных.
Интересная визуализация, положение TVP для меня неожиданное.
Да я проверял, и там есть много интересных зависимостей. Но вся таблица здесь не уместилась бы. Ваша интуиция вас не подводит — это значение 0.73. Хоть эти признаки и сильно коррелируют, но в этой игре бывают случаи когда максимальная скорость очень большая, а танк очень медленный (маленькая мощность) и набирает её только с горки. Поэтому я решил не выбрасывать этот признак.
Я думаю это был сарказм. Достаточно вглянуть на блог WG на хабре
На самом деле мне тоже интересно было бы более глубоко разобраться в конкретных танках. Но для этого этого нужно много и много играть на разных танках, а сам я играл не очень много. Также для более глубокого анализа я задумывался о том, чтобы использовать не только открытое API, но и реплеи. Есть сайты, которые агрегируют их, позволяя потом любому скачивать их. Реплей это бинарник, но если поискать, то в нём можно найти json структуру с подробными результатами по бою. Но чтобы обработать такое количество реплеев простого ноутбука уже не хватит.
>>а есть танки, которые имеют смысл только при наличии грамотной(!) поддержки со стороны команды
Согласен, но ведь мы знаем, что такая поддержка бывает в меньше половины боёв. А поэтому когда статистика усредняется, то винрейт на таких танках получается не очень высокий. Также было бы интересно посмотреть на статистику игры одному и игры во взводе по разным танкам, жаль API не предоставляет пока такой возможности.
>>Эмм… а как же разделение на train/test? Вы валидацию модели сделали? И какая аккуратность получилась?
Посмотрите внимательней, конечно я делала кросс валидацию. В статье есть даже скриншот кода этого момента, получилось 0.013 mean absolute error — средняя ошибка 1.3%
>>1. Вы не разобрались в АПИ. Там есть несколько разных апи, самым полным был (режим вроде выпилили?) «Бой до последнего». После него идет Глобалка кажется. Это нужно добавлять в модель.
https://ru.wargaming.net/developers/api_reference/wot/account/tanks/ — вот здесь описание метода, которым я пользовался. Если я правильно понимаю, то API отдаёт сведения о боях всех типов за всё время на аккаунте. А рассматривать статистику по отдельным типам боёв, как вы уже заметили, это совсем другое исследование.
Ваше исследование более узкое, согласен. Чтобы разобраться с кланами надо самому поучаствовать в этом, для того чтобы лучше понимать область исследования. Мне не довелось вот.
А про R — наверняка есть библиотека для многопоточности или асинхронности, с помощью которой можно было бы здорово ускорить загрузку. В один поток выходит и правда очень долго.
Спасибо за замечание, поправил.
>>С учетом механики игры, было бы немного логичнее считать не максимальный урон снарядами, а средний, и не фугасными, а бронебойными или подкалиберными.
Я тоже сначала так подумал, но потом вспомнил про арту, которая в большинстве стреляет только фугасами. Да и есть танки у которых нет бронебойных.
Хмм, интересно, не подумал об этом. А про то что ПТ-САУ будут преобладать на 10 лвле — сейчас попробую построить график
2

Information

Rating
Does not participate
Location
Россия
Works in
Registered
Activity