Комментарии 34
стаж от 2 лет, тем самым отметая неопытных молодых водителей
Сейчас многие молодые люди (особенно в Европе) получают права сразу по достижению необходимого возраста, а водить начинают гораздо позже.
в интервал с 8ой по 11 секунду скорость автомобиля резко увеличилась с 20км/ч до 40км/ч, а в интервал с 15ой по 18ую секунды скорость резко упала с 60км/ч до 30км/ч
Похоже на обычную езду от светофора до светофора. За 3 секунды ускориться с 20км/ч до 40км/ч — это слишком лихо?
видно, что пользователи моложе 26 лет чаще других являются виновниками ДТП
Я упустил или вы где-то указали кто чаще берет в аренду автомобили? Или может молодежь просто чаще арендует и, соответственно, чаще являются участниками ДТП?
2. С возрастом водителей все достаточно сложно, нет возможности определить точный стаж вождения, т.к. есть возможность получить права и не водить вообще.
Не прослеживается скачка в количестве поездок более молодых пользователей. В среднем пользователи совершают одинаковое количество поездок.
3. По светофорам: в зависимости от параметров модели ускорения и торможения перед светофорами могут определяться как резкие или нет. Здесь есть момент, сами по себе резкие ускорения и торможения не являются признаком плохого вождения, а вот их количество — да.
Еще интересует момент со страховкой:
почему вашу компанию волнует дтп как таковое, если есть страховка? Это больше должно волновать страховую.
Как здесь обстоит взаимодействие со страховой?
Даже при полном покрытии ремонта автомобиля страховой остается момент с простоем авто и убытками, которые этим вызваны.
Не и еще момент. Для компании которая имеет 1000 автомобилей, банально нет смысла страховать их по рискам ДТП и хищение. Лучше эту половину денег (а в среднем страховая компания получает примерно вдвое больше чем выплачивает) положить в карман и расширять на это бизнес, чем отдать страховщику. А страховать лучше массовые риски, которые внезапно и непрогнозируемо могут затронить весь автопарк — ущерб от стихийного бедствия, от народных волнений и тому подобного.
На самом деле все еще интереснее, никто
Волнение страховой выражаются ростом цен страховки, а это убытки.
Во вторых да, в городе больше аварий и больше разгонов-торможений. И для построения модели вождения конкретного водителя требуется некотрое число поездок. При этом, у водителей которые пользуются сервисом нечасто и ненадолго, будет много резких торможений и разгонов, они не привыкли к машине. А те кто пользуется часто и долго, уже наработали свою статистику аварийности, нет ли смысла просто поощрять их безаварийную езду, скажем часами и милями? А с виновниками ДТП, напротив, проводить работу на тему безаварийного вождения.
2. А вообще очень слабая статистическая работа (по крайней мере описана в статье). С вашими-то данными… Графики непонятные, где они друг на друга наложены.
2. В этой статье обзор того, что используется сейчас на рынке. Наша модель будет описана в следующей статье. Там вы сможете оценить проведенную работу.
Что такое социальный статус? Размер дохода? Как вы его определите?
> активность в социальных сетях
А как вы найдете аккаунт пользователя? Отчество там не указывают, а по имени и фамилии много совпадений. Да и не уверен, что это законно, парсить такую информацию из соцсетей, недавно суд одной компании это запретил.
> информация с камеры в салоне автомобиля
Нафиг такой торшеринг. Камера хотя бы большая и хорошо заметная?
Что такое социальный статус? Размер дохода? Как вы его определите?
Мы это не определяем, эту часть делают операторы каршеринга.
Нафиг такой торшеринг. Камера хотя бы большая и хорошо заметная?
Камеры в салоне премиум автомобилей в каршеринге уже ни для кого не секрет.
Горе статистик:
«Так, что тут у нас, ага данные по возрасту, число целых лет. Замечательно! Но лучше-ка я разобью эту гистограмму не на 10 столбцов на каждые 10 лет — как-то слишком часто получается — а сделаю лучше 8 столбцов на 10 лет возраста. Это 1,25 года на столбец — отлично. Эксель, пересчитай.»
Эксель:
«Так, столбец (30–31,25] — сюда тех, кому строго больше 30 и меньше-равно 31,25. А поскольку исходные данные у меня по целому числу лет, то в столбец попали только те, кому 31.
Дальше столбец (31,25–32,5] — сюда попали, кому целых 32;
столбец (32,5–33,75] — кому 33
столбец (33,75–35,0] — кому 34 и кому 35.»
Поэтому каждый четвёртый столбец, мы видим, примерное вдвое выше чем соседние. Вот скажите честно, авторы, вам глаз ничего не режет?! График 5 тоже доставляет. Видна рука мастера. Промежуточные низенькие пики говорят, что приём оказался настолько удачен, что его применяли более одного раза.
Больше вопросов к «исследованию» не имею.
Помимо этого графики использовались только для наглядности
Соглашусь, безграмотность удалось показать весьма наглядно.
Всплески в 2 раза каждые 4 года вызывают много вопросов. Откуда?
Бум рождаемости каждые 4 года? Выбор вашего сервиса по гороскопу китайскому зодиаку пользователя? (было бы прикольно, если бы стихии в нём повторялись каждые 4 года, но нет) Скидки для людей определённого возраста? Увеличение выдачи прав каждые 4 года?
Я не нашёл никакого объяснения всплескам.
Вы не могли бы перестроить гистограммы с интервалом 10 столбцов на 10 лет?
Дополнительно, хотелось бы посмотреть на распределение вероятности ДТП в зависимости от возраста (по X — возраст, по Y — соотношение "число ДТП/число пользователей" для этого возраста).
Один граф сказал: «Все грамотные исследования похожи друг на друга, каждое неграмотное неграмотно по-своему».
UPD.: График 5 показывает, что ваша ошибка не только в отображении данных. Сложный спектр пиков показывает, что неправильно квантованные данные «пошли в дело» и участвуют в расчётах.
Меня больше удивляет не ошибки, а то, что они для вас не очевидны, и вас ничего не смущает в графиках!
Считаем возраст в долях в зависимости от месяца. Тогда дельта равна 1/12 = 0.8(3). Достаточно округлить число до 0.83, забыв про период, и вот уже 6*0.83 < 0.5 и 12*0.83 < 1. Дальше хуже. Где-то грубо округлили, где-то взяли другой интервал, перемножили данные и конечный результат «поплыл». А может быть, вы несколько баз данных с разной точностью используете…
Хорошо бы еще оси на графиках подписать и названия над диаграммами убрать. Вы их все равно обозначаете снизу.
Оптимальная модель она одна, их не может быть несколько.
Строго говоря, может быть несколько разных моделей, но одинаково высоко оцениваемых. Но вы правы в том, что "максимально оптимальной" говорить нельзя.
Но.
Кажется, значение слова "оптимальный" уже уплыло от "самый лучший" к просто "хороший". Субъективно, во втором значении оно уже встречается в разы чаще ("самый оптимальный", брр...). Скоро надо будет обновлять статьи в толковых словарях.
Как устроен скоринг в индустрии каршеринга. Часть 1. Обзор популярных инструментов на реальных данных