Комментарии 4
И каков ответ на вопрос — выживет/не выживет?
74% о чем говорят?
Кроме того, «средний возраст» человека на Титанике… лучше, пожалуй, NaN отбрасывать.
Пол мужской/женский 10 и 01, далее 1 и 0, видимо, опечатка.
74% о чем говорят?
Кроме того, «средний возраст» человека на Титанике… лучше, пожалуй, NaN отбрасывать.
Пол мужской/женский 10 и 01, далее 1 и 0, видимо, опечатка.
0
И каков ответ на вопрос — выживет/не выживет?
74% о чем говорят?
Когда Вы составляете прогноз методом predict (gbc_predict = gbc.predict(X_test)), то в моем случае он записывается в переменную gbc_predict, которая хранит в себе результат (выжил-не выжил) для каждого пассажира. Можете протестировать код и вывести данные gbc_predict, вы увидите набор единиц и нулей. Первая цифра скажет: выжил ли первый пассажир? Вторая скажет: выжил ли второй? и так далее…
74% говорит о том, что 74% нашего прогноза совпали с реальными результатами. И лишь 26% оказались не верны. Я надеюсь, что разъяснил.
Пол мужской/женский 10 и 01, далее 1 и 0, видимо, опечатка.
Да, корректней было бы написать 1 и 0. Спасибо за внимательность.
0
Намного лучше взять свои данные и попрактиковаться в получении из них каких-то инсайтов или реальной пользы. Проявить фантазию несложно! Я когда-то решил поанализировать текст тикетов в багтрекере, и вот уже 4 года работает решение по автоматическому распределению ошибок по разработчикам в команде :)
+1
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Твой первый шаг в Data Science. Титаник