Pull to refresh

Comments 9

Хорошая статья, ничего не понятно. Было бы здорово в начале писать какими знаниями надо обладать, чтобы это повторить.
Хорошая статья — все понятно (но прочитал книжку по ML на досуге ;)
Нужно совсем немного знать python (основы pandas, seaborn, sklearn), иметь представление о статистике и машинном обучении.
Исходя из графика видно, что на стоимость больше всего влияет grade – общая субъективная оценка дома риелторской компанией

Но тогда выборка получается нерепрезентативной, в неё надо включать компании, у которых с оценкой как раз не очень.
В исходном датасете представлены данные одной компании, которая каждому дому (объекту) поставила некую оценку.
Не совсем понятно, что вы имеете ввиду под нерепрезентативностью в данном случае.

Что за черные "пятна" за границами "усов" на графиках?

Это «выбросы», т.е. значения которые выходят за расстояние IQR ( 1,5 x (Q3-Q1) ) отмеренное соответственно от Q1 и Q3
Sign up to leave a comment.

Articles