Pull to refresh

Comments 24


Что-то у Вас не сходится… Какие-то толстые карлики или дети…
Это в дюймах и фунтах. Я там дальше перевёл в см и кг :)
Да, там дальше есть про это. Просмотрел, т. к. дальше уже в метрической системе. Но выглядит всё равно напрягающе. :)
Ох уж эти «не такие как все»…
Я вот только не поняла, зачем для вычисления простейшей корреляции «вес-рост» использовать машинное обучение.
В наше время без этого никак
UFO just landed and posted this here
В наше время без этого никак


Точн :D

Я вот только не поняла, зачем для вычисления простейшей корреляции «вес-рост» использовать машинное обучение.


Ради эскперимента а-ля «Посмотреть, что будет»

Что-то никак не могу въехать в логику попытки предсказывать вес по росту на таких данных, так как вес помимо роста, зависит от множества других факторов, и по сути результат будет просто усредненный по выборке, для данного пола и роста. С таким же успехом можно курс доллара по прогнозу погоды предсказывать.
Если от нефиг делать — то интереснее было бы рассмотреть корреляцию с ИМТ

Да, данных нехватает. Об этом написал в начале
Я согласен, что эта модель не идеальная от слова совсем
Тут я решил показать результат и провести опрос: «Получится ли угадать по этим данным хоть немного?»
Обожаю смотреть на таблицы с оверхреноллионом знаков после запятой и рандомные гистограммы вместо красивых графиков.

Интересный у вас подход к выбору модели и её обучения: ну… к-средних где-то там используется для регрессии, поэтому используем его… с какими-то рандомными параметрами обучения.

И не забываем про гениальные результаты: много рандомных точек (без доверительных окрестностей!!!) на плоскости, зачем-то соединённых линиями (чтобы хоть какой-то график был). И 1/3 угаданных весов.

Ради интереса конечно круто, но я бы улучшил это всё 1)ядерной оценкой с какими-нибудь 2)усами или интервалами, 3)обосновал выбор модели или хотя бы построил несколько моделей, 4)построил прямую/дугу регрессии с доверительными областями вместо двух рандомных ломанных и 5) убрал бы бесполезные первые 10 строк датасета.
Согласен с вами. Статью можно сделать в разу лучше по всем пяти пунктам
С знаками после запятой разобрались. Они больше не виднеются на горизонте :)
Спасибо!

Средняя женщина какая-то тяжеловатая выходит

Да, я тоже заметил :)
Хотя в жизни, по субъективной оценке — это не так)

Не стоит доверять этому анализу на 146%
Он очень общий и далеко не самый точный
Просто ДатаСет показался мне интересным, решил поделиться
Распределение больше похоже на логистическое (ну так на глаз). Посчитайте критерий Колмогорова, заодно научитесь:)
Сохранил в заметку) Научусь) Спасибо :)

То, что описано в посте — не таинственное машинное обучение, а самая что ни на есть мужицкая Математическая Статистика из четвёртого семестра тех. вуза ;)


Непонятно, зачем в самом конце статьи начинать тыкать пальцем в небо и что-то подгонять с k=1,3,5,..., когда можно использовать какой-нибудь крутой алгоритм аппроксимации функции (из курса Численных Методов третьего семестра) с потенциально наименьшей ошибкой. А если предположить, что средние вес и рост на нашей отрезке зависят линейно, то использовать линейную регрессию, приводя функцию к прямой.


Датасет наверное либо старый на несколько десятилетий, либо про подростков — часто вижу вокруг себя людей ростом 185-190, но по графику, мои наблюдения крайне маловероятны.

Четвертого? Это? Но это же просто линейная регрессия первой степени. Ее можно по линейке построить!

Да, вы оба правы)
Можно было бы сделать анализ в разы глубже
Мне интереснее было посмотреть на результат работы KNN, как, на мой взгляд, самой простой модели МО
Ставь лайк, если попал в 99.7% интервал
а автор хитрец!
Почему не 100%?
Ну это уже лайковымогание)
А так шанс не попасть присутствует)
Это и так лайковыпрашивание в «лучших» традициях «одноклассников»
Ну это стёб был) Конечно норм чувак не будет на такое вестись)
У вас криво построена панель из 4 распределений по росту и весу. Ось показана только для двух нижних, но у двух верних они другие. В противном случае медиана по росту у мужчин и женщин одинакова в районе 160 см а вес у медианного мужчины что-то около 60 кг и он легче медианной женщины. В целом по итогам вся модель укладывается в формулу для реферата по физкультуре в восьмом классе: вес[кг]=рост[см] -100 (110 для женщин), но тогда вместо машинлернинга достаточно однострочника в матплотлиб чтоб построить один график.
Sign up to leave a comment.

Articles