Pull to refresh
1
0
Send message

Статья кликбейтная похоже, я как начинающий MLщик не очень представляю как можно обойтись без pandas, sklearn и тд, в работе с данными, они годами развивались и адаптировались под реальные задачи ML. Ещё для подобных задач используют язык R, но он больше в академической среде популярен(а именно в медицине).

Я правильно понимаю это скорее MVP и проверка гипотезы чем полноценный проект? Потому что тут нет обработки данных, нет очистки и тд, а сразу переходите к обучению через логистическую регрессию. Ещё момент: как по мне лучше в разделе "Визуализация данных и анализ" показать матрицу корреляций чем несколько графиков по отдельности так будет выглядеть нагляднее, не обязательно все признаки (тогда наверное эта матрица будет слишком большая и не читаемая), можно 3-4 главных как у вас.

Спасибо за статью благодаря ей обратил внимание проблему OOD в ML и методы борьбы с ним. Идея интересная, но как по мне это больше заплатка или если по другому выразиться мы маскируем данные или подгоняем под себя, не уверен что это правильный подход к решению выбросов и аномалий.

Information

Rating
Does not participate
Registered
Activity