Comments / Profile of RHendrik / Habr

User

Python уже не торт? Как и почему меняются приоритеты разработчиков

Статья кликбейтная похоже, я как начинающий MLщик не очень представляю как можно обойтись без pandas, sklearn и тд, в работе с данными, они годами развивались и адаптировались под реальные задачи ML. Ещё для подобных задач используют язык R, но он больше в академической среде популярен(а именно в медицине).

Линейная регрессия, встряска рейтинга и первое место. Часть 1: Ёлочка, живи

RHendrik Jan 28 at 05:51

Я правильно понимаю это скорее MVP и проверка гипотезы чем полноценный проект? Потому что тут нет обработки данных, нет очистки и тд, а сразу переходите к обучению через логистическую регрессию. Ещё момент: как по мне лучше в разделе "Визуализация данных и анализ" показать матрицу корреляций чем несколько графиков по отдельности так будет выглядеть нагляднее, не обязательно все признаки (тогда наверное эта матрица будет слишком большая и не читаемая), можно 3-4 главных как у вас.

Компрессор для данных или как я написал свой первый custom transformer

RHendrik Jan 27 at 15:17

Спасибо за статью благодаря ей обратил внимание проблему OOD в ML и методы борьбы с ним. Идея интересная, но как по мне это больше заплатка или если по другому выразиться мы маскируем данные или подгоняем под себя, не уверен что это правильный подход к решению выбросов и аномалий.