Search
Write a publication
Pull to refresh
0
0
Send message

Не силен в R. Но для чего здесь этот костыль в виде R, если по сути вся "внутрянка" от Python?

Те кто сидят на семерке, сделали осознанный выбор. И как правило живут под девизом лишь бы работало и лишь бы работал специфичный софт, который уже был установлен. Какой смысл искать какие-то обновления, если вы согласились жить под этим девизом? У меня дома лежит ноутбук с неудачной вистой. С точки зрения перспектив это полный 0, но все что на нем установлено, работает и сейчас.

Беспокоитесь о безопасности, тогда обновляйтесь.

Поэтому проценты за просрочку платежа в договоре ставят по более высокой ставке нежели ставка рефинансирования. Это нормальная бизнес-практика.

Я все цело согласен. Мне не понятен глубокий посыл автора статьи, в котором она готовит нас к открытию истины "вселенского масштаба". И вот ты уже готовый погрузиться в масштабное исследование начинаешь читать... И тут возникает ряд вопросов 1) Что это такое, что я только что прочитал? 2) Как автор на примере исследования одного единственного датасета собирается дать ответ на поставленный вопрос? 3) Почему именно этот датасет, что в нем такого особенного? Это датасет на все случаи жизни?!?! Автор даже особо не исследует его в статье. 4) Почему именно LGBM и только LGBM? Складывается стойкое впечатление, что автор не искушен в вопросе понимания и примения моделей применительно к задаче.

Странное исследование, странные выводы.

Бустинговые модели на деревьях на мой взгляд не то, что следует использовать для поставленной задачи. И полученный результат тому подтверждение. Здесь исследование показывает способны ли бустинговые модели на деревьях показать тот же результат с уменьшенными в 4 раза данными. И очевидный ответ да, поскольку хорошо известна способность таких моделей подгоняться под исходные данные.

Сколько же достаточно строк, 20000, 10000 или еще сколько? Ответа статья не даёт.

Как лихо вы процесс ценообразования, который в реальности зависит от числа аргументов стремящегося к бесконечности, загнали в рамки функции с ~30 аргументами. Крайне проблематично предсказывать что-либо, в основе чего лежат недетерминированные процессы. Предсказательная способность такой модели, как бы лихо вы её не подогнали под исторические данные ничтожна.

Представьте человека, который приезжает на ТО для своей машины из года в год (в августе), потому что все это время он мало ездит и срок ТО наступает по годичному временном интервалу. Вот он и в 2023ем приехал в августе. Вопрос, когда он приедет в 2024ом году?

Information

Rating
Does not participate
Registered
Activity