Ну все-таки совсем новичкам будет сложно усваивать формулы, мелькающие на слайдах, как само собой разумеющееся… Но посмотреть да, на этот курс тоже стоит, тем более, что он бесплатный, в отличии от специализации
Я извиняюсь за нубский вопрос, но можно момент с аппроксимацией модуля cosh(ln) немного подробней раскрыть? Я тут просто попробовал нарисовать такую ф-ию в wolframalpha, и получилось что-то совсем не похожее на модуль =(
Расскажи плз как ты валидировался на 2м уровне, если на 1м уровне у тебя были модели по разным числам фолдов? Я понимаю, когда на 1м 10 фолдов для всех моделей и дальше аналогично на 2м уровне.
Непонятно как при такой схеме избежать оверфиттинга на 2м уровне.
В моей картинке мира если на 1м уровне одно разбиение по фолдам, а на 2м другое — то гарантированно для test-CV будет использоваться часть train-CV…
Отлично написано и про Allstate соревнование, и про разницу в machine learning / data science для индустрии, академической науки и «спорта»!
А область пересечения всех трех областей намеренно оставили такой маленькой или это случайно получилось? Что сейчас, на Ваш взгляд, есть бщее в machine learning для науки, индустрии и соревновательных платформ?
Добавлю, что в индустрии часто есть ограничения на сложность и размер модели. В частности, приходилось делать несколько machine learning проектов для embedded / мобильных платформ c очень жёсткими ограничениями для итоговой модели (вычисления на микроконтроллере без floating point и объемом памяти для модели в несколько десятков kB).
Kaggle: Allstate Claims Severity