Comments 23
Меня кстати удивило, что в мае отмечают мало свадеб.
Это вы пронаблюдали влияние приметы «В мае жениться – всю жизнь маяться» на людей в 21 веке :)
Ну и для более адекватной оценки правильности модели лучше всё-таки полную перекрёстную проверку делать, например K-fold
Беларусь пишется правильно
Во-первых, в тексте статьи упоминается именно в таком контексте как вы указали «Республика Беларусь»
Во-вторых, думаю никто не запрещает мне на картинке употребить другое распространенное в русском языке обозначение Белоруссия.
Очень печально, что это похоже единственное, что Вы вынесли для себя из статьи на почти 30 000 символов.
В любом случае, если я где-то еще проглядел грамматический недочет, то правилом хорошего тона было бы написать это в личные сообщения.
Правилом хорошего тона, является так же корректное написание названия страны. Вы на российском языке можете писать, что угодно, но вот на русском название государства правильно написано на Конституции этого государства, Вы же не станете с этим спорить? И еще правилом хорошего тона является извинение и исправление, которое я почему-то нигде не увидел, как и в принципе чего-то сакрального в 30 000 строк про Hello World линейная регрессия.
(Правда я подправил заглавную букву в слове Республика, ибо ночью глаз замылился)
2. Республика Беларусь (Далее РБ) упоминается 2 раза в тексте в заключительной части. В первом случае как: «Республики Беларусь», что полностью соответствует приложенной Вами фотографии, во втором случае в юмористическом комиксе, как «Белоруссия».
Считаю, оба упоминания уместными. Искренне убежден, что Белоруссия, с точки зрения русской речи такое же применимое в быту название государства как Россия в отношении РФ. Таким образом до сих пор не вижу оснований для обнаруженного где-то Вами ущемления РБ.
3. Текст безусловно является «легким» описанием примера уровня Hello World в области анализа данных, затрагивающий поверхностно вопросы поиска ресурсов открытых данных на русском языке и решения задачи линейной регрессии по отношению к ним.
Перед данной публикацией не ставилось задач научного или технического характера, для этого безусловно есть более сведущие чем я специалисты.
4. Спор теряет конструктивность если у вас есть объективные замечания можете их изложить в личной переписке.
Вообще месяца цикличный и если уж вводить то сразу 12 переменных ((но данных мало) или весна/зима переменная.
One-hot encoding не позволил бы модели уловить, что мы работаем с категориальной переменной, для которой существует отношение расстояния (октябрь и ноябрь удалены друг от друга так же, как май и июнь, а вот май и октябрь находятся на большем расстоянии), пусть и не совсем обычное из-за цикличности.
Думаю, правильнее было бы применить target encoding, закодировав каждый месяц средним значением целевой функции по этому месяцу на тренировочной выборке.
«4 свадьбы и одни похороны» или линейная регрессия для анализа открытых данных правительства Москвы