Pull to refresh
24
0
Send message
Мы пока что в spark только собираем выборку, а для обучения (да и для инференса) используем pandas. Выборки в 10кк семплов pandas способен пережевать. Пробовали скармливать LightGBM spark data frame, но ничего хорошего пока из этого не получилось)
Сейчас как раз в процессе обучение самых разнородных моделей с амбициями составить из них «разнородный» ансамбль! Более того, хотим попилить товары на кластеры по «характеру» продаж и для каждого кластера выбрать свои топ-3 или больше моделей.
LoghtGBM покорил наши расчетливые сердца
С CatBoost возились довольно долго, но заставить работать быстро так и не получилось.
+ у нас категориальная фича была только одна

Что касается отслеживания соцсетей и поисковых запросов — именно над этим мы сейчас и работаем!

Information

Rating
Does not participate
Works in
Registered
Activity