Потестировали решение. Есть минус - отображаются пустые столбцы, которые мы не заполняем. Вопрос, это как то убирается, или у автора такая же проблема?
Например, у меня есть три запасных столбца, и если я выберу только один атрибут в фильтре, на таблице будут видны три столбца: один заполнен, а два пустые с названиями. Нам бы не хотелось видеть эти два пустых столбца.
Появилась мысль корректировки модели трансформации классов:
1. Построить две независимые модели по treatment и control
2. Сделать предсказания из treatment в control и наоборот
3. Посчитать остатки в treatment и control
4. Объединить treatment и control, целевая переменная остатки из условия (Yt-Pc) & (Pt-Yc) будет принадлежать отрезку [-1,+1]
5. К целевой переменной прибавить 1 и поделить на 2
6. На этом построить новую модель uplift
Таки зачем переходить с data lake на lakehouse? Этот вопрос не раскрыт.
Потестировали решение. Есть минус - отображаются пустые столбцы, которые мы не заполняем. Вопрос, это как то убирается, или у автора такая же проблема?
Например, у меня есть три запасных столбца, и если я выберу только один атрибут в фильтре, на таблице будут видны три столбца: один заполнен, а два пустые с названиями. Нам бы не хотелось видеть эти два пустых столбца.
откуда эта инфо в запросе? 20220104 AS _partcol. Как то параллелько читать партиции и записывать в таблицу пробовали?
Отличная статья. А как сделаны плашки "настройки таблицы" и "фильтры"?
2. Для данных control = Прогноз модели treatment — Y наблюдаемое
1. Построить две независимые модели по treatment и control
2. Сделать предсказания из treatment в control и наоборот
3. Посчитать остатки в treatment и control
4. Объединить treatment и control, целевая переменная остатки из условия (Yt-Pc) & (Pt-Yc) будет принадлежать отрезку [-1,+1]
5. К целевой переменной прибавить 1 и поделить на 2
6. На этом построить новую модель uplift
Такое кто-то делает?