netcitizen Nov 16 2021 at 16:17

Разбор статей конференции RecSys 2021

21 min

3.9K

ОК corporate blogMachine learning*

+14

Comments 4

pekshechka Nov 17 2021 at 21:17

Кстати а почему авторы A Case Study on Sampling Strategies for Evaluating Neural Sequential Item Recommendation Models не считают, что причина в лоссе?
Разница между BERT4Rec и SASRec (кроме BERT > SA) только в лоссе. Причем интуитивно ожидаемо, что на сходимость/стабильность/ и т д бинарной кросс-энторпии из сасрека количество сэмплов плохо повлиять не может, на вот на софтмакс-лосс из BERT4Rec может. Возможно именно поэтому SASRec оказывается лучше берта при большем количестве сэмплов

pekshechka Nov 17 2021 at 21:20

Авторы пишут, что SASRec uses the BPR loss. Лол, это не так. В бпр сигмоида разницы предсказаний, а в сасреке обычная кросс-энтропия для каждого предсказания отдельно

pekshechka Nov 17 2021 at 21:21

Статьи все больше разочаровывают((

pekshechka Nov 17 2021 at 21:36

Не, я и так люблю авторов статьи про BPR за то, что они назвали свой алгоритм Bayesian из-за байесовского объяснения л2 регуляризации. Но то, что кто-то решил, что они придумали кросс-энтропию - это двойное уважение