All streams
Search
Write a publication
Pull to refresh
5
0
Николай Лысенко @wandering_through_concept

Machine Learning Engineer в «Яндекс.Маркете»

Send message

Софтмакс Гумбеля: как устроен и для каких нейронных сетей полезен

Level of difficultyHard
Reading time6 min
Views16K

Всем привет! Меня зовут Николай Лысенко, я занимаюсь рекомендательными системами в Яндекс Маркете. Сегодня хочу затронуть интересную тему: что делать, если в графе вычислений (aka нейронная сеть) возникает дискретное место, через которое не проходит градиент. Как многие знают, для решения этой проблемы есть такие методы, как REINFORCE и софтмакс Гумбеля (Gumbel-Softmax trick). О последнем и пойдёт речь.

Хотя про софтмакс Гумбеля уже много написано, ценность этой статьи, что вам не придётся ничего искать в интернете и не потребуется делать выкладки на бумаге. Я постарался собрать всю нужную информацию и расписать все промежуточные вычисления.

Читать далее

Information

Rating
Does not participate
Registered
Activity