Как стать автором
Поиск
Написать публикацию
Обновить

Софтмакс Гумбеля: как устроен и для каких нейронных сетей полезен

Уровень сложностиСложный
Время на прочтение6 мин
Количество просмотров5.6K
Всего голосов 21: ↑20 и ↓1+26
Комментарии4

Комментарии 4

Забавное совпадение. Вникаю в моделирование дискретного выбора, загуглил (надеюсь, слово "загуглил" в Яндексе не считается матерным) распределение Гумбеля. Вижу ссылку на статью на Хабре. "Ну какое-нибудь старье" - подумал я. А тут на тебе - 1 час с момента публикации.

Совпадение?.. Не думаю :)

Что лучше для дискретизации тензора - gumbel softmax или VQVAE?

Про решение проблемы вычисления градиентов: есть вот такая статья, где к распределению вероятностей, зашумленному Гумбелем, применяют SoftArgmax, т.е. Softmax + вычисление мат-ожидания.

Кажется довольно простым способом организовать честное(?) дифференцируемое сэмплирование.

Это не везде применимо: в RLной аналогии твоя идея предполагает некие soft-actions - псево-действия, полученные усреднением настоящих действий с весами.
Для нейронок и градиентов - это норм, но в среду ты такое действие отдать не можешь - нужно выбрать настоящее.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий