Комментарии / Профиль iphysic / Хабр

Михаил Сурцуков @iphysic

Пользователь

ПрофильСтатьи8ПостыНовостиКомментарии16

Как устроен робот-доставщик Яндекса: от восприятия до планирования движения

iphysic 29 сен 2024 в 20:13

Молодец, Тая! :)

Посмотреть

Автоэнкодеры в Keras, Часть 5: GAN(Generative Adversarial Networks) и tensorflow

iphysic 18 апр 2019 в 13:20

по отдельности*

Посмотреть

Автоэнкодеры в Keras, Часть 5: GAN(Generative Adversarial Networks) и tensorflow

iphysic 18 апр 2019 в 12:37

Он слишком сильно привязан к генератору, и по факту умеет только его сэмплы от настоящих отличать, да и обучался на довольно странном лосе. Чем то, думается, похоже по природе на adversarial examples, когда незначительные изменения во входе, могут сильно влиять на выход в нужную сторону. Впрочем первые свертки вполне могут выучивать что-то полезное, но это не точно.

Посмотреть

Автоэнкодеры в Keras, Часть 5: GAN(Generative Adversarial Networks) и tensorflow

iphysic 18 апр 2019 в 10:43

На самом деле в Керасе всего хватает. И можно было бы несколько исхитриться и не приплетать сюда tensorflow, просто это было бы менее удобно, например не получилось бы использовать .fit() у модели, так как у моделей различные лоссы и обучаются они поддельности.

Нужно, чтобы модели обучались совместно, и чтобы дискриминатор не слишком обыгрывал генератор (тогда его градиенты уходят в ноль, ибо сигмоида). Эта проблема отчасти решается в Wasserstein GAN. В идеале было бы наоборот обучать генератор каждый раз до сходимости при шаге дискриминатора, но это не реально.

Посмотреть

Автоэнкодеры в Keras, Часть 5: GAN(Generative Adversarial Networks) и tensorflow

iphysic 18 апр 2019 в 10:31

Сначала по второму вопросу. Дискриминатор нужен только чтобы обучать генератор. Без него, генератор бы не мог научиться генерировать сэмплы. Когда генератор обучен, то дискриминатор уже не нужен. Стоит также отметить, что дискриминатор без генератора бесполезен, то есть мы не можем его обучить, а потом использовать для какой-нибудь другой задачи.

По первому вопросу. Мы можем не передавать лейблы в дискриминатор, но он тогда не будет использовать всю доступную информацию, а значит будет тяжелее учиться, что в свою очередь будет влиять на качество градиентов передаваемых в генератор, и он тоже будет хуже учиться.

Посмотреть

Приглашаем на Sberbank Data Science Day 11 ноября

iphysic 11 ноя 2017 в 15:42

Вот сижу на конфе, и от этого токсично зеленого цвета льющегося отовсюду глаза вытекают.

Посмотреть

Автоэнкодеры в Keras, часть 6: VAE + GAN

iphysic 6 авг 2017 в 19:33

Рад, что вам было интересно!

Можно добавлять, конечно, и я пробовал делать, как вы предлагаете. Мне тоже казалось более рационально добавлять в конце, но работало так похуже, поэтому оставил ближе к началу.

Посмотреть

Автоэнкодеры в Keras, часть 6: VAE + GAN

iphysic 2 июл 2017 в 18:47

Упс! Спасибо!

Посмотреть

Автоэнкодеры в Keras, Часть 3: Вариационные автоэнкодеры (VAE)

iphysic 28 июн 2017 в 21:53

Вот это да! Спасибо!

Посмотреть

Автоэнкодеры в Keras, Часть 1: Введение

iphysic 27 июн 2017 в 20:28

До конца недели все будут!

Посмотреть

Автоэнкодеры в Keras, Часть 1: Введение

iphysic 26 июн 2017 в 21:51

Энкодер восстанавливает вход на выходе, это не задача классификации. А «y» тут вообще не нужны нигде (до conditional моделей), в «у» просто лейблы цифр лежат.

Посмотреть

Автоэнкодеры в Keras, Часть 4: Conditional VAE

iphysic 26 июн 2017 в 17:27

По поводу дропоута, возможно лосс на тесте он бы и не уменьшил, не проверял, если честно. Но во всех статьях, что видел, его используют, так что я просто даже не пробовал его убирать)

А вот по поводу кодов не могу согласиться, когда входная размерность 2, то при размерности кодов, скажем, 100, автоэнкодер бы без проблем выучил тождественную функцию и толку бы от него не было (там же не вае, регуляризации на код никакой нету). Даже при двух это теоритически возможно)

За статью огромное спасибо, прочитаю в ближайшее время!

Посмотреть

Автоэнкодеры в Keras, Часть 4: Conditional VAE

iphysic 26 июн 2017 в 15:29

По поводу дропаута: ну сам по себе он нужен не только для регуляризации, он еще и вынуждает активации в слоях быть более-менее независимыми, например, чтобы одни активация не исправляли другие, а также чтобы следующий слой не слишком полагался на активации конкретных нейронов ниже. Так поидее слои выучиваются более равномерно и больше нелинейностей используется. Я бы сказал, что тут больше претензия к батч-нормализации: по последним данным она куда лучше работает перед активацией, а не после (опять же из-за этого больше нелинейностей в слое появляется).

По поводу одномерности кода: во второй статье было про то, что автоэнкодер выучивает k-мерное определяющее многообразие, где k — размерность кода. В данном случае определяющее многообразие искусственно одномерное, поэтому и код одномерный, больше было бы уже переобучение. На том примере показывается именно то, что в случае без лейблов автоэнкодер вынужден продолжать одну связную область в другую, а в случае, когда есть лейблы он может выучить их по-отдельности.

Могу раскрыть. В VAE + GAN буду избавлять именно от размытостей.

Спасибо!

Посмотреть

Автоэнкодеры в Keras, Часть 1: Введение

iphysic 24 июн 2017 в 22:54

Рад, что вы так считаете! Буду стараться дальше.

Посмотреть

Автоэнкодеры в Keras, Часть 2: Manifold learning и скрытые (latent) переменные

iphysic 24 июн 2017 в 10:54

Не могу согласиться. В гистограмме плотность вероятности p(Z) оценивается по количеству X отображенных в нужный интервал по Z. Проходясь по сэмплированной выборке мы и приближаем мат ожидание по p(X). А p(Z|X) в представлении энкодера — это вообще дельта функция.

Посмотреть

Уравнение теплопроводности в tensorflow

iphysic 14 фев 2017 в 09:24

Добрый день!

1) Ноутбук Jupyter: http://nbviewer.jupyter.org/github/urtrial/pde/blob/master/partial_differential_equation.ipynb

2) Почти, 101 точек по x и 101 по y, то есть 10 201 точек по координатам и 10 000 по времени (конкретно для того примера). Да, смотрел, примерно половина операций в графе идут на GPU, какие именно не помню, но думаю, что самые основные вроде перемножения или сложения тензоров.

3) C Cython'ом не сравнивал, но время работы сравнимо и даже быстрее моей реализации на С + MPI для курсовой (у меня правда нет уверенности в оптимальности того кода).

Посмотреть