Zachar_5 3 фев 2017 в 01:25

Комплексная нейронная сеть на основе ряда Фурье от функции многих переменных

6 мин

27K

Программирование*.NET*C#*Математика*Машинное обучение*

+32

Комментарии 26

GeMir 3 фев 2017 в 01:35

С формулами на первой, да и на последующих «иллюстрациях» в статье стряслось что-то очень нехорошее.

Zachar_5 3 фев 2017 в 01:37

Я вначале в Word писал, а потом отскринил.

-3

GeMir 3 фев 2017 в 01:55

Очевидно, что так делать не нужно. Ну и так далее.

НЛО прилетело и опубликовало эту надпись здесь

Zachar_5 3 фев 2017 в 07:00

Если Вы за формулы 1-6, то это сделано для получения пространства признаков.

MadWombat 5 фев 2017 в 18:33

То что библиотека tensorflow умеет обращаться с комплексными числами не значит, что вариант нейронных сетей приведенный автором широко используется.

erwins22 3 фев 2017 в 10:08

Tensorflow работает с комплексными числами.

Zachar_5 3 фев 2017 в 10:28

Я тут ничего не могу сказать, перед тем как писать я посмотрел статьи на киберленинке и в гугле гуглил, но так и не нашел статей про сети работающие на основе ряда Фурье. Буду благодарен если Вы приведете ссылку на работу по этой теме.

-2

BalinTomsk 3 фев 2017 в 19:46

Как можно пропустить сеть которaя в основном мировом тренде?

https://www.tensorflow.org/api_docs/python/math_ops/complex_number_functions

Danov 4 фев 2017 в 12:39

А разве это не просто мат библиотека для работы с комплексными числами?
Отсюда не следует, что сети в Tensorflow работают с комплексными числами. Например, если комплексное число разбивается на пару (Re,Im) и подается на сетку двумя скалярными переменными, тогда это не работа сети с комплексными числами.

erwins22 5 фев 2017 в 16:23

разницы нет…
Комплексные числа сводятся линейно к вещественным.

Zachar_5 5 фев 2017 в 18:36

Да, но тест показал, что загрузка отдельно мнимых, а отдельно действительных чисел, дает меньшую точность, при прочих равных условиях.

erwins22 6 фев 2017 в 10:01

Потому, что размерность сетки в 2 раза меньше.

увеличьте скрытые слои в 2 раза. (а лучше в 2 и еще попробуйте в !,4)

Zachar_5 6 фев 2017 в 15:32

Тогда возникнет ошибка переобучения. Но я по пробую.

erwins22 7 фев 2017 в 14:17

Будет интересно почитать ваши результаты.
Ждемс.

Zachar_5 7 фев 2017 в 16:00

Да Вы правы, точность возросла, но все равно не так: она стала от 79% до 84%, а там на разных тестах от 78% до 93%. Выборку и количество циклов и начальный шаг не менял.

devpony 3 фев 2017 в 10:47

Вы показали нам формулу разложения функции в бесконечный (!) ряд Фурье, потом показали нам обычный однослойный перцептрон с экспоненциальной функцией активации и утверждаете теперь, что «сеть работает на основе ряда Фурье». Нет, не работает.

1. Почему вы показываете нам бесконечный ряд, когда ваша сеть обладает конечным набором параметров?
2. Где доказательство, что коэффициенты сойдутся к коэффициентам ряда Фурье? (Подсказка: не сойдутся)
3. Почему в статье полно формул, которые вообще ничего не значат и нет ни одной важной, например формулы инициализации весов?

У вашей сети и ряда Фурье из общего только значёк экспоненты. По факту это традиционный однослойный перцептрон с очень плохой функцией активации. К слову, комплекснозначная сеть полностью аналогична такой же вещественнозначной в два раза большего размера. А привычная CNN решила бы вашу задачу распознавания на 99%.

Zachar_5 3 фев 2017 в 11:02

1) CNN нужно около 1000 образов на класс, так же CNN не имеет расчетных формул и ее архитектура подбирается эмпирически.
2) Если расписать уравнение этой сети, то Вы получите ряд Фурье для многих переменных.
3) Так же я писал, что сеть не доработана. И сейчас я занимаюсь ее доработкой.
4) Сигмоидальная функция в другой модификации, а в первой ее нет. И первая работает так же как и ряд Фурье.

-3

devpony 3 фев 2017 в 11:36

Вот ваша сеть:

huynya

(почему я, а не вы сделали эту картинку?)

Вот разложение функции в ряд Фурье в L2:

Где коэффициенты, к слову, определяются единственным образом как скалярное произведение функции на элементы базиса. Если честно, даже отдалённого сходства не вижу.

Но… даже если бы сходство было… У вас сумма конечная, у ряда Фурье — бесконечная. К каким именно по счёту членам ряда сойдутся ваши коэффициенты? К первым? Почему? Почему не к сорок второму? Почему в ходе оптимизации коэффициенты сойдутся к аналитическим? Похожесть (и даже одинаковость) формул этого не гарантирует и не может гарантировать.

erwins22 3 фев 2017 в 11:39

Сделайте на tensorflow,

там уже есть все необходимые функции.

Zachar_5 3 фев 2017 в 17:48

Спасибо за наводку, у меня есть проект на C#, я могу туда подключить tensorflow? А то писать свою CNN слишком накладно.

erwins22 3 фев 2017 в 18:57

Там это есть. Буквально 10 строк взять из примера

НЛО прилетело и опубликовало эту надпись здесь

Halt 3 фев 2017 в 17:17

Но зачем картинки если на хабре уже давно работают формулы? Имхо, выкладывать статью в таком виде — проявлять неуважение к читателям.

Zachar_5 3 фев 2017 в 17:44

Я извиняюсь за такой вид! Не умею верстать в этом редакторе. Если подскажете как загружать doсx или pdf файлы — будет здорово. Но я не нашел.

Gryphon88 5 фев 2017 в 18:40

Извините, а откуда следует TRS-инвариантность, если мы используем классическую матрицу с квадратным пикселом? Насколько я знаю, совсем наоборот (Glenn D. Boreman "Modulation Transfer Function in Optical and ElectroOptical Systems", SPIE, 2001)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Комплексная нейронная сеть на основе ряда Фурье от функции многих переменных

Комментарии 26

Публикации

Истории