Как стать автором
Обновить

Комментарии 26

С формулами на первой, да и на последующих «иллюстрациях» в статье стряслось что-то очень нехорошее.

Я вначале в Word писал, а потом отскринил.

Очевидно, что так делать не нужно. Ну и так далее.
НЛО прилетело и опубликовало эту надпись здесь

Если Вы за формулы 1-6, то это сделано для получения пространства признаков.

То что библиотека tensorflow умеет обращаться с комплексными числами не значит, что вариант нейронных сетей приведенный автором широко используется.
Tensorflow работает с комплексными числами.

Я тут ничего не могу сказать, перед тем как писать я посмотрел статьи на киберленинке и в гугле гуглил, но так и не нашел статей про сети работающие на основе ряда Фурье. Буду благодарен если Вы приведете ссылку на работу по этой теме.

Как можно пропустить сеть которaя в основном мировом тренде?

https://www.tensorflow.org/api_docs/python/math_ops/complex_number_functions
А разве это не просто мат библиотека для работы с комплексными числами?
Отсюда не следует, что сети в Tensorflow работают с комплексными числами. Например, если комплексное число разбивается на пару (Re,Im) и подается на сетку двумя скалярными переменными, тогда это не работа сети с комплексными числами.
разницы нет…
Комплексные числа сводятся линейно к вещественным.

Да, но тест показал, что загрузка отдельно мнимых, а отдельно действительных чисел, дает меньшую точность, при прочих равных условиях.

Потому, что размерность сетки в 2 раза меньше.

увеличьте скрытые слои в 2 раза. (а лучше в 2 и еще попробуйте в !,4)

Тогда возникнет ошибка переобучения. Но я по пробую.

Будет интересно почитать ваши результаты.
Ждемс.

Да Вы правы, точность возросла, но все равно не так: она стала от 79% до 84%, а там на разных тестах от 78% до 93%. Выборку и количество циклов и начальный шаг не менял.

Вы показали нам формулу разложения функции в бесконечный (!) ряд Фурье, потом показали нам обычный однослойный перцептрон с экспоненциальной функцией активации и утверждаете теперь, что «сеть работает на основе ряда Фурье». Нет, не работает.

1. Почему вы показываете нам бесконечный ряд, когда ваша сеть обладает конечным набором параметров?
2. Где доказательство, что коэффициенты сойдутся к коэффициентам ряда Фурье? (Подсказка: не сойдутся)
3. Почему в статье полно формул, которые вообще ничего не значат и нет ни одной важной, например формулы инициализации весов?

У вашей сети и ряда Фурье из общего только значёк экспоненты. По факту это традиционный однослойный перцептрон с очень плохой функцией активации. К слову, комплекснозначная сеть полностью аналогична такой же вещественнозначной в два раза большего размера. А привычная CNN решила бы вашу задачу распознавания на 99%.

1) CNN нужно около 1000 образов на класс, так же CNN не имеет расчетных формул и ее архитектура подбирается эмпирически.
2) Если расписать уравнение этой сети, то Вы получите ряд Фурье для многих переменных.
3) Так же я писал, что сеть не доработана. И сейчас я занимаюсь ее доработкой.
4) Сигмоидальная функция в другой модификации, а в первой ее нет. И первая работает так же как и ряд Фурье.

Вот ваша сеть:

huynya

(почему я, а не вы сделали эту картинку?)

Вот разложение функции в ряд Фурье в L2:

image

Где коэффициенты, к слову, определяются единственным образом как скалярное произведение функции на элементы базиса. Если честно, даже отдалённого сходства не вижу.

Но… даже если бы сходство было… У вас сумма конечная, у ряда Фурье — бесконечная. К каким именно по счёту членам ряда сойдутся ваши коэффициенты? К первым? Почему? Почему не к сорок второму? Почему в ходе оптимизации коэффициенты сойдутся к аналитическим? Похожесть (и даже одинаковость) формул этого не гарантирует и не может гарантировать.
Сделайте на tensorflow,

там уже есть все необходимые функции.

Спасибо за наводку, у меня есть проект на C#, я могу туда подключить tensorflow? А то писать свою CNN слишком накладно.

Там это есть. Буквально 10 строк взять из примера
НЛО прилетело и опубликовало эту надпись здесь
Но зачем картинки если на хабре уже давно работают формулы? Имхо, выкладывать статью в таком виде — проявлять неуважение к читателям.

Я извиняюсь за такой вид! Не умею верстать в этом редакторе. Если подскажете как загружать doсx или pdf файлы — будет здорово. Но я не нашел.

Извините, а откуда следует TRS-инвариантность, если мы используем классическую матрицу с квадратным пикселом? Насколько я знаю, совсем наоборот (Glenn D. Boreman "Modulation Transfer Function in Optical and ElectroOptical Systems", SPIE, 2001)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Изменить настройки темы

Истории