@enemigo Jun 1 at 18:11

Нейросети без градиентов: спектральное моделирование и построение решений

Hard

19 min

4.2K

Artificial IntelligenceMachine learning *

Opinion

+21

Comments 15

@S_A Jun 2 at 01:12

Когда-то думал над игровой реализацией градиентного спуска. То есть нейроны играют в игру, и может быть (в зависимости от функции выигрыша) равновесие Нэша (по теореме о неподвижной точке). То есть улучшая любой нейрон, мы бы ухудшили лосс, увеличили его.

Вся проблема в выборе функции "положения" нейрона. Я не подобрал) возможно это можно сделать другой сеткой или RL, или например KAN. Вобщем, поле для экспериментов есть, времени нет.

@Refridgerator Jun 2 at 03:04

Например, если перемешать фазы в аудиосигнале, то вы почти не заметите изменений на слух

Заметите. Например, если просто поменять знаки фаз в спектре - во временном домене это приведёт к реверсу, то есть звук будет воспроизводиться задом наперёд.

Ну а применительно к теме больше смысла рассматривать не преобразование Фурье, а преобразование Лапласа, как это делается в электротехнике. Там тоже есть частоты и фазы, но а) он определён от 0 до бесконечности и б) для действительных чисел.

@enemigo Jun 2 at 06:01

Что касается преобразования Лапласа — это, скорее, вопрос возможной аппаратной реализации. В моей статье, напротив, рассматривается концептуальный подход, где сигнал — это носитель информации, а не физический процесс. Возможно, однажды кто-то реализует подобную идею аппаратно, но сейчас для меня это, в первую очередь, исследование архитектурных принципов, а не приглашение к физическому моделированию.

Архитектура свёрточной сети, на мой взгляд, излишне ограничена: она вынужденно "смотрит" на сигнал через узкое окно, и это ограничение накладывается не столько вычислительными возможностями, сколько самой структурой входных данных. Свёрточная сеть опирается на текущую точку и её сдвинутые копии и лишь за счёт этой “окрестности” может ориентироваться в последовательности.

Моя цель — научиться извлекать позиционную информацию из одной точки, без обращения к соседним значениям. Именно этому будет посвящена следующая статья.

Спасибо за содержательный комментарий!

@S_A Jun 2 at 06:20

а я вот соглашусь насчёт преобразования Лапласа, и причины две. была такая сетка, NeuralODE, и неплохо перформила, и с другой стороны, преобразование Лапласа сводит диффуры к рациональным многочленам.

Короче говоря Лапласом можно извлекать структуру процессов

@iShrimp Jun 2 at 17:32

Заметите. Например, если просто поменять знаки фаз в спектре - во временном домене это приведёт к реверсу, то есть звук будет воспроизводиться задом наперёд.

Автор, по-видимому, имел в виду периодический сигнал с коротким периодом. Если взять звуковой сигнал частотой 1 кГц произвольной формы и менять в нём фазы гармоник, то его звучание почти не изменится.

И если я правильно понимаю, автор хотел выразить в виде периодического сигнала множество всех возможных значений входов нейронной сети, и показать, как, манипулируя его спектром, получить тот же результат, что выдаёт НС.

Цель данного исследования, видимо, состоит в том, чтобы вместо чёрного ящика (которым является обычная многослойная НС) создать строго и однозначно определённую аппроксимирующую функцию, основанную на преобразованиях спектра. (Обычная НС инициализируется случайными весами и обучается неоптимально, и в результате может содержать много мёртвых и дублирующихся нейронов. Автор предлагает способ найти глобально оптимальное (?) решение, в котором нет ничего лишнего.)

Но пока непонятно, как выражать в виде периодического сигнала многомерные непрерывные входные данные. Индексировать их кривой Гильберта?

@Refridgerator Jun 3 at 03:17

На простых сигналах сдвиг по фазам конечно не ощутим на слух, особенно если он гладкий. Просто захотелось подушнить по-случаю) Я ещё не до конца понял идею автора, но он обещал продолжение, подождём. Может, и в моих задачах пригодится.

@MAXH0 Jun 2 at 04:00

Следующий шаг: Фурье–голограммы и распознавание образов))). Довольно старая технология. Но можно попробовать обновить.

@cheptsov2016 Jun 2 at 08:33

В вашей формуле:

я бы знак равно не ставил, т.к.

XOR(0,0) = 1.414
XOR(1,0) = -0.0002879939100249815
XOR(0,1) = 1.0002470126024203
XOR(1,1) = -0.9996545088665344

@enemigo Jun 2 at 08:45

Справедливое замечание — действительно, в приведённой формуле точное равенство не соблюдается в битовой кодировке 0 и 1.

Но я хотел бы уточнить, что в статье используется альтернативная кодировка входов и выходов: -1 и 1.

Разумеется, для получения абсолютного равенства нужно было бы выписать результат в аналитическом виде и сделать поправку на смещения

$XOR(x_1,x_2)=\frac{1}{2} \left(\sqrt{2}cos\left(\frac{\pi}{2}x_1+\frac{\pi}{4}x_2 \right) +1\right)$

Но основной акцент я делал на то, что нейросети всегда работают с приближёнными значениями.

Спасибо за внимательное прочтение!

@cheptsov2016 Jun 2 at 09:08

Не, опять чуть-чуть не то...

XOR(0,0) = 1.2071067811865475
XOR(1,0) = 0.5
XOR(0,1) = 1.0
XOR(1,1) = 0.0

и поверхность решений вашего выражения не очень:

@enemigo Jun 2 at 10:43

Ох, да — мой косяк, спешил на обед 🙂

Спасибо за замечание, вы правы: я ошибся в переходе и не учёл масштабирование. Вот правильная формула и переход

$XOR(x_1,x_2)=\frac{1}{2}\left(\sqrt{2}cos\left(\pi x_1 + \frac{\pi}{2} x_2- \frac{3\pi}{4}\right) +1\right)$

@U235U235 Jun 2 at 11:00

Все равно как-то нессимметрично получается. По идее, должно быть xor(x1,x2)==xor(x2,x1).

Ну и, по-моему, такими приближениями занимается нечеткая логика.

@S_A Jun 2 at 12:25

которая в пределе - дифф.ур.

@iShrimp Jun 2 at 18:08

Вопрос: что произойдет, если на вход подать сигнал с нескольким гармониками? Ответ: ничего хорошего. Результирующий спектр предсказать невозможно. Отдельные гармоники будут преобразованы, как и ранее, при этом возможно наложение спектров, но плюс еще добавится взаимодействие разных гармоник между собой. Основные гармоники, вероятно, будут все еще различимы, но в остальном спектр будет хаотическим:

Нелинейная передаточная функция f(x) изменяет спектр сигнала x(t) вполне определённым образом. Если разложить её в полином: f(x) = a0 + a1 * x + a2 * x^2 + ..., то каждому члену, содержащему x в степени n, будет соответствовать (n-1)-кратная свёртка спектра с самим собой. Каждая свёртка приводит к интермодуляции всех имеющихся в спектре гармоник. Чётные степени дают чётные гармоники, и то же верно для нечётных. Негладкие функции типа ReLU аппроксимируются очень плохо и спектр действительно становится практически непредсказуемым.

@Refridgerator Jun 3 at 03:19

Мне кажется, функцию XOR лучше продемонстрирует сложение двух частот в противофазе (ага, тот самый случай, когда фаза важна).