craxti 29 мар 2023 в 17:28

Как создать свою собственную нейронную сеть с нуля на Python

Средний

5 мин

75K

Ненормальное программирование*Python*

Туториал

Recovery Mode

Перевод

+19

Комментарии 19

Revertis 29 мар 2023 в 19:06

А есть то же самое, но для Раста?

Keirichs 30 мар 2023 в 09:44

Я вообще проходимец, но как заметил это реализация формулы автора тупо на питоне,
чтобы реализовать такое на расте, полагаю, надо уметь пользоваться математическими функциями в этом языке.

tenzink 29 мар 2023 в 19:15

Немного странно использовать квадратичную функцию потерь в связке с sigmoid активацией на выходном слое. Тут уж либо мы решаем задачу классификации, либо регрессии

задача классификации: sigmoid activation + cross-entropy loss
или задача регрессии: linear (no) activation + quadratic loss

ShashkovS 29 мар 2023 в 20:21

У меня вот есть такая интерактивная иллюстрация работы ма-а-а-аленькой сеточки, которая играет в змейку: https://shashkovs.ru/ai/

**ReLU + чем толще линия — тем больше слагаемое**

+13

user18383 29 мар 2023 в 23:29

Очень интересно что такое казалось бы сложное задание, нейросеть может выполнить на таком маленьком количестве нейронов.

НЛО прилетело и опубликовало эту надпись здесь

Hvorovk 30 мар 2023 в 08:22

Ну игры даже сегодняшние развивают мозг, различные механики к которым нужно найти подход, различные логические задачи в играх все так же встреачаются опять же. Да условный cookie clicker мало что разовьет, как и змейка, но все же это уже лучше чем смотреть в стену)

ShashkovS 30 мар 2023 в 09:39

Там есть вариант, когда оно играет в змейку вообще без промежуточного слоя: 4 входных и 3 выходных, то есть всё управление — это 15 весов.

НЛО прилетело и опубликовало эту надпись здесь

ShashkovS 30 мар 2023 в 09:34

Для змейки всегда есть положение «вперёд». Во входе «яблоко» угол от положения «вперёд» в радианах.

ShashkovS 30 мар 2023 в 09:44

А, ну и конкретно про 3.14. Для вычисления угла используется atan2, а для приближения справа Math.atan2(0, -1) = 3.1415...

НЛО прилетело и опубликовало эту надпись здесь

ShashkovS 30 мар 2023 в 16:27

Не, асимметрия ненамеренная. Угол вычисляется через atan2, которая так работает... Но вообще действительно есть гипотеза, что это портит обучаемость. Нужно бы как-то это поправить и попробовать переобучить заново.

gybson_63 30 мар 2023 в 15:05

Порекомендую вот эту статью
Let’s code a Neural Network in plain NumPy | by Piotr Skalski | Towards Data Science

Glomberg 30 мар 2023 в 15:05

Покажите как используется ваш класс в итоге и что является результатом работы. Покажите код, который делает это "Давайте обучим нейронную сеть на 1500 итерации". Спасибо.

matthew_shtyasek 31 мар 2023 в 09:56

А почему именно сигмоид? Почему не relu, например?

Просто насколько мне известно, от сигмоида отказываются из-за того, что при обучении он любит уходить намертво в 1 или 0. Ну а если не уходит, то по сути мы получаем ± градиент как при relu