Комментарии / Профиль berng / Хабр

Пользователь

Подписчики

ПрофильСтатьи2ПостыНовостиКомментарии210

Автоматический подбор гиперпараметров и архитектур нейронных сетей. Часть 1

berng 29 мар 2023 в 23:39

А сколько свободных параметров?

Если у вас 8000 нейронов в скрытом слое - это порядка 6.5млн свободных параметров в сети. Для такой сетки 98.6% - очень плохой показатель, такие нейронки все дают результаты выше 99%, посмотрите обзор https://doi.org/10.1016/j.neunet.2021.01.026 , там в последней таблице есть бенчмарки по различным сеткам. И вообще, 8000 нейронов - это сильно много, по теории 1600 должно быть достаточно.

Автоматический подбор гиперпараметров и архитектур нейронных сетей. Часть 1

berng 29 мар 2023 в 20:29

А что выбрано в качестве исходной архитектуры и сколько свободных параметров?

Просто у меня на тестовом датасете MNIST при 50тыс свободных параметров сети безо всяких оптимизаций, стандартным ADAMом, дефолтным батчем и LR точность 99.18% . Правда, архитектура проприетарная, да.

Российские учёные нашли путь к созданию электроники нового типа

berng 18 мар 2023 в 19:07

Хороший научный журналист - это вообще редкость. Как и вообще хороший специалист в любой области. Просто косяки остальных менее на виду.

Российские учёные нашли путь к созданию электроники нового типа

berng 18 мар 2023 в 15:21

Британские ученые - это шутливый журнал для студентов (https://journals.le.ac.uk/ojs1/index.php/pst), который и задумывался таким (у меня даже знакомый там в редколлегии). А здесь вроде приличные люди пишут в приличные журналы.

-2

Бесплатный мультиязычный чат для сайта на Tawk + Notion + Telegram + chatGPT + GPT-Index

berng 17 мар 2023 в 19:09

При чем тут дообучение ChatGPT, если вы дообучаете LLMA?

Методы и способы построения нейросетевого ПО. Что надо знать, если вы решили профессионально разрабатывать ИНС. Часть 2

berng 15 мар 2023 в 15:57

Приятно встретить специалистов. По теореме Колмогорова-Арнольда для получения хорошего решения достаточно полносвязной двухслойной нейронной сети с 2N+1 нейронами на каждом слое. По теореме Цыбенко их нужно еще меньше. Зачем весь этот зоопарк и сколько нейронов и слоев должно быть в полносвязной нейронке, чтобы решить заданную задачу?

Решения типа "подбирайте опытным путем" не предлагать.

Визуализация архитектуры модели PyTorch

berng 15 мар 2023 в 07:11

Вопрос, почему так сложно визуализовать торч-модель?

В Tensorflow аналогичный этому примеру FunctionalAPI визуализируется без проблем

через keras.utils.plot_model()

-1

Midjourney, BlueWillow, PLAYGROUND AI, Stable Diffusion, Leonardo AI — как пользоваться

berng 15 мар 2023 в 05:18

https://github.com/CompVis/stable-diffusion

Джон Кармак взялся за сильный ИИ — и у него особый подход. Список фундаментальной литературы для начала

berng 14 мар 2023 в 04:17