Artemy_Dev6 ноя 2024 в 09:15

Сверточные нейронные сети. Создание нейросети для распознавания цифр на языке программирования Python

Средний

18 мин

7.2K

Python * TensorFlow * Data Engineering * Искусственный интеллект

Из песочницы

+12

Комментарии 10

berng 6 ноя 2024 в 10:55

90% - это не отличная точность, это - так себе. У ЛеКуна в 1998 году, через 10 лет как он изобрел сверточную сеть, была 98.4% . Сейчас датасет рукописных цифр MNIST выработан. Сейчас в тестовом датасете не определяются сетями только 5 или 7 изображений (из 10000), которые даже человек не способен разобрать.

NeroMiLow 6 ноя 2024 в 11:07

По сверточным можно сказать, что они достигают точности на задаче классификации при точности равной 90,9%. Так что не вижу тут проблемы, на мой взгляд.

AiBurner 6 ноя 2024 в 11:12

Если берем собственный датасет, то от 90 % для распознования текста в данной модели - достаточно.

Ruzweelt 6 ноя 2024 в 11:58

Точность важный, но не единственный параметр. Следует учитывать так же: обобщающую способность, скорость предсказания, ресурсы для обучения, устойчивость к изменяющимся данным, интерпретируемость и т.д.

Ergistael 6 ноя 2024 в 11:30

Попробовали бы они числа в преферансной пуле разобрать...

Dynasaur 6 ноя 2024 в 12:16

Статье явно не хватает картинок с результатами распознавания и набором данных

Artemy_Dev 6 ноя 2024 в 13:21

Согласен. Подумал об этом уже после публикации. Первая статья, так что в дальнейшем планирую писать статьи более наглядно.

Herobyte 6 ноя 2024 в 21:52

Хорошо структурированная модель. Есть несколько предложений для улучшения. Увеличте количество фильтров в сверточных слоях и добавьте дополнительных сверточных слоев, это может помочь модели извлекать более сложные признаки, а для уменьшения переобучения (на будущее) можно добавить слои Dropout между полносвязными слоями.

BlackSN 7 ноя 2024 в 05:12

Почему у Вас один слой свертки и одни пуллинга? Почему не два слоя свертки? Зачем делить на 255 значение каждого пикселя? Почему используете sequential? почему не используете другие возможности создания модели? Почему оптимизатор Адам именно? Почему у Вас 10 выходов в модели, почему не сделать один выход который сразу цифру давал бы предсказанную?

Почеум именно 5 эпох тут? model.fit(x_train, y_train, epochs=5) может она у Вас не обученная или уже переобученная? Почему так сохраняете модель "model.save('my_model.keras')" ? Вы уверены что вы сохранили модель с лучшей точностью на 5 эпохе? Почему не использовали аугментацию ? Зачем нужно строить свою модель, почему не взять уже готовую модель обученную и дообучить ее?

Дополните, пожалуйста, обязательно статью, очень много вопросов по статье.

Artemy_Dev 7 ноя 2024 в 05:39

Спасибо за вопрос! Я возможно не достаточно точно, по крайней мере не для всех, описал некоторые моменты, поэтому с радостью дополню статью развернутым объяснением по интересующим Вас вопросам.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий