Comments 8
Я мало что понимаю в нейронных сетях, чтобы критиковать само решение. Но мне кажется, что свою домашнюю работу вы не доделали. Ну вот смотрите:
>Я посчитал верным решением обучать нейросеть не на исходных изображениях, а на изображениях с контурами автомобиля, найденными посредством функции cv2.findcontours(...).
Резонно, но: если бы вы довели свою идею до результата, то есть, провели бы обучение двумя способами, и сравнили бы качество распознавания, вы бы реально извлекли что-то полезное из своего эксперимента, и возможно что не только для себя.
Ну или вот тут:
>Архитектура сети списана с примера с интернетов: для меня неочевидно объяснение, почему именно так.
Опять же, домашняя работа не завершена. Нормальный вариант выглядел бы так: архитектура взята вот тут (ссылка), там она применяется для решения похожей задачи (почему вы или автор архитектуры считаете, что они похожи), с хорошими результатами. А так вообще непонятно, что за архитектуру вы взяли, и почему именно ее?
Ну и кстати, ваши-то результаты где? Каково качество, быстродействие, какие-то еще показатели? Оно вообще работает?
>Я посчитал верным решением обучать нейросеть не на исходных изображениях, а на изображениях с контурами автомобиля, найденными посредством функции cv2.findcontours(...).
Резонно, но: если бы вы довели свою идею до результата, то есть, провели бы обучение двумя способами, и сравнили бы качество распознавания, вы бы реально извлекли что-то полезное из своего эксперимента, и возможно что не только для себя.
Ну или вот тут:
>Архитектура сети списана с примера с интернетов: для меня неочевидно объяснение, почему именно так.
Опять же, домашняя работа не завершена. Нормальный вариант выглядел бы так: архитектура взята вот тут (ссылка), там она применяется для решения похожей задачи (почему вы или автор архитектуры считаете, что они похожи), с хорошими результатами. А так вообще непонятно, что за архитектуру вы взяли, и почему именно ее?
Ну и кстати, ваши-то результаты где? Каково качество, быстродействие, какие-то еще показатели? Оно вообще работает?
Спасибо за комментарий
Насколько я понимаю, многослойный полносвязный персептрон совершенно не используется для распознавания изображений. Возможно, я бы получил лучшие результаты, использовав бы сверточную архитектуру, которая применяется повсеместно для анализа изображений.
Мой интерес состоит в том числе и в том, насколько просто использовать простые структуры: в нейросети сравнительно мало нейронов(этим объясняется высокое быстродействие), однако она работает с 80% точностью(для кадров разнесенных во времени). Работает это только потому, что я анализирую не сами изображения, а найденные алгоритмом контуры
Подобный подход к решению задачи классификации изображений(персептрон) я увидел в примере из документации tensorflow(они классифицировали MNIST датасет, черно-белые картинки 25х25 пикселей с изображениями разных видов одежды).
Насколько я понимаю, многослойный полносвязный персептрон совершенно не используется для распознавания изображений. Возможно, я бы получил лучшие результаты, использовав бы сверточную архитектуру, которая применяется повсеместно для анализа изображений.
Мой интерес состоит в том числе и в том, насколько просто использовать простые структуры: в нейросети сравнительно мало нейронов(этим объясняется высокое быстродействие), однако она работает с 80% точностью(для кадров разнесенных во времени). Работает это только потому, что я анализирую не сами изображения, а найденные алгоритмом контуры
Подобный подход к решению задачи классификации изображений(персептрон) я увидел в примере из документации tensorflow(они классифицировали MNIST датасет, черно-белые картинки 25х25 пикселей с изображениями разных видов одежды).
А цель проекта какая? Можно сделать полезное приложение, если находить свободные места на парковке.
О, я над похожей задачей работал некоторое время для личных целей. Основная проблема была в том, что автолюбители не брезгуют ставить автомобили не по разметке. Ставят криво, поперек, по диагонали: кто как сумел. И, т.о., задача сводилась к тому, чтобы посчитать расстояние между стоящими автомобилями и определить, хватит ли его для парковки еще одного автомобиля. Я делал без нейросетей, в каком-то виде все работает, но ключевым моментом осталось требование: камера должна быть правильно установлена.
Разработчик из Калифорнии делал подобное.
> Если знающие люди расскажут или подскажут где почитать, почему эта архитектура эффективна или почему какая-та другая будет эффективнее, буду безмерно благодарен.
Для распознавания изображений лучше использовать свертчные сети (почитай как они работают например VGG, ResNet и тд)
Но вобще непонятные твои результаты, есть ли что улучшать или нет
Для распознавания изображений лучше использовать свертчные сети (почитай как они работают например VGG, ResNet и тд)
Но вобще непонятные твои результаты, есть ли что улучшать или нет
Sign up to leave a comment.
Задача классификации глазами школьника: определение наличия автомобиля на парковке по кадрам с камеры видеонаблюдения