Комментарии 17
У вас в результате объекты получаются «разорванными». И никакой дальнейшей обработки не происходит. Может стоит подумать о том, чтобы высчитывать оператор Лапласа или Собеля и по нему строить контур? А может сразу Кенни использовать. Существуют более надёжные способы выделить объект на изображении. Тем более он у Вас настолько очевидный и повторяющийся (по крайней мере контур). Вообще, статья похожа на лабораторную студентов курса 1-3. Особенно в части, которая описывает Ваше практическое применение «машинного зрения».
Спасибо за идеи. В дальнейшем постараюсь реализовать.
По поводу похожести на лабораторную работу, эта статья оформлена по стандарту научного журнала. Если интересно, ссылку на оригинал оставил.
По поводу похожести на лабораторную работу, эта статья оформлена по стандарту научного журнала. Если интересно, ссылку на оригинал оставил.
Все таки посоветую, если в будущем планируете связаться с обработкой цифровых изображений, то переходите на более гибкий софт. Особенно, если Вас не заставляют пользоваться определенным ПО. Дела даже не столько в наличии множества библиотек, сколько в возможности быстрого прототипирования и/или миграции программы.
Если Вас не затруднит, пожалуйста, посоветуйте софт, так как тема меня интересует и привязки к софту нет.
LabView мне посоветовали в ВУЗе, поэтому на него и подсел.
LabView мне посоветовали в ВУЗе, поэтому на него и подсел.
Для разработки методов смотрите на Matlab и MathCad(желательно не prime, т.к. в нем порезали некоторый функционал и убрали совместимость с классическим МатКадом). В первом удобно быстро реализовать задуманное на языке близком к си/питон(скрипты), а так же реализована очень хорошая справка, во втором удобно оперировать прям формулами, что закрепляет связь между тем, что написано на языке математики и результатами этих манипуляций. Это как помощь в обучении.
Для более серьезных проектов используются уже языки программирования в связке со специализированными библиотеками. Это нужно в первую очередь из-за быстродействия, т.к. все все лабвью, матлаб и прочее при большой нагрузке начинают сдавать. Язык выбираете любой близкий Вам. Никого не слушайте — каждый свое болото хвалит, главное, чтобы язык был актуальный, живой и востребованный. Но в первую очередь понятный Вам. В качестве отправной точки посоветую посмотреть библиотеку OpenCv. Для нее существуют обертки под разные языки. Методы, реализованные в данной библиотеке стали уже почти стандартом в обработке изображений.
А дальше ждут нейронные сети и прочие вкусняшки ;)
Для более серьезных проектов используются уже языки программирования в связке со специализированными библиотеками. Это нужно в первую очередь из-за быстродействия, т.к. все все лабвью, матлаб и прочее при большой нагрузке начинают сдавать. Язык выбираете любой близкий Вам. Никого не слушайте — каждый свое болото хвалит, главное, чтобы язык был актуальный, живой и востребованный. Но в первую очередь понятный Вам. В качестве отправной точки посоветую посмотреть библиотеку OpenCv. Для нее существуют обертки под разные языки. Методы, реализованные в данной библиотеке стали уже почти стандартом в обработке изображений.
А дальше ждут нейронные сети и прочие вкусняшки ;)
Исторические прорывы в машинном зрении
1990-е годы – Первые космические системы автоматической навигации автомобилей.
Я вот тут не понял. Подразумевается общеизвестная глобальная спутниковая навигация? Какие задачи решались машинным зрением? Кроме векторизации карт ничего в голову не приходит.
По поводу спутниковой навигации.
В числе представляющих наибольший интерес технологий и средств КВНО, разработанных в Евросоюзе – экспериментальные системы точного определения орбит космических аппаратов – DORIS и PRARE. Система DORIS (Doppler Orbitography and Radiopositioning Integrated on Satellite – «Система радиопозиционирования и определения орбиты путем измерения доплеровского сдвига частоты») была создана в начале 1990-х гг. французской компанией Dassault Electronique по заказу Французского агентства космических исследований CNES. Данная система была установлена на борту спутников TOPEX/Poseidon, Jason-1, Envisat, и SPOT-2, -4, -5. Двухчастотный (2036/401 МГц) комплект DORIS массой около 20 кг предназначен для определения местоположения спутника с точностью до 1 м, текущих значений высоты его полета до 20 см и скорости до 0,3 мм/с. В состав оборудования входят ультрастабильные кварцевые генераторы частоты. Длина передающей антенны составляет 42 см. Траекторные измерения выполняются с помощью наземной сети, в состав которой входит 75 пунктов, оснащенный радиомаяками. Использования этой системы также позволяет определять координаты взаимодействующих наземных пунктов, оснащенных соответствующим оборудованием. Так, главный измерительный пункт системы DORIS в Тулузе привязан с точностью 5 мм.
По поводу машинного зрения.
В 1990–2000-х пришло осознание того, что трехмерные формы могут быть реконструированы из фильмов и что для этого очень полезна геометрия. В 2000–2010-е была открыта польза статистических методов, пришло осознание того, что текстура играет важную роль в процессе распознания объекта. Следующим важным шагом стало применение сверточных нейронных сетей. Ян Лекун был одним из первых, кто осознал их потенциал. Несмотря на то что он пришел к этому уже в 1990-х, распространение этот метод получил к 2012 году, когда Крижевский, Сатскевер и Хинтон показали нам потрясающие результаты в классификации изображений на основе ImageNet с применением сверточных нейронных сетей.
Помимо этого, в машинном зрении появляется метод опорных векторов. Рассказывать о нём долго, поэтому прикреплю ссылку на статью в википедии.
В числе представляющих наибольший интерес технологий и средств КВНО, разработанных в Евросоюзе – экспериментальные системы точного определения орбит космических аппаратов – DORIS и PRARE. Система DORIS (Doppler Orbitography and Radiopositioning Integrated on Satellite – «Система радиопозиционирования и определения орбиты путем измерения доплеровского сдвига частоты») была создана в начале 1990-х гг. французской компанией Dassault Electronique по заказу Французского агентства космических исследований CNES. Данная система была установлена на борту спутников TOPEX/Poseidon, Jason-1, Envisat, и SPOT-2, -4, -5. Двухчастотный (2036/401 МГц) комплект DORIS массой около 20 кг предназначен для определения местоположения спутника с точностью до 1 м, текущих значений высоты его полета до 20 см и скорости до 0,3 мм/с. В состав оборудования входят ультрастабильные кварцевые генераторы частоты. Длина передающей антенны составляет 42 см. Траекторные измерения выполняются с помощью наземной сети, в состав которой входит 75 пунктов, оснащенный радиомаяками. Использования этой системы также позволяет определять координаты взаимодействующих наземных пунктов, оснащенных соответствующим оборудованием. Так, главный измерительный пункт системы DORIS в Тулузе привязан с точностью 5 мм.
По поводу машинного зрения.
В 1990–2000-х пришло осознание того, что трехмерные формы могут быть реконструированы из фильмов и что для этого очень полезна геометрия. В 2000–2010-е была открыта польза статистических методов, пришло осознание того, что текстура играет важную роль в процессе распознания объекта. Следующим важным шагом стало применение сверточных нейронных сетей. Ян Лекун был одним из первых, кто осознал их потенциал. Несмотря на то что он пришел к этому уже в 1990-х, распространение этот метод получил к 2012 году, когда Крижевский, Сатскевер и Хинтон показали нам потрясающие результаты в классификации изображений на основе ImageNet с применением сверточных нейронных сетей.
Помимо этого, в машинном зрении появляется метод опорных векторов. Рассказывать о нём долго, поэтому прикреплю ссылку на статью в википедии.
Это мне ответ?
Да :)
Оно не прикрепилось
Оно не прикрепилось
Если честно, я ответа не понял. А именно, как развитие спутниковой навигации послужило прорыву в области машинного зрения. Или наоборот.
Сейчас метод опорных векторов (прорыв машинного зрения 1990-х) используется в работах по принципу монокулярного зрения. Статья о этом
Это часть навигационного комплекса
Это часть навигационного комплекса
Нашёл историческую справку о машинном зрении.
1955 г. — профессор Массачусетского технологического института (МТИ) Оливер Селфридж опубликовал статью «Глаза и уши для компьютера». В ней автор выдвинул теоретическую идею оснащения компьютера средствами распознавания звука и изображения.
1958 г. — психолог Фрэнк Розенблатт из Корнеллского университета создал компьютерную реализацию персептрона (от perception — восприятие) — устройства, моделирующего схему распознавания образов человеческим мозгом. Персептрон был впервые смоделирован в 1958 году, причем его обучение требовало около получаса машинного времени на ЭВМ IBM-704. Аппаратный вариант — Mark I Perceptron — был построен в 1960 г. и предназначался для распознавания зрительных образов [Компьютерное зрение, 2010].
Однако рассмотрение задач машинного зрения носило скорее умозрительный характер, так как ни техники, ни математического обеспечения для решения таких сложных задач еще не было.
1960-е гг.- появление первых программных систем обработки изображений (в основном для удаления помех с фотоснимков, сделанных с самолетов и спутников), стали развиваться прикладные исследования в области распознавания печатных символов. Однако все еще существовали ограничения в развитии данной области науки, такие как отсутствие дешевых оптических систем ввода данных, ограниченность и довольно узкая специализация вычислительных систем. Бурное развитие систем компьютерного зрения на протяжении 60-х годов можно объяснить расширением использования вычислительных машин и очевидной потребностью в более быстрой и эффективной связи человека с ЭВМ. К началу 60-х годов задачи компьютерного зрения в основном охватывали область космических исследований, требовавших обработки большого количества цифровой информации.
1970-е гг. — Лавренсе Робертс, аспирант МТИ, выдвинул концепцию машинного построения трехмерных образов объектов на основе анализа их двумерных изображений. На данном этапе стал проводиться более глубокий анализ данных. Начали развиваться различные подходы к распознаванию объектов на изображении, например структурные, признаковые и текстурные.
1979 г. — профессор Ганс-Хельмут Нагель из Гамбургского университета заложил основы теории анализа динамических сцен, позволяющей распознавать движущиеся объекты в видеопотоке.
В конце 1980-х годов были созданы роботы, способные более-менее удовлетворительно оценивать окружающий мир и самостоятельно выполнять действия в естественной среде
80-е и 90-е годы ознаменовались появлением нового поколения датчиков двухмерных цифровых информационных полей различной физической природы. Развитие новых измерительных систем и методов регистрации двухмерных цифровых информационных полей в реальном масштабе времени позволило получать для анализа устойчивые во времени изображения, генерируемые этими датчиками. Совершенствование же технологий производства этих датчиков позволило существенным образом снизить их стоимость, а значит, значительно расширить область их применения
С начала 90-х годов в алгоритмическом аспекте последовательность действий по обработке изображения принято рассматривать в согласии с так называемой модульной парадигмой. Эта парадигма, предложенная Д. Марром на основе длительного изучения механизмов зрительного восприятия человека, утверждает, что обработка изображений должна опираться на несколько последовательных уровней восходящей информационной линии: от «иконического» представления объектов (растровое изображение, неструктурированная информация) – к их символическому представлению (векторные и атрибутивные данные в структурированной форме, реляционные структуры и т. п.). [Визильтер и др., 2007]
В середине 90-х годов появились первые коммерческие системы автоматической навигации автомобилей. Эффективные средства компьютерного анализа движений удалось разработать в конце XX века
2003 г. — на рынок были выпущены первые достаточно надежные корпоративные системы распознавания лиц.
1955 г. — профессор Массачусетского технологического института (МТИ) Оливер Селфридж опубликовал статью «Глаза и уши для компьютера». В ней автор выдвинул теоретическую идею оснащения компьютера средствами распознавания звука и изображения.
1958 г. — психолог Фрэнк Розенблатт из Корнеллского университета создал компьютерную реализацию персептрона (от perception — восприятие) — устройства, моделирующего схему распознавания образов человеческим мозгом. Персептрон был впервые смоделирован в 1958 году, причем его обучение требовало около получаса машинного времени на ЭВМ IBM-704. Аппаратный вариант — Mark I Perceptron — был построен в 1960 г. и предназначался для распознавания зрительных образов [Компьютерное зрение, 2010].
Однако рассмотрение задач машинного зрения носило скорее умозрительный характер, так как ни техники, ни математического обеспечения для решения таких сложных задач еще не было.
1960-е гг.- появление первых программных систем обработки изображений (в основном для удаления помех с фотоснимков, сделанных с самолетов и спутников), стали развиваться прикладные исследования в области распознавания печатных символов. Однако все еще существовали ограничения в развитии данной области науки, такие как отсутствие дешевых оптических систем ввода данных, ограниченность и довольно узкая специализация вычислительных систем. Бурное развитие систем компьютерного зрения на протяжении 60-х годов можно объяснить расширением использования вычислительных машин и очевидной потребностью в более быстрой и эффективной связи человека с ЭВМ. К началу 60-х годов задачи компьютерного зрения в основном охватывали область космических исследований, требовавших обработки большого количества цифровой информации.
1970-е гг. — Лавренсе Робертс, аспирант МТИ, выдвинул концепцию машинного построения трехмерных образов объектов на основе анализа их двумерных изображений. На данном этапе стал проводиться более глубокий анализ данных. Начали развиваться различные подходы к распознаванию объектов на изображении, например структурные, признаковые и текстурные.
1979 г. — профессор Ганс-Хельмут Нагель из Гамбургского университета заложил основы теории анализа динамических сцен, позволяющей распознавать движущиеся объекты в видеопотоке.
В конце 1980-х годов были созданы роботы, способные более-менее удовлетворительно оценивать окружающий мир и самостоятельно выполнять действия в естественной среде
80-е и 90-е годы ознаменовались появлением нового поколения датчиков двухмерных цифровых информационных полей различной физической природы. Развитие новых измерительных систем и методов регистрации двухмерных цифровых информационных полей в реальном масштабе времени позволило получать для анализа устойчивые во времени изображения, генерируемые этими датчиками. Совершенствование же технологий производства этих датчиков позволило существенным образом снизить их стоимость, а значит, значительно расширить область их применения
С начала 90-х годов в алгоритмическом аспекте последовательность действий по обработке изображения принято рассматривать в согласии с так называемой модульной парадигмой. Эта парадигма, предложенная Д. Марром на основе длительного изучения механизмов зрительного восприятия человека, утверждает, что обработка изображений должна опираться на несколько последовательных уровней восходящей информационной линии: от «иконического» представления объектов (растровое изображение, неструктурированная информация) – к их символическому представлению (векторные и атрибутивные данные в структурированной форме, реляционные структуры и т. п.). [Визильтер и др., 2007]
В середине 90-х годов появились первые коммерческие системы автоматической навигации автомобилей. Эффективные средства компьютерного анализа движений удалось разработать в конце XX века
2003 г. — на рынок были выпущены первые достаточно надежные корпоративные системы распознавания лиц.
Ну вот теперь я понял. Надо у Вас в статье вместо:
«1990-е годы – Первые космические системы автоматической навигации автомобилей»
написать:
«1990-е годы – Первые беспилотные системы управления автотранспортом»
Я похоже залез к Вам в неотредактированную статью, да? Извините.
«1990-е годы – Первые космические системы автоматической навигации автомобилей»
написать:
«1990-е годы – Первые беспилотные системы управления автотранспортом»
Я похоже залез к Вам в неотредактированную статью, да? Извините.
Рад, что Вы разобрались!
Обе фразы означают, примерно, одни и тоже. Если у Вас возникла сложность восприятия статьи в данной формулировке, прошу простить. Заменю, дабы такого не повторилось.
Ничего. Две головы всегда лучше одной. Когда пишешь один, ошибки неизбежны.
Надо у Вас в статье вместо:
«1990-е годы – Первые космические системы автоматической навигации автомобилей»
написать:
«1990-е годы – Первые беспилотные системы управления автотранспортом»
Обе фразы означают, примерно, одни и тоже. Если у Вас возникла сложность восприятия статьи в данной формулировке, прошу простить. Заменю, дабы такого не повторилось.
Я похоже залез к Вам в неотредактированную статью, да? Извините.
Ничего. Две головы всегда лучше одной. Когда пишешь один, ошибки неизбежны.
del
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Машинное зрение. Что это и как им пользоваться? Обработка изображений оптического источника