Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!



А про 3д глаз — есть более интересная идея в научных кругах: мозг строит трехмерную картинку, опираясь на микро движения глаза, т.е. влево-вправо, для всех точек изменилось — пусть и на пару десятых миллиметра — расстояние, и готово, расчёт пошел
Скажем (возвращаясь к зрению), ваши глаза сейчас постоянно совершают мелкие и очень быстрые движения — саккады — перескакивая между предметами в поле зрения (а в промежутках между этими движениями ваше зрение вообще не работает — именно поэтому нельзя увидеть собственные саккады, даже уставившись в зеркало в упор). Мозг постоянно занимается упорной работой по «сшиванию» увиденных кусочков. Это — та же самая задача, которую мы только что пытались решить, или все-таки другая?Это связано с особенностью работы нейронов, фильтрующих изображение на предмет нахождения границ. Просто такая себе хардварная оптимизация, находящая резкий градиент и его направление, подобные фильтры есть и в фотошопе и, видимо, разных библиотеках CV — когда изображение смещается на пиксель-другой и вычитается из оригинала.
тэг: не котикиСтатья настолько отличная, что даже на это вопиющее неуважение к котикам можно закрыть глаза.

ваши глаза сейчас постоянно совершают мелкие и очень быстрые движения — саккады — перескакивая между предметами в поле зрения (а в промежутках между этими движениями ваше зрение вообще не работает — именно поэтому нельзя увидеть собственные саккады, даже уставившись в зеркало в упорА как мы их увидим-то, если для слежения за своим зрачком нужно смотреть прямо на него не отводя взгляда? Любая саккада тут же уведёт взгляд с нужной точки.
Возьмите два карандаша, закройте один глаз и попытайтесь сдвигать эти карандаши так, чтобы они соприкоснулись кончиками грифелей где-то вблизи вашего лица. Скорее всего, грифели разойдутся, причем ощутимо (если у вас получилось легко, поднесите их еще ближе к лицу)Обижаете наш интеллект! =) Подносил карандаши так близко к глазу, что вообще не мог на них чётко сфокусироваться — произвёл наводку по угловым размерам и степени расфокусировки, коснулся с первого раза.
Какой бы ни была способость нашей зрительной системы воссоздавать трехмерные образы увиденного, она явно не требует наличия двух глаз. Что остается в итоге? Я ни в коем случае не готов дать точный ответ применительно к биологическом зрению...
уже в пункте 1 от нас требуют откалиброванную камеру… В предыдущих попытках мы, по сути, пытались определить реальное положение трехмерных точек — отсюда необходимость знать параметры камеры, матрицы, ректифицировать кадры и так далее.
Но бинокулярное зрение, а точнее комбинация конвергенции и аккомодации является одним из основных и используется, вероятно, чаще чем любой из других признаков.
Разреженное облако точек построить в 3D — это не проблема вообще
А вы все-таки пробовали закрыть один глаз?) Или посмотреть на плоскую распечатанную картинку, где конвергенция совершенно точно никак не работает, потому что не на чем ей?
Совершенно не сомневаюсь, учитывая мои собственные более чем дилетантские знания в 3d-реконструкции… но все-таки, поделитесь способом, который:
но часть этих вещей (достаточно большая) работает только если у нас уже есть какой-то опыт и знание об окружающем мире
Ваш пример с SIFT+RANSAC упоминался в посте как «пробовал, но что-то не получилось» (это тот, который с помощью stereoRectifyUncalibrated), так что вполне возможно, конечно, что это мне просто не хватило скилла
А вы все-таки пробовали закрыть один глаз?) Или посмотреть на плоскую распечатанную картинку, где конвергенция совершенно точно никак не работает, потому что не на чем ей?
Телевизоры, которые под разными углами отдают разную картинку бывают. Используются в рекламе для Вау-эффекта, я такие видел, но по границам между разными зонами артефакты так сильно бъют в глаз, что использовать это для рабочего монитора вообще не вариант.
Как человек, у которого дома стоит монитор с Nvidia 3DVision, и являющийся любителем этого дела, могу ответственно заявить, что любая технология с элементами 3D, которая позволит смотреть в монитор 5-6 часов подряд уже будет иметь как минимум одни преимущество перед обычным стерео.
Причём пропихивают они всё это вопреки упорному нежеланию клиента за эти все навороты доплачивать. Анаглиф есть у любой нормальной их карточки.
Могли бы и такую опцию освоить попробовать.
Они что и матрицу налету механически перестраивают? Ну подождём, конечно, посмотрим.
Картинка физически одна в оба глаза и фокусироваться нужно именно на том расстоянии на котором сходится паралакс. А значит непосредственной усталости глаз не будет.
Если вы тоже так думаете, у меня для вас небольшой сюрприз — это неправда. Доказательство прекрасно в своей простоте — достаточно закрыть один глаз и пройтись по комнате, чтобы убедиться, что мир внезапно не утратил глубины и не стал походить на плоский аналог анимационного мультфильма.
что будет, если залепить глаз новорожденному котенку? А ничего не будет. Через непродолжительный период он сможет восстановить нормальное поведение, не будет врезаться в стены и в целом будет таким же котом, как и остальные.
Опять же, не строгое доказательство, но заставляет слегка задуматься на тему того, почему такой важный элемент восприятия, как вы утверждаете, так легко выключается?
— и это, как несложно заметить, не очень согласуется с тем что существует куча хищников, обладающих глазами по бокам головы, и им норм.
А вообще алгоритм можно применить немного по другому — снимать с неподвижной точки например дорогу, или небо. А потом «игнорировать» все обьекты(пиксели) что задетектили смещение.В Фотошопе: File -> Scripts -> Statistics -> Median
И можно за минуту получить чистое небо и пустые улицы. Без перекрытий центра города и силуэтов длинной выдержки.
Зато автор примерно обьяснил и показал на примере как работают математики такого рода.Не выдавайте желаемое за действительное. Автор той статьи ставил перед собой другую, сугубо утилитарную цель: "В конечном итоге ничего подходящего я так и не нашел, и в итоге решил написать такое ПО самому, благо что все выглядело весьма легко."
фотошоп не может являться допустимым решением, так как привязан к некой платформе, лицензии, не имеет АПИ и не запускается с консоли.Вполне может являться решением в рамках задачи, допускающей такие ограничения.
решение на ImageMagic/OpenCV/Perl/Python/и.т.д — может.Да, это более гибкий, но и трудоемкий в адаптации к нужному решению инструментарий. Странно сразу за него хвататься, когда задачу можно решить более простыми средствами. Более простые средства, это необязательно фотошоп, но тот же ImageMagic против OpenCV или OpenCV против голого C++ или C++ против ассемблера, например. Простыми эти средства стали за счет специализаций под наиболее распространенные задачи. Поэтому, разумно при решении задачи поинтересоваться, насколько она уникальна и есть ли для нее приемлемые готовые решения. Вроде, очевидные вещи.
Представьте, что вы — нейронная сеть. Это не должно быть очень сложно — в конце концов, как-то так оно и есть на самом деле.
Вместо того, чтобы копировать увиденное, мы хотим найти принцип и повторить его своими силами (может быть, сделав это проще/эффективней).
Чтобы распознавать картинки, не нужно распознавать картинки