Привет, Хабр!

Меня зовут Андрей, я – специалист по оптическим системам, оптик и конструктор в одном лице.

Уже много лет, будучи единственным оптиком фирмы, я работаю бок о бок с отделом нейросетей в проектах по распознаванию изображений. В процессе этой работы у меня сложилось чёткое понимание того, какие именно фрагменты оптических знаний необходимы CV-разработчикам.

Из таких фрагментов, выстроенных в удобном порядке, и появился этот курс. Изначально я писал его для внутреннего обучения джунов и мидлов. В курсе рассматривается то, с чем разработчики более-менее часто сталкиваются на практике при работе с реальными объективами.

Зачем пришлось писать, когда есть гугл? Оптика – узкая и наукоёмкая сфера, и попытки гуглить информацию по ней часто приводят к неудачам, поскольку неспециалисту трудно отличить правильную информацию от ошибочной. Я много раз смотрел, что пишут в сети по оптике, и осознал, что некорректная информация встречается там пугающе часто, причём вне зависимости от языка. Статьи на оптические темы в основном пишут:

  • фотографы (в их объяснениях нередко встречается целый каскад ошибок)

  • астрономы-любители (они пишут довольно грамотно, но астрономическая оптика крайне специфична, и её принципы не всегда можно применить к задачам технического зрения)

  • неспециалисты-практики (например, охотники, чьи представления об оптике ограничены сугубо практическим опытом использования охотничьих прицелов)

Корректная информация есть в профильных статьях и книгах по 500 страниц, но в такие глубины неспециалисты обычно не ныряют. Потому постепенно кристаллизовалась идея написать короткий и простой курс-шпаргалку по оптике для начинающих CV-специалистов.

Дисклеймер

Курс короткий и относительно простой, поэтому кое-где я отклоняюсь от классической оптической теории. Строгость терминов сознательно принесена в жертву удобству практического применения.

Цикл статей предусматривает обучение с нуля, так что он начинается с самых основ. Если вы уже имеете опыт работы с оптическими системами, можете бегло просмотреть первую статью и перейти к более сложным темам. Тем не менее, даже в этом случае я настоятельно рекомендую прочитать статью целиком, чтобы не упустить нюансы, которые иногда критичны для реальных проектов.

Содержание

Обзор курса

Объектив как аппаратная часть технического зрения
Общая структура оптико‑электронного прибора
Идеальная линза как удобная модель объектива
Формирование изображения в идеальной линзе

Расчёт оптических параметров для удалённых предметов
Пример: расчёт угловых полей
Пример: расчёт дистанции через необходимое число пикселей

Расчёт оптических параметров для близких предметов
Пример: расчёт смещения камеры
Пример: расчёт фокусного расстояния под требуемое увеличение

Основные параметры объектива
Фокусное расстояние
Диафрагменное число
Угловое поле зрения
Разрешающая способность
Глубина резко изображаемого пространства

Выбор объективов

Обзор курса

Из всего многообразия прикладной оптики программистам, специализирующимся на техническом зрении, для практической работы достаточно понимать три раздела:

  1. Основные параметры объектива: что они означают, на что влияют и как проводить простейшие расчёты для подбора оптики под решаемую задачу

  2. Особенности реального изображения: отклонения реального изображения от идеального, диагностирование причин плохого изображения и способы снижения негативных эффектов

  3. Разрешающая способность: как оптимально подобрать оптику, когда стоит задача наблюдать конкретный объект на конкретном расстоянии с конкретным качеством

Знание этих разделов закрывает практически все оптические вопросы, которые только могут встретиться CV-программистам. Если ответа на ваш вопрос нет в этих статьях, то это значит, что лучше проконсультироваться с профессиональным оптиком. Это сэкономит много времени.

Выбор разделов и подразделов основан на моём многолетнем опыте совместной работы с разработчиками систем технического зрения. Три раздела разбиты на четыре статьи так, чтобы раскрывать информацию в удобном и органичном порядке. Курс допускает возможность обучения без каких-либо предварительных оптических знаний.

В рамках курса термины техническое зрение, компьютерное зрение и машинное зрение идентичны и используются как синонимы.

Объектив как аппаратная часть технического зрения

Если мы говорим о распознавании изображений, то возникает вопрос, как мы получаем исходное изображение. Даже картинки из интернета кто-то как-то получил, прежде чем загрузить их в сеть.

Системы технического зрения, исходя из самого слова зрение, воспринимают реальные предметы окружающего мира подобно глазу. Чтобы получить изображения предметов в форме, пригодной для компьютерной обработки, требуются два компонента: объектив и камера. Это – аппаратные части, «железки», без которых нельзя передать изображение реального мира в компьютер.

Далее вместо пары «объектив + камера» будет использоваться термин оптическая система.

Интересный факт

Принципиально в оптике рассматриваются четыре типа оптических систем, различающихся по положению предмета и изображения:

1. Предмет на бесконечности, изображение на бесконечности: подзорная труба
2. Предмет на конечном расстоянии, изображение на бесконечности: микроскоп
3. Предмет на бесконечности, изображение на конечном расстоянии: объектив
4. Предмет на конечном расстоянии, изображение на конечном расстоянии: проектор

Общая структура оптико-электронного прибора

Любую систему технического зрения можно разделить на следующие модули:

  1. Объектив. Оптический элемент, формирующий плоское изображение объёмного предмета

  2. Сенсор (также встречается название матрица) – тонкая пластинка из полупроводника с массивом микроскопических светочувствительных элементов. Сенсор совмещается с плоским изображением от объектива и расположен в камере

  3. Камера. Сенсор, размещённый в корпусе с обрабатывающей электроникой (обычно на базе ПЛИС) и разъемами для подключения питания и передачи данных. Иногда в ПЛИС камеры выполняется первичная обработка изображения (например, усиление сигнала или сжатие)

  4. Модуль обработки – вычислитель (например, Jetson) или компьютер, где с изображением проводятся необходимые манипуляции (свето/цвето/гамма-коррекция), и где собственно осуществляется решение рабочих задач (распознавание, трекинг и т.д.)

Объектив с камерой
Объектив с камерой

Такое разделение позволяет решать задачи подбора составных частей относительно независимо:

  1. Подбирать объектив, исходя из требуемого увеличения и разрешающей способности

  2. Подбирать сенсор, исходя из требуемого формата и разрешения в пикселях

  3. Подбирать камеру нужного типа (IP или аналоговая)

    и так далее.

Интересный факт

Такое разделение на модули соблюдается не только в оптике, но и в других диапазонах шкалы электромагнитных волн. Например, по идентичному принципу построен радиолокатор: его тарелкообразный рефлектор служит объективом, а приёмник в фокусе рефлектора – камерой.

Радиолокатор
Радиолокатор

Интересный факт

В фотографии камера интегрирована в корпус фотоаппарата, поэтому фотографы используют только слова «объектив» и «матрица», а слово «камера» имеет у фотографов иное значение – так обычно называют сам фотоаппарат.

Идеальная линза как удобная модель объектива

Объектив формирует изображение независимо от наличия камеры. Если с объектива снять камеру, изображение никуда не пропадёт и будет физически висеть в воздухе за объективом. Это изображение можно увидеть, если разместить голову так, чтобы выходящие из объектива световые лучи попадали в зрачок глаза:

Изображение миры в фокальной плоскости зеркального телескопа, из которого вынут окуляр
Изображение миры в фокальной плоскости зеркального телескопа, из которого вынут окуляр

Таким образом, объектив можно рассматривать отдельно от камеры и её сенсора.

Для практических расчётов реальный объектив удобно заменять эквивалентной идеальной линзой, которая изучалась в школьной физике в 8 классе. Такая линза, как следует из названия, формирует идеальное изображение без искажений и аберраций (подробнее об аберрациях в следующей статье).

Любой объектив (кроме объектива с сильной дисторсией) можно заменить эквивалентной ему идеальной линзой. Для конкретного объектива эквивалентная ему идеальная линза располагается в точке пересечения продолжений входящего в объектив и выходящего из объектива лучей:

Переход от реального объектива к эквивалентной идеальной линзе
Переход от реального объектива к эквивалентной идеальной линзе

Положение идеальной линзы традиционно определяет осевой пучок (пучок, лучи которого распространяются параллельно оптической оси), но и наклонные пучки, формирующие угловое поле объектива, подчиняются этому же правилу:

Переход от реального объектива к идеальной одиночной линзе
Осевой пучок – синий, наклонный (полевой) пучок – зелёный

Одиночная идеальная линза описывает реальный объектив с точностью, более чем достаточной для задач компьютерного зрения. Большое количество линз в реальных объективах служит лишь для улучшения качества изображения.

Главная характеристика идеальной линзы – фокусное расстояние (), расстояние от идеальной линзы до фокальной плоск��сти. Фокусное расстояние эквивалентной объективу идеальной линзы всегда равно фокусному расстоянию самого объектива.

Фокусное расстояние реального объектива не зависит от длины его корпуса. Оно может быть как больше, так и меньше. Если фокусное расстояние больше, чем длина объектива, это телеобъектив, а если меньше – ретрофокусный объектив (на картинке выше как раз он). 

Формирование изображения в идеальной линзе

Чтобы использовать модель идеальной линзы в расчётах, необходимо вспомнить, как она строит изображение. Для этого используются два дополнительных понятия:

  1. Фокус (F') – точка на оптической оси, куда собирается (фокусируется) осевой пучок лучей

  2. Фокальная плоскость – плоскость, проходящая через точку фокуса и перпендикулярная оптической оси

Обратите внимание: в оптике фокус и фокусное расстояние – разные понятия.

Для построения хода любых лучей через линзу используются три правила:

  1. Лучи, идущие параллельно оптической оси, после линзы проходят через точку фокуса (и наоборот, лучи, проходящие через фокус, после линзы идут параллельно оптической оси)

  2. Лучи, проходящие через центр линзы, не меняют своего направления

  3. Любые другие лучи после линзы проходят через точку пересечения фокальной плоскости и вспомогательного луча, идущего параллельно и проходящего через центр линзы

Предположим, перед линзой расположен предмет AB. Чтобы определить положение и размер изображения, необходимо найти местоположение точек A' и B'.

Построение изображения в идеальной линзе
Построение изображения в идеальной линзе

Любую точку можно однозначно определить пересечением двух прямых. Точка A лежит на оптической оси, которая уже задаёт одну прямую, так что для нахождения точки A' достаточно найти пересечение с оптической осью любого луча, вышедшего из точки А:

  1. Проведём из точки A произвольный луч AD, падающий на линзу

  2. Проводим параллельный ему вспомогательный луч ЕE, проходящий через центр линзы O

  3. Согласно правилу №3, луч AD после преломления пройдёт через точку J – точку пересечения вспомогательного луча EE с фокальной плоскостью, а далее пересечёт оптическую ось в точке A'

Для нахождения точки B' также достаточно построить два луча:

  1. Луч BC идёт до линзы параллельно оптической оси, а после линзы – через фокус F'

  2. Луч ВО проходит через центр линзы О и потому не меняет своего направления

  3. Пересечение лучей CF' и ВO даёт точку B'

Как легко заметить, если предмет перпендикулярен оптической оси, то и его изображение перпендикулярно оптической оси.

Пары точек АА' оптически сопряжены. Это означает, что любой луч, вышедший из точки А и попавший на линзу, после преломления всегда пройдёт через точку А'. То же относится и к паре точек ВВ'. Конусы лучей, выходящих из точек А и В, ограничены лишь световым диаметром линзы:

Оптическое сопряжение точек A-A' и B-B'
Оптическое сопряжение точек A-A' и B-B'

В формировании реальных изображений участвуют такие световые конусы, содержащие в себе бесконечное множество лучей. Для построения изображения мы лишь выбираем из этого множества наиболее удобные лучи, прохождение которых через линзу просчитать легче всего.

В примере выше предмет находился на конечном расстоянии от линзы. Но часто приходится наблюдать весьма далёкие предметы. В этом случае говорят, что предмет расположен на бесконечности. Чтобы понять построение изображения для предмета на бесконечности, необходимо рассмотреть постепенное удаление предмета от линзы.

Для наглядности пусть верхний и нижний лучи проходят через края светового диаметра линзы:

Предмет и изображение – на конечном расстоянии
Предмет и изображение – на конечном расстоянии

Разберём схему сверху вниз:

  • Первая линза по расположению предмета и изображения соответствует двум предыдущим рисункам

  • Когда предмет находится на двойном фокусном расстоянии, его изображение равно предмету

  • При дальнейшем удалении предмета от линзы его изображение уменьшается и приближается к фокальной плоскости

Обратите внимание, что при удалении предмета угол α между верхним и нижним лучами уменьшается. Следовательно, при дальнейшем удалении предмета угол α стремится к 0, а при достижении предметом бесконечности α становится равным 0. Нулевой угол между прямыми означает, что прямые параллельны:

Предмет в бесконечности, изображение – в фокальной плоскости
Предмет в бесконечности, изображение – в фокальной плоскости
  • Когда предмет удаляется на бесконечность, его изображение располагается в фокальной плоскости (поскольку в ней фокусируются параллельные лучи).

Реальные предметы практически никогда не располагаются на бесконечности. Даже самые далёкие предметы лежат на конкретном расстоянии от объектива, пусть и очень большом. Если расстояние до предмета настолько велико, что его изображение находится практически в фокальной плоскости и неотличимо по резкости от изображения для бесконечности, то говорят, что предмет находится на расстоянии практической бесконечности или просто на практической бесконечности. Также иногда встречается термин начало бесконечности.

Практическая бесконечность зависит от параметров объектива (фокусное расстояние, диафрагменное число), и сенсора (размер пикселя). Она не обязательно начинается далеко:

  • Для глаза (а глаз – тоже объектив) она начинается уже с пяти метров – именно на таком расстоянии висит офтальмологическая таблица для проверки остроты зрения.

  • Для короткофокусных объективов она может начинаться с пары метров, а то и ближе.

Чем меньше фокусное расстояние объектива, чем сильнее закрыта его диафрагма и чем больше размер пикселя у сенсора – тем ближе к объективу начинается практическая бесконечность.

Примечание. Существует термин гиперфокальное расстояние – такое расстояние фокусировки, при котором глубина резко изображаемого пространства (ГРИП) максимальна за счёт того, что дальняя граница ГРИП лежит на бесконечности. Для каждой комбинации "фокусное расстояние + диафрагма + размер пикселя" гиперфокальное расстояние своё. Гиперфокальное расстояние не равно расстоянию практической бесконечности.

Расчёт оптических параметров для удалённых предметов

Рассмотрим соотношения идеальной линзы, через которую на сенсор проецируется предмет, находящийся на бесконечности (или на достаточно большом расстоянии).

В случае удалённых предметов часто удобнее перейти к угловой мере: вместо высоты предмета y и расстояния до него L оперируют угловым размером предмета ω:

Формирование изображения на практической бесконечности
Формирование изображения на практической бесконечности
  • Зная размер предмета y, расстояние до предмета L и фокусное расстояние объектива f', можно определить линейный размер изображения y' и угловой размер изображения ω.

  • Зная габаритные размеры светочувствительной области сенсора и фокусное расстояние объектива f', можно определить угловые поля зрения объектива.

  • Рассчитав угловой размер изображения ω, можно оценить необходимый размер сенсора и пропорции изображения на нём.

  • Рассчитав линейный размер изображения y' и зная размер пикселя, можно узнать, сколько пикселей займёт изображение

Последний расчёт – важная часть задачи распознавания. Для уверенного детектирования объекта нейросетью часто требуется, чтобы его изображение занимало на сенсоре не менее Х пикселей.

Пример: расчёт угловых полей

Задача:

Найти поля зрения на максимальном зуме для объектива Computar M24Z1527PDC-MP с камерой на основе сенсора Python 2000.

Решение:

Все необходимые данные для решения таких задач можно найти в спецификациях на объективы и сенсоры (lens / sensor datasheets).

К расчёту угловых полей через размер сенсора
К расчёту угловых полей через размер сенсора

Арктангенсы отношений размеров a, b и c к фокусному расстоянию объектива дадут три угловых поля зрения: горизонтальное, вертикальное и диагональное.

  1. Гуглим спецификацию на объектив Computar M24Z1527PDC-MP и ищем его максимальное фокусное расстояние: 360 мм. Максимальный зум всегда означает максимальное фокусное расстояние

  2. Гуглим спецификацию на сенсор Python 2000 и ищем его разрешение: 1920×1200 и размер пикселя: 4,8 мкм (сразу переводим в мм: 0,0048 мм)

  3. Определяем размеры светочувствительной области сенсора, умножив разрешение сенсора на размер пикселя: 1920*0,0048 мм х 1200*0,0048 мм = 9,216 х 5,76 мм

  4. По теореме Пифагора находим диагональ сенсора: 10,87 мм

  5. Находим диагональное поле зрения: arctg(10,87 / 360) = 1,729 градуса

  6. Находим горизонтальное поле зрения: arctg(9,216 / 360) = 1,446 градуса

  7. Находим вертикальное поле зрения: arctg(5,76 / 360) = 0,916 градуса

Расчёт не учитывает дисторсию, неточность номинального фокусного расстояния и прочие погрешности реальных оптических систем, так что найденные величины примерные, и их стоит округлить до первого знака после запятой.

Ответ:

  • Диагональное поле зрения: 1,7 градуса

  • Горизонтальное поле зрения: 1,4 градуса

  • Вертикальное поле зрения: 0,9 градуса 

Пример: расчёт дистанции через необходимое число пикселей

Задача:

Найти расстояние, с которого объект высотой 5 метров при наблюдении в объектив Computar M24Z1527PDC-MP с камерой на основе сенсора Python 2000 на максимальном зуме будет занимать изображение размером 100 пикселей.

Решение:

  1. Гуглим спецификацию на объектив Computar M24Z1527PDC-MP и ищем его максимальное фокусное расстояние: 360 мм

  2. Гуглим спецификацию на сенсор Python 2000 и ищем размер пикселя: 4,8 мкм

  3. Находим размер изображения: y′ = 100 * 4,8 мкм = 480 мкм. Переводим в мм: 0,48 мм

  4. Переводим высоту объекта в миллиметры: 5 метров = 5000 мм

  5. Выражаем из формулы с рисунка «Формирование изображения на бесконечности» расстояние до предмета наблюдения и находим ответ в миллиметрах:

    L=\frac{y*f'}{y'}=\frac{5000*360}{0,48}=3750000

Ответ: 3750 метров

Одно и то же изображение, занимающее разное количество пикселей
Одно и то же изображение, занимающее разное количество пикселей

Расчёт оптических параметров для близких предметов

Иногда возникает необходимость сфокусировать объектив на близкую дистанцию. В оптике в этом случае говорят: объект находится на конечном расстоянии. При работе на конечном расстоянии возникает важное отличие от схемы для бесконечности: изображение формируется не в фокальной плоскости объектива, а за ней:

Формирование изображения на конечном расстоянии
Формирование изображения на конечном расстоянии

Когда мы рассматривали предметы на бесконечности, отрезок z′ (смещение от фокальной плоскости) был равен нулю.

Когда мы рассматривали предметы на расстоянии практической бесконечности, отрезок z′ был настолько мал, что им можно было пренебречь. Также им можно пренебречь даже в ситуациях, когда предмет ближе начала бесконечности ‒ но только в случае, если расстояние ещё достаточно велико.

Когда мы рассматриваем предметы на близком расстоянии, отрезок z′ обязательно надо учитывать, так как он становится слишком большим:

Зависимость отрезка z′ от расстояния фокусировки а для объектива с f′ = 50 мм
Зависимость отрезка z′ от расстояния фокусировки а для объектива с f′ = 50 мм

Удлинение отрезка z′ конструктивно чаще всего реализуется:

  • в простых объективах ‒ перемещением всего объектива по резьбе

  • в более сложных объективах ‒ осевой подвижкой одной из линз, чаще всего ‒ первой.

В расчётах для конечного расстояния применяются следующие формулы геометрической оптики:

Формулы для расчёта на конечном расстоянии
Формулы для расчёта на конечном расстоянии

Зная эти формулы и фокусное расстояние объектива, можно вычислить любой необходимый оптический отрезок.

Эти формулы не применяются для реального использования при наводке на резкость. Реальная наводка осуществляется непосредственно по предмету. Такие расчёты необходимы для того, чтобы приблизительно оценить отклонение, возникающее при использовании для работы вблизи стандартного покупного объектива, рассчитанного на бесконечность.

Важно: pinhole camera model

Если при работе с кодом используется модель пинхол-камеры, то возможна малозаметная ошибка: в качестве фокусных расстояний пинхол-камеры fx и fy подставляется фокусное расстояние покупного объектива вместо замены на вычисляемый отрезок a'. Эта ошибка приводит к неправильным расчётам и результатам, если расстояние до предмета слишком мало. Помните про квадратичную зависимость и используйте правильный отрезок a'.

Интересный факт

Существует двойственность терминологии. При фокусировке на конечное расстояние продолжают говорить, что изображение «в фокусе». Однако в оптике фокус F ‒ точка, куда фокусируются лучи, пришедшие из бесконечности и параллельные оптической оси. Изображения для предметов на конечном расстоянии всегда располагаются за точкой фокуса.

Пример: расчёт смещения камеры

Задача:

Есть покупной объектив с фокусным расстоянием 20 мм и резьбой C-mount. Необходимо рассчитать, на какое расстояние от объектива необходимо отодвинуть камеру, чтобы сфокусироваться на дистанцию 500 мм. Перевести это расстояние в количество оборотов резьбы.

Решение:

  1. Смещение для фокусировки на конечное расстояние ‒ отрезок z′. Выражаем его из формулы Ньютона: z′=f′2/ z

  2. По вспомогательной формуле находим: z = a ‒ f′ = 500 ‒ 20 = 480 мм

  3. Получаем итоговое смещение: z′=f′2/(a‒f’) = 202/480 = 0,8333 мм

  4. Гуглим параметры резьбы C-mount: диаметр резьбы 1 дюйм (25,4 мм), шаг резьбы 32 витка на дюйм. Высчитываем итоговый шаг в миллиметрах: 25,4/32 = 0,79375 мм

  5. Рассчитываем угол разворота. Полный оборот в 360° смещает сенсор на 0,79375 мм, а по условиям задачи необходимо смещение на 0,8333 мм

  6. Рассчитываем число оборотов: 0,8333/0,79375 = 1,0498 ≈ 1,05 оборота или 378°. Более удобный вариант ответа: 360° + 18°

Ответ: Объектив надо вывернуть на один полный оборот и дополнительно 18°.

Если дистанция фокусировки значительно больше фокусного расстояния, то отрезок z можно не высчитывать по формуле a ‒ f′, а сразу подставлять вместо него расстояние до объекта a.

Предположим, что дистанция фокусировки заметно больше фокусного расстояния: например, не 500 мм, а 2000 мм. В этом случае разница между точным и упрощённым расчётами мала:

  • Итоговое смещение по точному методу: z′=f′2/a‒f’= 202 / 1980 = 0,202 мм

  • Итоговое смещение по упрощённому методу: z′=f′2/z = 202 / 2000 = 0,200 мм

Разница между точным и упрощённым методами получается меньше, чем глубина резкости.

Какой из методов выбрать?

  • Если расстояние до объекта значительно больше фокусного ‒ используйте упрощённый метод

  • Если они соизмеримы или вы сомневаетесь ‒ стоит предпочесть полный метод

  • Если объект на близком расстоянии, соизмеримом с несколькими фокусными расстояниями объектива ‒ всегда используйте полный

Пример: расчёт фокусного расстояния под требуемое увеличение

Задача:

Подобрать фокусное расстояние объектива для детектирования дефектов на листах металлопроката при следующих условиях:

  1. Расстояние от объектива до листа на валках прокатного стана: 500 мм

  2. Размер пикселя сенсора: 4,5 мкм

  3. Минимальный размер дефекта: 0,5 мм

  4. Минимальное количество пикселей, которое должно занимать изображение дефекта: 4

Расчёт фокусного расстояния под требуемое увеличение
Расчёт фокусного расстояния под требуемое увеличение

Решение:

  1. Найдём минимальный размер изображения: y' = 5*4,5 мкм = 18 мкм = 0,018 мм

  2. Найдём линейное увеличение объектива: y'/y = 0,018/0,5 = 0,036Х

  3. По свойству подобных треугольников y'/y = a'/a. Отсюда: a' = a*(y'/y) = 500*0,036 = 18 мм

  4. Выразим из формулы Гаусса f' и найдём его: f' = aa'/(a+a') = 500*18/(500+18) = 17,375 мм

  5. Округляем фокусное расстояние до ближайшего большего целого числа из ряда возможных фокусных расстояний: 18 мм. Округлять до большего следует потому, что в этом случае изображение будет становиться больше минимально допустимого, а не меньше

Ответ: Фокусное расстояние объектива должно быть не менее 18 мм.

Примечание. Иногда минимальное количество пикселей, которое должно занимать изображение, называют разрешением, например: «Требуемое разрешение дефекта – не менее 4х пикселей». Такое разрешение не следует путать с разрешающей способностью объектива, которую иногда тоже сокращают до слова «разрешение». Подробно о разрешающей способности объективов и сенсоров рассказывается в четвёртой статье курса.

Основные параметры объектива

Из всего многообразия оптических параметров для задач технического зрения интересны в первую очередь:

  1. Фокусное расстояние

  2. Диафрагменное число

  3. Угловое поле зрения

  4. Разрешающая способность

Основные параметры объектива
Основные параметры объектива

Фокусное расстояние (f')

Фокусное расстояние влияет на следующие параметры:

  • Увеличение – чем больше фокусное расстояние, тем больше изображение

  • Угловое поле зрения – чем больше фокусное расстояние, тем меньше угловое поле

  • Глубину резко изображаемого пространства – чем больше фокусное расстояние, тем меньше ГРИП

Иногда в спецификациях на дешёвые трансфокаторы (объективы с переменным фокусным расстоянием) значения максимального и минимального фокусных расстояния не указывают. Вместо этого вводят параметр Оптическое увеличение или Optical Zoom. Это означает, во сколько раз изменяется фокусное расстояние объектива. Например, трансфокатор f' = 10–100 получит в спецификации строчку Optical Zoom 10X.

Примечание. Параметр Цифровое увеличение (Digital Zoom) не имеет отношения к оптике. Это масштабирование картинки, диапазон которого заложен производителем в оригинальный софт.

Диафрагменное число (f-number)

Диафрагменное число напрямую связано с апертурной диафрагмой (так называют диафрагму объектива в оптике, чтобы не путать с другими типами диафрагм). Подробно про апертурную диафрагму и её влияние на изображение написано в третьей статье, так что ниже дана лишь базовая информация.

Диафрагменное число – отношение фокусного расстояния к диаметру входного зрачка объектива: f´/D, когда приведено к единице. Входной зрачок – это изображение апертурной диафрагмы сквозь предшествующую ей часть объектива:

Входной зрачок объектива: изображение апертурной диафрагмы, видимое через впередистоящую линзу
Входной зрачок объектива: изображение апертурной диафрагмы, видимое через впередистоящую линзу

Прикройте диафрагму наполовину и загляните в объектив. Изображение диафрагмы, которое видно через линзы объектива, и есть входной зрачок.

Запомните: диаметр входного зрачка – это не диаметр первой линзы объектива и не диаметр самой диафрагмы. Это диаметр изображения диафрагмы.

В случае отсутствия отдельной диафрагмы (такой, как на фотообъективах), апертурной диафрагмой служит такая оправа линзы, которая видится наименьшей, если смотреть внутрь объектива:

Входной зрачок объектива с резьбой М12. Обратите внимание на разницу диаметров входного зрачка и передней линзы
Входной зрачок объектива с резьбой М12. Обратите внимание на разницу диаметров входного зрачка и передней линзы

Диафрагменные числа нанесены на кольце управления диафрагмой, а если регулируемая диафрагма в объективе отсутствует – то одно неизменное диафрагменное число маркируют на переднем торце объектива.

Диафрагменное число определяет способность объектива собирать свет подобно конусу-воронке, основание которого – диаметр входного зрачка, а высота – фокусное расстояние. Освещённость изображения определяется соотношением: сколько света прошло сквозь объектив и по какой площади [изображения] он распределился:

  • Чем больше диаметр входного зрачка – тем больше света собирает объектив

  • Чем больше фокусное расстояние – тем больше (и потому темнее) изображение

Зависимость освещённости изображения от фокусного расстояния
Зависимость освещённости изображения от фокусного расстояния

Комбинацией этих двух факторов получаем, что чем больше диафрагменное число – тем темнее изображение. Сравниваются диафрагменные числа по знаменателю: F/4 темнее, чем F/2.

Величина D:f´, обратная диафрагменному числу, называется относительное отверстие.

Интересный факт

Как можно заметить, относительное отверстие и диафрагменное число описывают одно и то же. Это историческое разделение: относительное отверстие – это немецкая/советская оптические школы, а диафрагменное число – англо/американская.

Пример №1. Рассчитаем диафрагменное число для одиночной линзы с диаметром 50 мм и фокусным расстоянием 100 мм. В случае одиночной линзы входной зрачок – это её диаметр. Диафрагменное число: #F = f'/D = 100/50 = 2.

Пример №2. На торце объектива написано: F4/200. Это означает: фокусное расстояние объектива 200 мм, диафрагменное число F4, относительное отверстие – 1:4.

Иногда диафрагменное число или относительное отверстие называют светосилой, но это неверно. В оптике светосила – отношение освещённости изображения к яркости предмета: H=E/В. Она пропорциональна квадрату знаменателя диафрагменного числа.

Изменение диафрагменного числа через открытие или закрытие диафрагмы выполняет следующие функции:

  • Регулировка яркости

  • Настройка наилучшей резкости

  • Регулировка глубины резко изображаемого пространства

Эти эффекты взаимозависимы и противоречивы, потому что все три завязаны на одну и ту же диафрагму.

Интересный факт

Если необходимо понять, какой эффект на изображение даёт диафрагма, можно обратиться к статьям и видеороликам фотографов. Однако не стоит особо верить их объяснениям, как именно диафрагма даёт эти эффекты – в таких объяснениях регулярно встречаются ошибки.

Регулировка яркости. Интуитивно понятно: чем сильнее открыта диафрагма, тем больше света проходит через объектив и тем светлее картинка. Если есть выбор между осветлением компьютерными алгоритмами и открытием диафрагмы – выбирайте диафрагму. Коррекция яркости алгоритмами – это искусственное вытягивание изображения, в то время как открытие диафрагмы – естественное увеличение светового потока и повышение отношения сигнал/шум. Особенно сильно алгоритмы уступают открытию диафрагмы в сумерках.

Зависимость яркости изображения от диафрагменного числа
Зависимость яркости изображения от диафрагменного числа

Настройка наилучшей резкости. При закрытии диафрагмы повышается резкость изображения. Это связано с уменьшением аберраций широких пучков – сферической аберрации и комы (подробнее – во второй статье). Однако, если продолжать закрывать диафрагму, с какого-то момента резкость снова начнёт ухудшаться – начнёт сказываться влияние дифракции (подробнее – в четвёртой статье). Чаще всего удобнее найти оптимум.

Зависимость резкости изображения от диафрагменного числа. Фото: Kristina Schmid / Unsplash
Зависимость резкости изображения от диафрагменного числа. Фото: Kristina Schmid / Unsplash

Регулировка глубины резко изображаемого пространства. Чем больше открыта диафрагма, тем меньше глубина резко изображаемого пространства – области, ближе и дальше которой предметы будут размыты. Этот приём используется в портретной фотографии, когда диафрагма открывается широко, и фон за лицом становится размыт:

Зависимость глубины резкости от диафрагменного числа. Источник
Зависимость глубины резкости от диафрагменного числа. Источник

Открытие диафрагмы повышает яркость и контраст изображения, но уменьшает чёткость и глубину резко изображаемого пространства. Закрытие диафрагмы повышает чёткость и глубину резко изображаемого пространства, но делает изображение более тёмным.

Угловое поле зрения (field of view)

Угол в пространстве, который отображается объективом на сенсоре.

Оптическая система объектива осесимметричная, так что любой объектив имеет круглое поле зрения, в которое вписывается прямоугольный сенсор. В итоге в спецификации на объектив (lens datasheet) указывают угловые поля зрения по горизонтали и по вертикали, иногда – ещё и по диагонали. Поля указывают всегда для конкретного формата сенсора:

В таблице выше пример из спецификации трансфокатора. Объектив совместим с сенсором 2/3 видиконовского дюйма, также совместим с меньшими типоразмерами сенсоров: 1/1,8″ и 1/2″. Для каждого сенсора указаны три угловых поля зрения: D – диагональное, H – горизонтальное и V – вертикальное. Для каждого поля зрения указано его максимальное и минимальное значение в градусах.

Диагонали сенсоров (1/2″, 2/3″ и т.д.) измеряются в видиконовских дюймах. Этот особый дюйм – это не привычный имперский дюйм 25,4 мм. Видиконовский дюйм равен приблизительно 2/3 от обычного дюйма или примерно 16,93 мм.

Интересный факт

Видиконовский дюйм – одна из немногих оставшихся в обращении внесистемных единиц измерения, не привязанных к системе СИ и метрологическим эталонам. В XXI веке видиконовский дюйм выглядит как измерение расстояния шагами или дальностью полёта стрелы. Однако в силу инерции общества им продолжают пользоваться.

Если объектив совместим с каким-то сенсором, то он также совместим с любым меньшим сенсором. А вот при попытке поставить сенсор большего размера на его краях возникнет виньетка.

Угловое поле в спецификациях иногда заменяется указанием максимального сенсора, совместимого с данным объективом. При этом само значение углового поля в градусах может отсутствовать.

Разрешающая способность

Разрешающая способность – способность объектива изображать раздельно две близкие точки. Чем выше разрешающая способность объектива – тем более чёткую и резкую картинку он даёт.

Данные о разрешающей способности приводятся в спецификации двумя способами:

  • максимальная разрешаемая частота в фокальной плоскости (в линиях на миллиметр)

  • график частотно-контрастной характеристики (ЧКХ / MTF)

Разрешающая способность: количество штрихов на миллиметр
Разрешающая способность: количество штрихов на миллиметр
Разрешающая способность: график ЧКХ
Разрешающая способность: график ЧКХ

Разрешающей способности объективов, а так же тому, как читать и интерпретировать графики ЧКХ, целиком посвящена четвёртая статья курса.

Дополнительно: глубина резко изображаемого пространства

Глубина резко изображаемого пространства (ГРИП) – область пространства, в пределах которого объектив даёт резкое изображение:

Глубина резко изображаемого пространства
Глубина резко изображаемого пространства

Этот параметр отсутствует в спецификации, так как, помимо характеристик самого объектива, глубина резко изображаемого пространства меняется в зависимости от дистанции наводки и размера пикселя. Но для практических задач необходимо учитывать параметры, влияющие на ГРИП, чтобы уметь её регулировать.

  • Фокусное расстояние – чем оно меньше, тем больше ГРИП

  • Диафрагменное число – чем сильнее закрыта диафрагма, тем больше ГРИП

  • Размер пикселя – чем меньше пиксель, тем меньше ГРИП

  • Дистанция фокусировки – чем она ближе, тем меньше ГРИП (при фокусировке на очень близком расстоянии отрезок z' становится слишком большим)

Выбор объективов

При выборе объектива для конкретной задачи необходимо учитывать следующие параметры:

  1. Фокусное расстояние

  2. Диафрагменное число

  3. Размер максимального сенсора (через него определяется угловое поле)

  4. Разрешающая способность

  5. Тип крепления камеры (например, С-mount) – стандартизированная комбинация крепёжной резьбы и рабочего отрезка. Тип крепления у объектива и камеры должен совпадать, иначе придётся заниматься покупкой или изготовлением адаптеров.

Рабочий отрезок (flange focal distance, flange back range) – расстояние от базового крепёжного торца корпуса объектива до фокальной плоскости:

Резьбы C и CS типа (S означает short). Отличаются разным значением рабочего отрезка: 17,526 мм и 12,5 мм
Резьбы C и CS типа (S означает short). Отличаются разным значением рабочего отрезка: 17,526 мм и 12,5 мм

Примечание. Также существует задний фокальный отрезок (back focal length) – расстояние от последней поверхности последней линзы до фокальной плоскости. Встречаются объективы, фокусное расстояние которых меньше, чем фокальный отрезок.

Рабочий отрезок отмеряется от металла, а фокальный – от стекла.

Тезисы (стоит запомнить)

  • Чтобы получить изображение в компьютере, необходимы объектив и камера.

  • Объектив формирует плоское изображение, с которым совмещается сенсор.

  • Объектив для расчётов можно свести к идеальной линзе и высчитывать необходимые параметры по её формулам.

  • При наблюдении вдаль изображение лежит в фокальной плоскости объектива; при наблюдении вблизи изображение отдаляется от фокальной плоскости, и объективу требуется перефокусировка на конечное расстояние.

  • Фокусное расстояние и угловое поле зрения обратно пропорциональны. Чем больше фокусное расстояние, тем больше увеличение, но тем меньше поле зрения.

  • Входной зрачок объектива – это не диаметр его первой линзы и не диаметр самой диафрагмы. Это диаметр изображения диафрагмы.

  • Диафрагменное число – отношение фокусного расстояния к диаметру входного зрачка.


Дополнительная литература

Для тех, кто хочет почитать про оптику подробнее:

  1. В.Н. ЧуриловскийТеория оптических приборов, 1966 – фундаментальное пособие по прикладной оптике (несколько устаревшее, но теория описана хорошо)

  2. Б.Н. Бегунов, Н.П. Заказнов, Теория оптических систем, 1973 – попроще и покороче, чем Чуриловский.

  3. Smith, W. J., Modern Optical Engineering, 2000 – фундаментальное пособие по прикладной оптике на английском языке, тоже попроще, чем Чуриловский.