Невидимое око



    В принципе, современные технологии обеспечения доступа, автоматизации, а также уровень развитости беспроводных устройств позволяют собрать для любого, сколь-нибудь территориально ограниченного, предприятия волшебную «карту Хогвартса», подобную той, что была в распоряжении у Гарри Поттера.

    И никакой магии не понадобится. Да что там — вполне себе обыденные технологии. Если вы для доступа в свой офис используете электронный пропуск, то в автоматическом режиме на КПП уже поступает достаточно информации о том, где вы находитесь (или где вы в последний раз прошли через турникет), сколько времени вы провели внутри объекта (на своем рабочем месте) и т.д. Наша компания давно разрабатывала систему визуального контроля на предприятии, но, совсем недавно, нам посчастливилось внедрить все наши наработки. Заодно рассказать аудитории о том, какие требования предъявляются к подобным системам со стороны заказчика.

    Дипломированные маги начинают пригождаться тогда, когда обычная система должна быть расширена. Чаще всего заказчик (имя которого, в этот раз, мы не можем назвать) добавляет настолько нетривиальную изюминку, что система трансформируется во что-то иное. В нашем случае такой изюминкой был биометрический контроль, причем, в его самой технологически сложной форме — сопоставление изображения лица в реальном времени.



    Визуальный контроль столь сложен по той причине, что его потенциальные возможности практически неограниченны, но при этом существует огромное количество тонкостей и барьеров, не учитывая которые, эффективный результат работы такой системы может быть сведен на нет.
    Банальный пример — в уличном видеоконтроле свет играет важную роль, так как с наступлением сумерек видимость снижается критически и приходится использовать дополнительные инструменты.

    Лицо человека — самый простой «маяк» на карте объекта, видя его, вы понимаете, можете вы пропустить человека внутрь или нет. Вместе с этим возникают побочные требования, которые сам человек уже не в состоянии удовлетворить. Поэтому почти всегда визуальный контроль — это трудо- и ресурсо-емкая задача.

    В нашем конкретном случае было два «тонких» момента:

    А. Нестандартный для России подход — отказ от «административного ресурса» и принуждения предъявлять документы для идентификации; наоборот — полная незаметность работы комплекса.

    Б. Работа в потоке с вероятностью срабатывания выше 95% при минимальном времени распознавания. Это значит, что вне зависимости от того, в каких условиях происходит контроль и как ведет себя объект, система должна идентифицировать и сопоставить информацию с базой пропусков. Невыспавшиеся, небритые, прячущие глаза и т.д. — всем знакомо.

    При нормальной прямой видимости и «матрице» высокого качества система идентифицирует человека мгновенно.



    • Запрос информации о местах нахождения сотрудников/посетителей в определенный промежуток времени
    • Ожидание появления сотрудника/посетителя в определенном месте
    • Запрос информации о местоположении сотрудников/посетителей, присутствующих на объекте
    • Настройка описания нового объекта
    • Запрос информации о событиях в системе
    • Сбор статистики в рамках “мобильного комплекса”
    • Работа в автономном режиме


    Примерно так и выглядит типичный список требований к системе, подобной нашей — и мы взяли их как основные. Плюсы подобных систем очевидны: один раз всего лишь сфотографировав человека, вы можете выписать ему «пропуск».

    Есть список «белый», но есть и «черный». При этом, человек, который потенциально может быть в вашем черном списке, скорее всего, не будет вам позировать по собственному желанию — именно в таких случаях чаще всего и возникают трудности, когда нет хорошего качества «матрицы» для распознавания лица человека.

    Тем не менее, нам удалось добиться высокой работоспособности ограничительной функции системы. Например, можно выдать человеку пропуск только на определенный маршрут: «туда не ходи — сюда ходи». Подобная система применяется в университете Токио, где любой посетитель без «авторизации» на КПП может попасть в определенные объекты, остальные же остаются доступными лишь для лиц с полноценным пропуском.



    Конечно на уровне логики система видеораспознавания и система контроля — два разных объекта. Они интегрируются с помощью API, предоставляемого системой видеоконтроля. Так как максимальное количество лиц, одновременно «считывающихся» во всех кадрах, может быть огромным, а качество их фотографий — разным, нами был собран мощный аппаратный комплект, на котором базируется вся система. Отдельный момент – для достижения еще большей производительности мы активно применяли методы кеширования.

    Теории заговора нет — есть лишь небольшая «интеллектуальность» системы, которая умеет сопоставлять фотографии из базы с изображением с камеры с указанием «соответствия», выраженной в процентах.

    В остальном потенциал использования такой системы кроется, в первую очередь, в той статистике, которую она предоставляет. Тут и кадровые техники, и чисто логистические. В нашей стране это по-прежнему многим в новинку, несмотря на то что большинство развитых сообществ уже взяли на вооружение электронный транспорт, общественные и социальные услуги.
    R-Style
    45,05
    Компания
    Поделиться публикацией

    Комментарии 30

      +2
      Как страшно жить…
        +11
        Вы бы лучше написали, как это было реализовано, а так — впустую потраченное время на чтение.
          +1
          Что именно вас может интересовать из фактической реализации? Так как на нас наложен ряд органических ограничений по распространению информации, вам придется задать конкретный вопрос, для того, чтобы получить конкретный ответ.
            +6
            Нельзя просто так взять и рассказать
              +1
              К сожалению
              +5
              Тогда зачем вы вообще писали статью? По содержимому — это чистая реклама вида «А посмотрите, как круто мы можем!»
              Какое ПО вы использовали, какое железо, как всё это работает и во сколько обошлось хотелось бы увидеть.
                +1
                И «что нового» и чего нет хотя бы по сравнению с тем же Университетом Токио, упомянутом в посте. Что сделали сами, а что взяли уже готовое. А так получается рекламный набор фотожаб и каких-то иллюстраций на фоне пары очевидных соображений.
                  –1
                  Вы пишете так, как будто были в Университете Токио — так просветите нас, какие решения используются там и в каком масштабе.
                    +1
                    Вот как раз в Токийском и не был, поэтому и спрашиваю :) Это Вы с ним начали сравнивать и тут же прекратили. Не стесняйтесь, поведайте подробности. Если не можете про свою систему, так хотя бы про их. А так пост — «ниачем».
                      –2
                      То что вы просите, материал совсем другого порядка, к нашей компании не относящийся.
                      Если «ниачем» — проходите дальше, не тратьте время.
                        +1
                        С удовольствием теперь так и поступлю! Однако именно Вы и Ваша компания схватили меня за руку со словами «читай, смотри», опубликовав это сообщение. Может Вы и отказались от некоторых региональных особенностей, типа
                        Нестандартный для России подход — отказ от «административного ресурса» и принуждения предъявлять документы для идентификации;
                        Однако все остальные черты (агрессивное и грубое неприятие любой критики, невежливая манера общения) Вы культивируете в лучших традициях :) Поэтому встречное предложение: не засоряйте ресурс.
                          –2
                          Не очень хочется разводить полемику, но прийдя в комментарии к данной публикации со своим частным мнением, отсутствием конструктивной (а не «любой») критики, и, фактически, лишь для того чтобы потроллить нас и потратить общее время, вы изначально находитесь в позиции, в которой с вами не хочется вести диалог.

                          Задавайте конкретные вопросы — получите конкретные ответы. Никто ведь не отказывается на них отвечать. Но вы не вопросы задаете — вы предлагаете написать другую публикацию. Это просто несерьезно :)
                            +3
                            Зацепится не за что, потому и вопросов не задают.
                            Вы сами не оставили в посте тем для вопросов.
                              0
                              Возможно, такое имеет место быть. Причины мы озвучили.
                              В следующий раз постараемся отбирать для рассказа те проекты, где все можно изначально разложить «по-полочкам».
                  –1
                  Так как конкретных вопросов (по аналогии с хабрачеловеком, задавшим вопрос, чуть ниже) от вас не поступило — отвечаем в доступной форме:

                  ПО — от крупнейших мировых вендоров и самописное.
                  Железо — от крупнейших мировых вендоров, сами не умеем.
                  Как-то работает.
                  Во-сколько-то обошлось.
                    +1
                    Океей, тогда будем писать статью за вас.
                    Какую площадь покрывает ваш комплекс, особенности проектировки помещений? Сколько камер в комплексе используется?
                    Какие проблемы были при монтаже?
                    Какие наименования оборудования и какие наименования протоколов используются в вашей сети?
                    Какую архитектуру программную использует ваш комплекс? Почему вы выбрали именно эту архитектуру?
                    Какие наименования ПО вы использовали для решения ваших задач? Почему именно это и как вы пришли к этому выбору? Какие трудности возникли при интеграции ПО и как они были решены?
                    Какие сложности возникли при тестовых запусках и как они решались?
                    Оценочная стоимость проекта и какая сумма ушла по факту на реализацию проекта?
                    В конце — пара слов о том, какие вы крутые, и как доволен остался ваш заказчик.

                      0
                      Другое дело.
                      Сейчас попробуем ответить на все ваши вопросы.
                        +1
                        А что мешало написать это с самого начала? Это классическая компоновка статьи хабра про монтаж нового датацентра/новой системы управления/etc
                          0
                          То, что наш заказчик может быть против публикации части таких сведений, так как они позволят воспроизвести систему, либо найти намек на слабые места в реализации системы, что может привести к ее компрометации.

                          Когда вы задаете вопрос, а мы транслируем его специалистам — они отвечают «если можно» и не отвечают «если нельзя». По этой причине — не рассчитывайте получить развернутый ответ на 100% вопросов.
                            +1
                            А где ответы? )
                          +4
                          Это не другое дело, а, как верно подметил Krypt, выполнение Вашей работы за Вас. Публика голосованием и комментариями производит оценку поста. На данный момент неудовлетворенных 40% (по голосам). Вы себе представляете, чтобы такой материал был опубликован хоть в каком-то издании с предварительным рецензированием? Зачем начинать говорить о том, что нельзя рассказывать? Да ещё заранее не знать четко рамки дозволенного…

                          Проведу аналогию. Вы вышли с работой на презентацию. Рассказали общие слова. А потом Вы, официальный представитель, публичное лицо, на общие замечания отвечаете, что они неконструктивны, а на конкретные технические заявляете прямо с трибуны: «Погодите, мне надо спросить специалиста! Сам я этой подробности не знаю, а про эту не уверен, что разрешает говорить начальство».

                          Надо же самим заранее продумывать основные и очевидные вопросы, самим на них давать ответ, узнав все заранее. Обо всём этом писать/готовить слова к выступлению. А уже потом выходить на публику. Я неправ? А то как раз несерьёзным именно Ваш подход представляется.
                    0
                    Вот конкретный вопрос — идёт человек, смотрит в пол. Как ваша система его идентифицирует?
                  +1
                  Насколько я понимаю, распознавали лица по скриншотам с видеокамер.
                  Два вопроса:
                  1. Насколько качественные видеокамеры использовали?
                  2. Сколько человек одновременно ваша система может распознать в реальном времени с одной камеры?
                    +2
                    1. HD-видеокамеры
                    2. При близкой к 100% видимости каждого лица в объективе в момент времени — десятки лиц могут быть распознаны, даже с одной камеры.
                    Если человек не скрывается, то его лицо видно, а соответственно — распознаваемо.
                    Опять же, все зависит от качества «матриц» для сравнения. Если исходное изображение высокого качества — то и части лица может быть достаточно для сопоставления.
                      +3
                      Если более точно, то вот вам ответ от инженера-проектировщика системы:

                      1. Использовались несколько IP-видеокамер с разрешениями от 720P (для контроля узких проходов шириной от 1-3 метров) и 1080P (для контроля широких проходов/холлов шириной более 3 метров).

                      2. В процессе тестирования, реализации и эксплуатации ограничений не наблюдалось, так как модульный/распределенный принцип построения системы позволяет увеличивать пропускную способность посредством запуска к примеру еще одного процесса верификации на том же или на другом сервере с привязкой к одной и той же камере. Все зависит от мощностей «железа» и распределения нагрузки.
                      0
                      .
                        +3
                        Без технических деталей реализации в вашей статье, то про такое люди не только читали, но даже видели уже почти вживую:

                        image

                        image
                          –2
                          За вами выехали.
                            0
                            Я в том городе в живую был — если бы хотели, то там бы повязали на месте.
                          0
                          Ччто использовали в качестве средства выделения вектора признаков для детектируемых лиц? В качестве классификатора?
                          Какая достигнута практическая разрешающая способность системы — то есть какой уровень false positive / false negative при каком количестве людей в базе.
                          Как проводится (до)обучение классификатора при поступлении нового класса (лица)? Нового сэмпла известного класса? Как боретесь с переобучением и противоречащими данными?

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое