ymik May 29 2009 at 01:34

Face Detection на джаве — это просто!

1 min

29K

Java *

+65

Comments 76

433t May 29 2009 at 03:50

круто) даже не знал, что такие технологии настолько доступны :)

nerezus May 29 2009 at 06:48

НУ как бы не очень сложное оно, у меня одногруппник на 3ем курсе писал такое.

ymik May 29 2009 at 07:08

написать-то можно, только замаешься потом калибровать: там жеж не только нормализация, но ещё и тренировка алгоритма

В примере есть строчка «cv.cascade(»haarcascade_frontalface_default.xml");" — это как раз и есть загрузка предварительно сгенерированного каскада (они идут в комплекте вместе с OpenCV)

ymik May 29 2009 at 07:09

я тоже не знал, что можно вот так просто :) потому и делюсь.

Q2W May 29 2009 at 04:48

Очень полезная штука, спасибо!
Есть пара вопросов:
— Как у этого модуля с производительностью? Какие-нибудь тесты делали?
— Какой минимальный размер лица в пикселях распознаётся?

ymik May 29 2009 at 07:13

Тестов не делал, но с производительностью должно быть всё хорошо: OpenCV используется для захвата лиц из потокового real-time видео с уличных камер. Ну и до кучи все эти «Moution Eye» от сони тоже, в принципе, используют эту открытую библиотеку. С точки зрения же джавы там тоненькая прокси прослойка над апи нативной либы.

Минимальный размер пикселей задаётся каскадом. Какой каскад будет — такой и минимальный размер :)

Inco May 29 2009 at 11:35

насчет производительности… а какое железо и размеры кадра? =))
я гибрид этого метода и интенсивности карт разгонял для поиска лиц на живом видео в реалььном времени.

НО у каскадов openCV система обучена искать на видео очень хорошего(!) качества, не приемлемого для камер наблюдения к примеру =(
на телефонных камерах та же проблема =)
решал её наверно с полгода =)

multifinger Jun 6 2011 at 23:55

распознавал для диплома аватарки из контакта, 15-20 пиксельное лицо довольно хорошо находит, при этом «ложных срабатываний» в разы меньше, чем «нераспознанных лиц»
лица расположенные на изображение под углом не распознает, но это можно доработать добавив поворот на pi/2 и pi
производительность для изображений ~200х200 около 200мс на изображение (это вместе с чтением/записью в файл с рамочкой), но зависит от параметров

Q2W Jun 7 2011 at 09:21

Это на каком железе?
Фотки предварительно отбирали как-то для теста?

multifinger Jun 7 2011 at 09:26

AMD64 4400+
фотки не отбирал, там хорошая выборка лиц / не лиц получается
также наглядно видно в каких местах алгоритм не справляется

neelts May 29 2009 at 05:14

Порт на Actionscript 3.0:
www.libspark.org/wiki/mash/Marilena

Пример:
maaash.jp/lab/Marilena_sample/

FlashPro May 29 2009 at 06:31

Каким образом можно оттуда скачать?

neelts May 29 2009 at 06:45

www.libspark.org/browser/as3/Marilena/trunk

ymik May 29 2009 at 07:22

ценно!

dOkI May 29 2009 at 05:21

Вах, давно хотел подобное поюзать. А то, что это кросплатформенно и есть ява биндинг ещё больше усилило стремление попользовать. Спасибо за ценный топик.

Prometheus May 29 2009 at 05:24

Круть!
Еще бы умел OpenCV «снимать» параметрические показатели лица — ваще цены бы ей небыло!

ymik May 29 2009 at 07:23

Параметрические показания можно и самому сделать, благо алгориты нормализации пространства доступны из того же OpenCV.

Prometheus May 29 2009 at 07:34

Жуть как интересно :)
Это ж можно распознавание лиц сделать.
И вместо того, чтоб носить с собой на работу «электронную бирочку» для входа в офис — просто поглядел в объектив видеокамеры, нажал кнопочку «открыть дверь», система подумала, серверок пошуршал у себя, сравнил данные с видеокамеры с данными сотрудников. И открыл || не открыл дверь.
Круть! Уже хочу!

ymik May 29 2009 at 07:46

к распознаванию — это сюда: faint.sourceforge.net/ :) Ребята забацали «The Face Annotation Interface» на основе всё того же OpenCV. Для определения лиц используют алгоритм «EigenFace»

Prometheus May 29 2009 at 07:51

Спасибо за ссылочку!
Попробуем, чего у ребят получилось

vkle May 29 2009 at 08:36

Особо следует пробовать летом и зимой, с бородой и без =)

Prometheus May 29 2009 at 09:47

Насчет зимой/летом — не знаю, но вот уверен чтоб уменьшить возможность подтасовки и прочих хаков (например фотки босса, как предложил Quadrix), нужно будет обязательно сделать «тесты» объекта.
Подходишь к небольшому терминальчуку, смотришь туда, система выдает, а теперь покажи язык :) А теперь скорчи рожу, а покажи как ты сердишься, а представь теперь, что ты удивлен :)))
Смотрим на реакцию лица, сравниваем с эталонами сотрудника — если ок:
— ты наш чувак, проходи!

vkle May 29 2009 at 09:48

Фух… уж лучше приложить ключ-таблетку.

Prometheus May 29 2009 at 09:55

Ключ-таблетка — это просто и неинтересно :)
А тут такое веселье перед началом рабочего дня.

Nashev May 31 2009 at 10:31

Фотоальбом шефа с собой таскать ;)

ooprizrakoo May 29 2009 at 11:06

Ага. Помнится, захакали такую систему довольно просто — показывали видеокамере распечатанную фотографию «нужной» персоны :)

Quadrix May 29 2009 at 07:51

Буду с собой таскать фотографию босса ;)

nblxa May 29 2009 at 05:46

Компьютерное зрение, говорите? Так вот чем надо капчи распознавать.

UFO landed and left these words here

nblxa May 29 2009 at 06:02

Почему? По-моему, как раз то самое: распознавание форм, поиск контуров и т.п. — разве нет?
Я никогда не пользовался OpenCV, да и другими библиотеками компьютерного зрения, так что поправьте меня если я неправ.

mv200580 May 29 2009 at 06:11

Насколько я понимаю, распознавание символов не есть задача систем компьютерного зрения. Вернее это более частный случай для которого существует целый класс OCR систем, и на java в том числе.

whtiger May 29 2009 at 06:31

после соответствующей настройки OpenCV будет обводить буквы кружочками =)

samlowry May 29 2009 at 08:30

Да, и будет говорить: «это каптча!» или — «нееет, это совсем не каптча».

nblxa May 29 2009 at 11:21

Ну, так не интересно :)

UFO landed and left these words here

jandosul May 29 2009 at 06:31

А для PHP екстеншн есть?

stand_up May 29 2009 at 06:48

Такое, по мойму, лучше написать как серверное приложение и просто юзать из php.

ymik May 29 2009 at 07:04

как ни странно, есть

jandosul May 29 2009 at 08:20

к сожалению андер уйндоус не нашел а так спасибо огромное

SovGVD Jun 7 2009 at 17:00

есть… побаловался даже =)

Интересно можно заставить это не только находить лица, но и распознавать кто на фотографии? =) Было бы удобнее вконтакте так выкладывать — выложил фотографию и уже всех друзей на ней отметило.

Untit1ed May 29 2009 at 06:48

<irony>Rectangle</irony>

ymik May 29 2009 at 07:14

и что?

Untit1ed May 29 2009 at 09:39

на фото такой ректангл.

neelts May 29 2009 at 07:36

видимо высмеивается красный кружок в примере вместо прямоугольника

ymik May 29 2009 at 07:46

о.

tempuser May 29 2009 at 08:38

Спасибо огромное! Действительно интересная вещь и любопытно хотя бы поиграться.
То что подобные библиотеки есть open source — просто замечательно.

ymik May 29 2009 at 10:29

да не за что — сам ненарадуюсь)

LDEV May 29 2009 at 09:53

Мега! Мегавещь! Очень нехватает в соц.проекте! Уже сижу в консоле — ставлю пакеты под php :))

ymik May 29 2009 at 10:30

ну, если честно, то под пхп я бы с этим аккуратно — сожрёт жеж всю память и не выплюнет!

LDEV May 29 2009 at 10:32

отдельным демоном его :)

ymik May 29 2009 at 12:46

жёстко! Не проще ль тогда написать на сях простенький CGI-REST и обращаться к нему из пыха?

LDEV May 29 2009 at 12:49

Да зачем выкручиваться так? Модуль уже скомпилировал, тестирую вот — работает очень быстро, результат очень хороший — показывает отлично. Процессор не грузит.

ymik May 29 2009 at 12:56

что по памяти?

LDEV May 29 2009 at 13:58

2 ядра, 2 гига, полет нормальный (20 фоток 500х600 в одном потоке, uptime не более 1.0)

на продакшин пока не пихал, как запустим проект — сделаю фишку для «фоток», там посмотрим. Памяти хватало всегда.

ymik May 29 2009 at 14:09

а что за проект? Ссылочку можно?

LDEV May 29 2009 at 14:11

глубокая альфа, недели 2 еще и будет открыто. Думаю Хабр поможет положить сервер :)

ymik May 29 2009 at 14:16

оу.

thevery May 29 2009 at 11:28

а как в андроиде сделано не смотрели?

ymik May 29 2009 at 12:41

Не смотрел. Но подозреваю, что там тоже есть OpenCV.

Inco May 29 2009 at 11:33

Написание детектора лиц на С++ занимает не больше 5 страниц кода с нуля. и работает не хуже чем openCV =))

ymik May 29 2009 at 12:42

Его ж ещё обучать надо… Сама имлементация да, занимает немного.

csfmeridian May 29 2009 at 11:36

Сейчас пишу курсовую, две камеры снимают руку, и движение руки переводится в 3d-модель. Пишу на С# c использованием Aforge.NET Framework — библиотека для работы с нейронными сетями, ИИ, обработка изображений. Классная вещь вобщем… =)

ymik May 29 2009 at 12:45

прикольно! А посмотреть на результат можно где-нибудь?) Скажем, видео.

csfmeridian May 29 2009 at 17:10

Результат работы моего приложения или библиотеки вообще? ))

ymik May 29 2009 at 20:58

лучше приложения)

csfmeridian May 29 2009 at 17:20

Вот вобщем две ссылки:
www.youtube.com/watch?v=4fStBSob3i4 — трекинг шарика с двух камер + Lego Robotics, всё для работы с Lego уже есть в AForge.

www.youtube.com/watch?v=lKkGOUW_xas — распознавание жестов рук.

www.aforgenet.com/ — собственно сама ссылка на проект, лицензия LGPL.

p.s. если имелась ввиду моя работа, то она еще не готова, курсовая расчитана на 2 семестра, вобщем допиливать еще много))

ymik May 29 2009 at 20:59

прикольно) но о работе по завершению уж отпишитесь, а?)

csfmeridian May 29 2009 at 21:09

Ок, обязательно)) Может еще статейку напишу про aforge.

telegamochka May 29 2009 at 13:45

Перепостила на community.livejournal.com/ru_wearable/54285.html со ссылками на оригинал и автора. Если Вы против — скажите, уберу копию Вашей статьи.

ymik May 29 2009 at 14:10

нет проблем. Можно поставить линк на ЖЖ — ymik.livejournal.com

telegamochka May 29 2009 at 14:12

Ок, спасибо :)

ymik May 29 2009 at 14:16

и ссылки поставьте, а то не понятно, что за JNI интрфейс и всё такое :)

impass May 29 2009 at 14:56

лучше бы объяснили, хотя бы вкратце, принцип работы применяемого алгоритма, а как юзать те или иные библиотеки, думаю, никого не надо учить

ymik May 29 2009 at 15:04

В тексте я указал название алгоритма — это широко известный алгоритм Виолы-Джонса. В гугле не составит труда найти развёрнутые описания работы алгоритма. Так что описывать их тут бессмысленно, разве что перевести на русский.

Вот, например. Или вот.

Nashev May 31 2009 at 10:40

Перевести — тож вполне полезно :)

almozavr May 29 2010 at 13:43

А у меня вопрос из прикладной области:

скажите, как обойтись без установки библиотеки в операционной системе, а использовать внутри своего проекта на java? Прослойка между openCV и java отличная получается, но заставлять пользователя дополнительно к проекту отдельно ставить библиотеки не хочется, сами понимаете.
Известно, как обойтись без установки на с++, а что насчет Java?

Заранее спасибо.