Comments / Profile of borges / Habr

How to become an author

Vladimir Larin @borges

Senior Data Scientist

Profile Publications 6Comments 59Bookmarks 25

Licenzero: ищем порно по цвету кожи

borges Apr 8 2011 at 11:09

Да что же всем дались эти негритянки? ;)
— Негритянки, конечно детектятся немного хуже,
— это «немного» не настолько большое, чтобы сильно влиять на точность итоговой классификации ролика,
— кроме того, видео с негритянками на видеохостингах встречается не так часто (ну это субъективно, точных исследований мы не проводили), то есть, даже если бы они детектились еще хуже, это не так сильно влияло бы статистику классификации некоторой средней выборки роликов.

+4

Licenzero: ищем порно по цвету кожи

borges Apr 8 2011 at 10:58

Вы это про синие и красные столбики?

А вообще да, мы решили выкладывать по пятницам, чтобы народ отвлекался от грустных мыслей о дедлайнах и завалах на работе.

+21

Licenzero: ищем порно по цвету кожи

borges Apr 8 2011 at 10:50

Я походил по ссылкам, посмотрел. Все-таки детектить кожу на фото и видео — разные вещи. В видео часто не очень хорошее освещение, неправильная цветовая температура, всякие артефакты от пережатости кодеками.

Графиков для HSV нет, потому что цветовую модель мы выбирали в самом начале работы, уже давно. И графиков с тех пор не осталось.

На ОpenCV мы смотрели в процессе работы постоянно, на ни в одном нашем детекторе так и не использовали. Потому что нам важен доступ к коду на самом низком уровне, а не просто использование API. А ковырять такой космический корабль, как OpenCV не очень хочется.

+5

Licenzero: ищем порно по цвету кожи

borges Apr 8 2011 at 10:43

Ну, зависит от того, насколько чернокожие.

+3

Licenzero: ищем порно по цвету кожи

borges Apr 8 2011 at 10:38

Кстати да. До этого я писал о роликах, которые неправильно определяются как видео, а вот в обратную сторону — среди ненайденного порно лидирует как раз bdsm.

+4

Licenzero: ищем порно по цвету кожи

borges Apr 8 2011 at 10:38

Кстати да. До этого я писал о роликах, которые неправильно определяются как видео, а вот в обратную сторону — среди ненайденного порно лидирует как раз bdsm.

0

Опубликован код алгоритма Predator

borges Apr 6 2011 at 22:55

Например, здесь:
github.com/teknovibe/TLD
github.com/Magicdream/TLD
github.com/bitemyapp/TLD
github.com/noomerikal/TLD
github.com/davidyang/TLD

+1

Licenzero: простые движения

borges Apr 5 2011 at 10:19

Не для отдельного ролика, а для целых роликов. Мы тестируем на 3500 роликах. 1500 — специальные порноролики, 2000 — случайные пользовательские ролики.
По времени работы я пока не писал, потому что мы используем и CPU и GPU (CUDA), в дальнейшем GPU будем больше использовать. А сейчас пока 1 минута видео обрабатывается приблизительно за 30 секунд (на одном ядре CPU).

0

Licenzero: простые движения

borges Apr 4 2011 at 17:00

Да-да. Поэтому и не стали в пятницу публиковать, чтобы не мешать с первоапрельскими постами.

0

Licenzero: простые движения

borges Apr 4 2011 at 12:56

Точных замеров мы еще не делали, поскольку еще есть идеи по улучшению правильности классификации (то есть, пока приоритет у нас — минимизация ошибки). Но приблизительно — полминуты работы одного ядра процессора на минуту видео (правда, сюда же включено время декодирования видео ffmpeg-ом).

0

Licenzero: простые движения

borges Apr 4 2011 at 12:26

Видео пропускается через фильтры вот такого вида:
spatio-temporal filter

spatio-temporal filter

После чего мы получаем количественные показатели движения по разным направлениям. Эта картинка приблизительная, точнее я не нашел, а вообще детектор движения делал spsp. Он лично общался с теми людьми, которые разрабатывают это направление, он и писал код детектора. Если интересно, напишите ему, он обязательно ответит.

+2

Licenzero: простые движения

borges Apr 4 2011 at 11:58

Ага, думали над тем чтобы классифицировать порно. Но, конечно, дальше шуточек дело не пошло.

+4

Licenzero: простые движения

borges Apr 4 2011 at 11:57

Да, справляется. Главное чтобы движения были ритмичными. А названий фильмов, к сожалению, не знаю. У нас для тренировки использовались в основном небольшие ролики с видеохостингов.

+1

Licenzero: простые движения

borges Apr 4 2011 at 11:51

Так здесь же примеры. Первый ролик — пример работы детектора, остальные — примеры неправильного отнесения роликов к классу порно.

+1

Licenzero: простые движения

borges Apr 4 2011 at 10:41

Конечно мы так и делаем. Про звук статья еще будет. Мы просто решили писать про каждый детектор в отдельности, потому что они сильно разные, различное время было потрачено на разработку, различные технологии применялись.

+11

Licenzero: порно детектед

borges Mar 25 2011 at 19:46

Да, это конечно видели. Не знаю, как сейчас у них обстоят дела, но когда только это нашли, не смогли нормально протестировать точность классификации. К тому же, работала эта штука очень долго.

0

Licenzero: порно детектед

borges Mar 25 2011 at 13:05

Ага, точно. Бывают и такие. когда говорит и ритмично головой кивает.

+4

Licenzero: порно детектед

borges Mar 25 2011 at 12:29

Чтобы оценить точность работы, мы тестируем на выборке, в которой мы уже руками отделили порно от непорно. А когда система работает, все зависит от пожеланий заказчика. В общем случае, мы говорим (автоматически), где порно, а где нет, при этом ролики сортируются по «порнографичности» (для удобства модерации, если она есть). Можем так же вырезать самый «порнушный» фрагмент ролика.

0

Licenzero: порно детектед

borges Mar 25 2011 at 12:22

Руководством нашей компании.

+5

Licenzero: порно детектед

borges Mar 25 2011 at 12:14

Вообще, негритянки, Шарапова — это все не то. Классификатор чаще ошибается на роликах, где гитаристы крупным планом играют руками на своих желтых гитарах, или бабушка (опять же крупным планом) руками вяжет свитер, или трудолюбивый слесарь обрабатывает деталь драчёвым напильником.

+43

2