Как стать автором
Поиск
Написать публикацию
Обновить

Комментарии 39

Предложил когда-то одному из поисковиков, сослались на отсутствие необходимых технологий. Но это дело времени, к тому же базовые технологии все же есть.
1, 2, 3, 4, и многие другие.
4 — не работает вовсе.
3 — ничего не находит даже если слова дописывать. На обну картинку сказал «ничё не покажу, там типа картинки для взрослых». Отключил фильтр, ничего нету.
2 — кое-что умеет. Текстуру может подыскать.
1 — c цветом (и долей его на картинке) хорошо подбирает
Можете смело добавлять к целевой аудитории: «4. image squatters».
Так и не смог понять что это такое :( (гугл и промт не помогли - у меня отказываются работать их переводчики).
Вы знаете, чем занимаются киберсквоттеры? Что такое image, думаю, объяснять не нужно.
Понятно. Скажем так - захватчики рисунков? Теперь я не понял чем им поможет такой сервис?
Ну многие ищут картинки, особенно жёлтая пресса и второсортные издания на файлстоках, а тут …***называется нашел под определённую статью.
По крайней мере в том варианте который я продвигаю — этот фокус не пройдет. Дело в том, что чтобы искать копию — нужно будет иметь один экземпляр — а для указанных Вами лиц его будет достаточно. Я предлагаю искать полные копии а не содержащие например только чье то лицо (оно по крайней мере должно будет быть в том же ракурсе).
А что касается похожих лиц — то для этого уже есть действующие проекты — вроде ссылки где-то в комментах есть.
Rational Rose был раньше, не знаю что с ним сейчас.
Тьфу, зарапортовался. Polar Rose.
Думаю такого объёма услуг нет (хотя могли бы быть например на сервисах типа геттиимаджес, чтоб подбирать в тон и в тему) просто потому что всё упирается в железо. То есть даже если изображение проиндексировано относительно небольшим массивом цифр, всё равно затраты машинного времени куда больше обычного поиска и во много раз больше при индексации.
Судя по тенденциям развития железа и ПО, это уже скоро не будет проблемой.
Надеюсь. Хоть на что-то полезное железомощь потратят. Но пока фак остаётся фактом: Яндекс ищет (а значит и индексирует) дополнительно по общей гамме и диапазону размеров.
Я слышал какая то компания просто добавляет в картинки информацию (JPG BMP позволяет точно), по-моему там они брали очертания и цвета, но суть в том чтобы юзер после прогонки мог найти не используют ли его изображение в интернете.
Т.е. это легче новый формат продвигать.
Против копирования данные типа EXIF никак не спасут. Можно и принтскрин нажать и распечатать и просто hex-редактором порезать эти данные на крайняк. В png тоже инфоблок есть, но он обычно после оптимизации режется. Изображение может распознать только человек. Бывает подправляют очень многое на фотке, не сразу и вспоминаешь что за исходник был. Так что комплексно надо обрабатывать картинку: очертания, пятна (композиция). А потом всё это ещё и вертеть в плоскости, чтоб свериться. Цвет как таковой идёт в последнюю очередь.
Ну могу предположить что вектора легче искать, если привязать их к картинке, так чтобы после Hex'а их нельзя было нормально смотреть, может это уже векселем смахивает, но всё же.
Вообще-то таких идей можно генерировать десятки в месяц. Что дальше то Вы будете с ними делать? Как Вы это реализуете на практике?
Механизм предложил тут - пока буду вот так вот собирать мнения и информацию об аналогах, а также искать желающих взяться за реализацию. Все лучше чем ничего не делать.
Есть альтернативные предложения?
Отдавать себе отчет в технической сложности затеваемых проектов. Google занимается тем, что индексирует сотни миллионов страниц. Вам придется сделать тоже самое, при этом Вы собираетесь устанавливать близость текстов и графики (!) нечетким сравнением. Это вообще за гранью реальности для таких масштабов. Вы хоть примерно представляете себе, КАКАЯ математика стоит за сравнением фото или видео? Что такое с технической точки зрения "поиск незаконно продвигаемого контента"...
Если бы всегда исходили из того, что что-то сделать сложно - вообще не было бы и интернета, и гугла и вообще ничего круче колеса! Я прекрасно понимаю что это сложно, но возможно. Все реально. Если будет соответствующий спрос - делать будут те кто в этом шарит т.е. профессионалы. Понятия не имею что за математика за этим стоит (я вообще много чего не знаю), но наша страна к счастью учит много тех кто знает :) - каждый должен заниматься тем что у него получается. Вообще, следя за темпами развития техники и технологии все больше склоняюсь к мысли что техническая часть проектов вторична и решаема - проблемы в другом, спрос (платежеспособный) и исполнители. Кстати близость текстов уже определяется - проект антиплагиат.ру
Флаг Вам в руки. Мысль о вторичности технической части проекта наивная. Типичное заблуждение начинающих предпринимателей (без обид) - когда кажется, что Ваши идеи перевернут мир, стоит только нанять кучу программистов. На самом деле ВСЕ идеи такого рода вообще ничего не стоят, если у Вас нет гениальных инженеров, нет команды. И найти их - это не вопрос денег. Google создан не просто гениальными предпринимателями, но и гениальными инженерами (программистами). Деньги сами по себе ничего не значат, это не нефтяной бизнес и не розничная торговля.
Техническую часть проекта будут обеспечивать гениальные инженеры и программисты :) - про которых я и писал "исполнители". Я и не писал что проблема в деньгах - еще раз, проблема в спросе (т.е. нужно ли это вообще) и в исполнителях. Не вижу противоречий.
Но у Вас же их нет (исполнителей под такую идею). Откуда Вы их возьмете?
Если бы были, я бы тут не писал. Я их ищу вот таким своеобразным образом. Желающие и способные участвовать в проекте могут сделать свое предложение с условиями.
А спрос Вам RIAA/MPAA обеспечит :) если Вы найдете всю пиратскую продукцию на всех сайтах :)))
У меня клиенты, владельцы штатовского журнала, постоянно мечтают о таком сервисе. Сворованные фотографии из их журнала по всему интернету развешаны. Они постоянно судятся и с поисковиками (всеми крупными), за то что они индексируют ворованные фотки, и с UseNet серивисами и сервисами вроде RapidShare. Стараются прикрыть все возможные сайты с пиратским контентом. Судя по тому, сколько достается мне, внизу всей этой цепочки, денег у них на это уходит немеренно.

Вопрос тут только, 1. на сколько точно будут картинки находиться 2. какой охват будет у этого сервиса (представляю сколько сайтов и картинок перелопатить нужно. Тут на одном лишь траффике разоришься)
Не специалист в этой области, но кажется найти полную копию фотографии проще и точнее чем поиск похожих лиц - а эта технология уже используется. На счет перелопатить это да, проблема - поэтому и предложил поисковику который и так все индексирует. Хотя при наличии интереса и платежеспособного спроса все вопросы должны быть решаемы. А спрос как Вы правильно заметили должен быть со стороны правообладателей хорошим, тем более с развитием интернета этих сетевых правообладателей тоже прибавляется. Железо и траффик это тоже уже/пока вроде не проблема. А
На счёт полных копий там тоже ньюансы есть. Изменённый размер: от превьюшки до полноразмерной копии. Добавленные элементы: вроде названия сайта. Зеркальное отражение, черно-белая копия, и т.д. Знаю, что они ведут переговоры с софтверными компаниями, занимающимися распознаванием картинок, но пока не нашли приемлемого решения.
На счёт поисковиков: Добавить такой сервис к Google Images было бы круто - база у них довольно объёмная. Но тоже не полная. Куча картинок крутится в usenet'е и прочих сервисах, куда поисковики не дотягиваются.
На счет полных копий это конечно идеал, но перечисленные изменения я думаю существенно на результат не повлияют, например если обрабатывать центр изображения (для фото) или даже дать возможность выделить на фотографии участок который характеризует именно этот объект - как правило такие ценные места не изменяют да и объем трафика можно будет существенно снизить.
А да, на счет поисковиков - согнать пиратку с поисковиков (вернее тех мест которые они индексируют, а это думаю большая часть инета) уже существенный + для правообладателей.
Главное предоставить возможность подписки на появление объекта - чтобы каждый раз не задавать поиск (тем более если много обектов). Будет конечно некоторый шум в результатах - но он есть даже в текстовом поиске. Хорошими клиентами в смысле денег могут оказаться кинокомпании - вот они терпят серьезные убытки от пиратства и денег на борьбу вроде не жалеют.
Именно подписка. У того журнала тысячи фотографий, которые они хотят мониторить на постоянной основе. Каждую по отдельности и каждый раз замучаешься проверять.
Может ляпну сейчас глупость, но надеюсь сильно бить не будете - Вы можете узнать у своих клиентов (просто хотя бы для интереса) - воспользовались бы они таким сервисом, сколько бы они и как платили за указанные услуги и главное :) - если бы им предложили участвовать в создании подобного сервиса - они бы согласились? Если да, вполне реальное предложение - они оплачивают проведение маркетингового исследования о необходимости такого сервиса и уровне спроса (рынке сбыта) на продукты и получают определенную долю в проекте если он будет запущен. А может и вдругих этапах.
На счёт сервиса поспрашиваю. А на счёт сотрудничества - не обижайтесь, но совершенно непонятно, с кем иметь дело и что кроме идеи у вас есть.

Подобный сервис нужен не только самим правообладателям. Многим фотографам не до того, чтоб искать пиратов в интернете. У многих из них контракты с агенствами по авторским правам, которые торгуют лицензиями и перечисляют фотографам гонорары, а заодно следят за пиратами и судятся. Вот таким агенствам подобный сервис нужен.
А ещё частным детективам и судебным следователям (forensic investigators), когда дело до суда доходит.
На счет сотрудничества еще рано говорить :) - я пока спрос изучаю, а на счет сотрудничества и исполнителей - могут заодно и сами сообщить, кого бы рекомендовали. В общем на счет этого потом поговорим :) - главное реализовывать буду не я сам а специалисты которых надо будет найти.
Здесь еще одна российская технология которую можно использовать для предлагаемого проекта. А может и используется, смотря как подходить к вопросу. Как думаете?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации