Так они сами пишут, что база пока еще очень маленькая, всего чуть более 700 миллионов изображений. Но процесс идет, скоро этот сервис будет одним из самых востребованных, наряду с текстовым поиском.
TinEye мгновенно анализирует исходное изображение, чтобы создать компактную цифровую подпись или «отпечаток пальца» для него. TinEye ищет ваше изображение в сети путем сравнения его отпечатков пальцев с другими проиндексированными TinEye изображениями.
Это система делает хеш блока N на N пикселей, кладет запись в бд, потом сдвиг на неск. пикселов и снова запись.
она же ищет по куску изображения… (получаются квадраты с наложением, по которым будет поиск.)
— это только мои догадки. кто в курсах как работает, обьясните. интересно.
Технология называется CBIR (Content Based Image Retrieval). Подобные методы судят о сходстве исходя исключительно из оценки совпадения цветов и яркостей соответствующих областей сравниваемых изображений, в предельном случае – каждой пары точек изображений.
Я писала о других сервисах от IDEE (компания производитель Tin Eye) в разделе поисковые системы habrahabr.ru/blogs/search_engines/30261/
Там 90% игроков берут картинки не из видеофайла фильма, а из отдельных кадров выложенных на кинопоиске.ру и т.п сервисов — найти описание фильма по этой картинке становится просто
Сервис действительно оч. интересный! Бесценный для дизайнеров:)
Сразу потрясают возможности развития в ближайшие пару-тройку лет: поиск в видео, создание «синонимов» изображения.
п.с. только приставка «2.0» в названии темы лишняя.
Вообще насколько я знаю эта приставка получила популярность, после появления понятия Веб 2.0.
Насколько я понимаю веб 2.0 отличается от 1.0 тем что концепция генерации контента изменилась (подключились пользователи).
К этому сервису это не имеет никакого отношения=)
Вот только не могу понять зачем регистрация… любой сервис который предоставит теже возможности без регистрации сразуже станет более популярным :(
З 20 мин работы 5 раз входил :(
Так это поисковая система или сборщик адресов для спама?
Другим поисковикам не нужно для распространения твои адреса…
Я просто говорю что это не удобно, лично для меня
То полезное, знаешь как ждут люди в конце месяца что бы сменилась реклама? А то все уже прочитали, и старые картинки надоели… Как-то вошел в новый вагон без рекламы так и нечем заняться…
Не знаю что появилось раньше, но до этого встречал подобный сервис(он правда и сейчас находится на стадии закрытого тестирования), о нем писали на хабре: it's a pic
С друзьями за бутылочкой пива на кухне обсуждали как-то примерный алгоритм и пришли к выводу: чтобы программа распознавала не только идентичные изображения, но и повернутые (к слову этот поисковик даже на 180 градусов перевернутые не находит), так и сфотографированные с несколько, хтябы малого, радиуса — надо очень постораться, ибо распознать логически может и просто образ, а вот программно — врят ли.
Я в далеком 97 году разрабатывал подобную систему распознавания образов. Там было заложено что объект (большой палец руки) может быть прислонен к матрице под небольшим углом, и ничего страшного в этом не было.
Как настоящие суровые инжинеры тех лет, программные средства использовались по минимуму, всё на цифро-аналогах.
Я к тому, что скажем сфотографированный логотип гугла, под углом градусов 45 не так-то просто подогнать под какой-то «идентификационный отпечаток», который будет его идентифицировать, как логотип и с легкостью искать в миллиардной базе.
Не всё так просто. Сначала выеделяется ключевые элементы: точки в простейшем случае. Потом по ним строится образ их взаиморасположения относительно друг-друга. Без привязки где «верх», а где «низ». Вот по «похожести» этих образов и принимается решение об идентификации. Так что масштабирование и поворот не влияют* на распознавание.
*при данном формате изложения
Я больше по вопросам идиентичности, чем похожести. У домов есть балконы, столбы освещения и другая инфраструктура, ну а если они похожи по всем признакам — то попадают в результаты поиска.
Это я к тому, что вы с умным видом заявляете совершенно очевидные вещи. Хотя от человек который пишет «врят ли», «постораться» и «интерестно» редко способен на большее.
С друзьями за бутылочкой пива на кухне обсуждали как-то примерный алгоритм и пришли к выводу: чтобы программа распознавала не только идентичные изображения, но и повернутые (к слову этот поисковик даже на 180 градусов перевернутые не находит), так и сфотографированные с несколько, хтябы малого, радиуса — надо очень постораться, ибо распознать логически может и просто образ, а вот программно — врят ли.
Потестил немного. Мысли такие:
Либо 701,666,310 картинок — это мизер, либо алгоритм еще не доработан. Находит очень мало.
В закладки, конечно, но надо посмотреть на этот сайт через месяц-два.
я полгода сделал прогу для поиска на диске дубликатов фотографий картинок, причем может искать даже если эталон — вырезанное лицо человека из коллективной фотки, найдет эту коллективную. Думали сделать такой же сервис как и описывался в статье, но тут есть гигантская проблема с мощностью железа и быстродействием + не работает система если есть изменение масштаба, проблема в том что большинство корреляционных алгоритмов — растровые, вектор работает лучше, но алгоритмы гораздо сложнее.
Дык есть сравнивать с одинаковым разрешением — чистая статистика на основе сигнатур прокатывает на коленке.
Весь кайф найти с изменениями масштаба.
Вот эти ребята из поста как раз находят разномасштабные картинки.
Например, поищите вот это p-userpic.livejournal.com/64663828/5656400
С последних страниц (сделали бы уже фильтрацию по размерам).
Замечательный сервис, но пока индексу не хватает полноты — например, мой аватар нашел только на Яндекс.Фотках и Last.fm, хотя использован он в намного большем количестве сервисов.
А ещё был подобный российский проект picolator, который успешно закрылся, а жаль :(. Я даже не знаю почему, хотя на хабре есть его разработчики, они сами о нём писали где-то пол года назад.
Вспоминается мой крик души в 2006 году, излитый в этом посте: www.free-lance.ru/blogs/view.php? tr=9310&ord=my
Каменты скептиков перечитывать особенно прикольно. Об этом наверняка все уже давно мечтали, но возможным это стало, якобы, только сейчас… Но мне не верится. Я уверен, что все нужные актуальные технологии выпускаются на рынок с опозданием как минимум лет на 5. Никто не любит рисковать…
Поиск картинок 2.0