В реальном времени, думаю и не будет ближайшие несколько лет.
Да и такое ощущение, что картинки ищутся не только по их контенту, но и по контексту…
Но результат неожиданно хорош.
я так не думаю…
я заливал фотки в picasaweb, там есть анализатор лиц, так вот, сканер перебрал около 10000 фоток примерно за 20-30 минут и потом предложил уточнить его результаты. сказать что я был поражен — ничего не сказать — точность была процентов 95. причем фотки некоторые были не самого лучшего качества.
так что думаю реалтаймовский анализатор будет через годик, другой…
н-да… вот результаты одной из картинок на запрос «Москва» — удручает. На запрос «питер» вообще ни у удной картинки в первых нескольких страницах нет возможности посмотреть похожие. В общем им еще работать и работать…
Фотографы пользуются www.tineye.com — туда можно загружать картинки. Там, впрочем, отыскиваются не сходные ракурсы одного и того же человека, а более строго: варианты совершенно одного и того же фото или рисунка (с точностью до обрезки, изменения размеров и т. п.).
Фотографы могут обойти ограничение.
Нужно выложить страницу с фото с уникальными ключами в alt title h1. Скормить Google. Найти по уникальному ключу. Затем найти кто ее стырил.
Это только для контрастных изображений, видимо оценка схожести идёт по нескольким экстремальным точкам градиента яркости. Для картинок с гладкими градиентами релевантность очень плохая, даже если по цвету они сильно различаются. Например: sun spectrum. Наверное цветовой градиент не учитывается при поиске экстремальных точек.
Вот так понятны становятся механизмы. ИМХО, для поиска в основном используется старый добрый поиск по названию картинки, и лишь немного фильтруется по содержанию. Поэтому так много совпадений на Натали Портман, и как ни странно на Дика Чейни, которому посчастливилось своим силуэтом на темном фоне напоминать тот самый dick
Вот-вот. Так же поиск по названиям игр (к примеру Arma). 10 страниц пролистал, и все скрины из одной игрушки. Сложно поверить что у нее такая уникальная палитра (а больше ничего общего в изображениях и нет).
так я и говорю — комбинируются, но не в той пропорции, чтобы восторгаться новыми достижениями labs… по-моему пример с Dick'ом Чейни крайне показателен :)
Светлотная-то компановка похожа — в центре на более тёмном фоне полукруглое (полуэллипсное) пятно с более светлым верхом и тёмным (темнее фона) низом. Видимо, алгоритм при нормализации сначала ресайзит картинку, приводя её этак до 200 на 200 по малому размеру (судя по тому, что в похожестях картинки менее 200х200 не выдаются), проходясь потом по ней гауссом, а в качестве индекса берёт яркостную карту в относительных единицах.
Судя по всему, Гугл анализирует ключевые слова исходной картинки (или слова со страницы где она находится, если она есть) и окромя поиска похожих картинок, еще идет поиск по этим самым словам.
Google Similar Images: поиск похожих изображений