Пришла мне в голову идея.
А текст ли мы ищем в поисковых системах?
Правильно, в поисковых системах мы ищем не текст а информацию.
Давайте поразмышляем…
В частном случае мы ищем мультимедийный контент.
То есть оказывается, что мы ищем вовсе не текст. Он является лишь точкой опоры в поиске. Мы пытаемся сформулировать вопрос и найти информацию. Я не буду останавливаться здесь на принципах поиска, тем более что я в них досконально не разбираюсь. Я хочу коснуться вопроса принципиальной сложности нахождения информации некоторых типов при использовании поисковиков.
Речь идёт о:
Например мы хотим найти музыку, какую-то песню. Как мы её ищем? По словам в тексте. Но что делать если это музыка без слов? В жизни мы обычно спрашиваем: «Не знаешь что это за мелодия», и напеваем её. С фильмами и картинками тоже так бывает. Имеется фрагмент, и хочется найти источник. Для картинок это конечно более актуально. Например, для дизайнеров или для заказчиков дизайнеров. Когда мы просто хотим убедится, что что-то не является плагиатом или просто банально не стащено откуда либо.
Подумал я всё это и решил покапать тему… Оказывается уже существует поисковый сервис подобного рода по картинкам — www.tineye.com
И он даже работает, кому лень — вот на скриншоте пример.

Аналогичный сервис можно было бы сделать и для музыки. Идея следующая.
Берём некую базу музыки. И для каждого файла делаем некий «музыкальный хэш». В качестве музыкального хэша может, например, быть некая характерная последовательность нот композиции, разложение на гармоники и т.п. Думаю можно найти способ получить такого рода «хэш». Можно пофантазировать далее, хотим найти мелодию — напеваем её прямо в микрофон и ищем «не отходя от кассы» :).
В конечном итоге суть в том, чтобы предоставить адекватный потребностям поиск не только по выводу и подборке искомой информации, но и по способам формирования поисковых запросов.
Ну вот представьте, например, если бы в вольфраме можно было искать функцию по форме кривой и т.п.
Людей по фотографиям и много другое.
Конечно это всё не просто, и есть куча вопросов — как собирать базы картинок и музыки, где проводить обработку этих терробайт информации, где взять такие вычислительные мощности… Да вопросов много, но кто мешает нам немого заглянуть в будущее и пофантазировать к чему нужно стремиться. Тем более что часть этого будущего уже воплощается в реальность.
А текст ли мы ищем в поисковых системах?
Правильно, в поисковых системах мы ищем не текст а информацию.
Давайте поразмышляем…
В частном случае мы ищем мультимедийный контент.
То есть оказывается, что мы ищем вовсе не текст. Он является лишь точкой опоры в поиске. Мы пытаемся сформулировать вопрос и найти информацию. Я не буду останавливаться здесь на принципах поиска, тем более что я в них досконально не разбираюсь. Я хочу коснуться вопроса принципиальной сложности нахождения информации некоторых типов при использовании поисковиков.
Речь идёт о:
- музыке;
- фильмах;
- картинках.
Например мы хотим найти музыку, какую-то песню. Как мы её ищем? По словам в тексте. Но что делать если это музыка без слов? В жизни мы обычно спрашиваем: «Не знаешь что это за мелодия», и напеваем её. С фильмами и картинками тоже так бывает. Имеется фрагмент, и хочется найти источник. Для картинок это конечно более актуально. Например, для дизайнеров или для заказчиков дизайнеров. Когда мы просто хотим убедится, что что-то не является плагиатом или просто банально не стащено откуда либо.
Подумал я всё это и решил покапать тему… Оказывается уже существует поисковый сервис подобного рода по картинкам — www.tineye.com
И он даже работает, кому лень — вот на скриншоте пример.

Аналогичный сервис можно было бы сделать и для музыки. Идея следующая.
Берём некую базу музыки. И для каждого файла делаем некий «музыкальный хэш». В качестве музыкального хэша может, например, быть некая характерная последовательность нот композиции, разложение на гармоники и т.п. Думаю можно найти способ получить такого рода «хэш». Можно пофантазировать далее, хотим найти мелодию — напеваем её прямо в микрофон и ищем «не отходя от кассы» :).
В конечном итоге суть в том, чтобы предоставить адекватный потребностям поиск не только по выводу и подборке искомой информации, но и по способам формирования поисковых запросов.
Ну вот представьте, например, если бы в вольфраме можно было искать функцию по форме кривой и т.п.
Людей по фотографиям и много другое.
Конечно это всё не просто, и есть куча вопросов — как собирать базы картинок и музыки, где проводить обработку этих терробайт информации, где взять такие вычислительные мощности… Да вопросов много, но кто мешает нам немого заглянуть в будущее и пофантазировать к чему нужно стремиться. Тем более что часть этого будущего уже воплощается в реальность.