Search
Write a publication
Pull to refresh

Нужна ли ручная обработка результатов поиска в интернете?

Reading time2 min
Views504
Каждый из нас, думаю, постоянно гуглит. Существуют некоторые задачи, на поиск информации по которым уходит туча времени. Из последних задач, которые мне попадались, можно, к примеру, отметить:
  • составление списка всех интернет магазинов магазинов Литвы и Эстонии, включая отслеживание магазинов — клонов и выписка контактов
  • составление обзора существующих технологий компьютерного зрения, в основном realtime — идентификации объектов монокулярной камерой, с фокусом на embedded системы
  • обзор существующих установок mod_php + mod_worker

При выполнении этих задач я просто начал мечтать о человеке, который бы их выполнил за меня.

Предпосылки проблемы


Думаю, все признают, что выдача поисковых систем, в принципе, полная каша. Из-за ранжирования поиска по pr/tic/etc на самом деле профессиональные, но не авторитетные (читай — не раскрученные) ресурсы болтаются где-то на 5-6й страницах выдачи. Пре-процессинг запроса (например, realtime 3d object identification) услужливо подсовывает ссылки от realtime linux до blender3d. Вольфрам немного упрощает ситуацию, но его база мала. Плюс, из-за всеобщей перепечатки данных, первые 50 ссылок могут вообще указывать на тот же самый ресурс.

Давайте помечтаем


Представим, что есть сервис, domysearch.ru (именно русский, я в состоянии разговаривать где-то на 6и языках, но удобнее воспринимать информацию по-русски), на котором я оставляю заявку примерно такого содержания:
Найти поставщиков GPS устройств в Риге и Рижском районе, для покупки партии в 30 штук. Узнать контакты, скидки, скорость выполнения заказа, возможность послегарантийного обслуживания. Составить краткий обзор предлагаемых устройств.

… плачу за это деньги, и через сутки получаю ответ, в виде пачки PDF, табличек итп. Читаю эту информацию за 5-10 минут и принимаю решение.

Почему не сам?


Почему не сам, скажете вы? Все просто — это экономическая эффективность. День моей работы стоит 70 евро. На составление списка литовских интернет-магазинов ушло два дня, итого стоимость такой работы в районе 150 евро. Я готов ее зааутсорсить за 70-100 евро, так как это сэкономит мне ~16 часов работы, и за это время я сделаю что-то более эффективное и нужное.

Итог


Теперь, собственно, то что я хотел спросить у хабралюдей — нужны ли вам специалисты или сервисы, которые за определенные деньги, вооружившись современными средствами Data-Mining'а, будут искать вам информацию? Ведь буквально через пару месяцев работы такого сервиса выстроенная ассоциативная база будет полнее и подробнее базы гугла и прочих поисковых систем. Неужели всех устраивает потеря времени на гуглеж?

Для домашнего чтения


en.wikipedia.org/wiki/Web_mining
Tags:
Hubs:
Total votes 7: ↑6 and ↓1+5
Comments12

Articles