наверное за тем же, за чем это делают социальные сети и каталоги типа DMOZ
На основе данных строят сервисы, а вы провайдер данных. Все просто, права за вами, лицензионные отчисления вам, интересно, что вам еще хочеться?
Не думаю, что от семантического поиска стоит ожидать революции в ближайшем будущем. Статистические методы имеют слишком низкий потолок возможностей для таких задач. Нейросистемы способны неплохо справляться только с простыми предложениями. Чистая лингвистика... Пожалуй, с использованием AGFL-грамматик можно чего-то добиться, но в России ими занимается не больше десятка человек, так что весь research & development продвигается медленно. Хотя советую припахать Яндекс, у них, вроде, есть работающая на статистике система извлечения фактов :)
Да дело не в одном семантическом поиске. Посмотрите на технологии, которые можно уже сейчас успешно использовать. Типа RDFa, или SPARQL. Чтобы не быть голословным, к примеру, я с успехом использую RDF в тестировании, для хранения кусков конфигурации тестируемого продукта.
Вообще-то, прикольно будет лет через десять, если можно будет спросить, куда бы мне съездить отдохнуть с наименьшими проблемами с визой? 128 ядерные компьютеры уже подоспеют, наверное.
Поиск, всегда дающий ответы на вопросы типа "Куда бы мне съездить отдохнуть?", можно организовать на любом сайте, предварительно договорившись с рекламодателями:)
Да нет лучше бы что бы всетаки это был человек. Он и знает больше и понимает больше… Как ты комьютеру обьяснишь все… А человеки всякие жесты понимают. И подмигивания. А запрос как ты такой напишешь?
все это конечно хорошо...
только тут проблема скорее будет у пользователей - ибо не все запросы предполагают четкий и однозначный ответ, а некоторые специально задаются, дабы изучить интернет-публикации из разных противоречивых источников...
а то будет все как в советские времена - учат марскизму-ленинизму, значит и есть правильно...
с точки зрения технологий - здорово
с точки зрения практики - скорее минус...
ИМХО
Кстати вдогонку к статье - ОЧЕНЬ хотелось бы в поисковике режим "не умничать ваще", то есть искать фразу такой как она введена. Да да, о кавычках я знаю, но они не всегда помогают. Есть проблема с ТОЧНЫМ поиском фраз содержащих цифры, символа процента, знаков препинания и арифметических операций. И ещё - автор пишет "Мы никогда не будем вводить в строку поиска «Какой актер снимался в фильмах «Криминальное чтиво» и «Лихорадка субботним вечером»? или «Какие два сенатора США брали взятки от иностранных компаний?»". Как минимум - отучаемся говорить за всех. Лично я ОЧЕНЬ часто так формулирую запросы, ещё и беру их в кавычки чтобы отключить семантику. Смысл - найти в точности такие фразы, например в комментах или на форумах, а так где и вопрос - будет и ответ. Пример из жизни - я хочу приготовить лазанью. Я не буду вводить стандартный запрос "рецепт лазанья", я введу "как приготовить лазанью" и гарантировано первой ссылкой получу то что я хочу.
Это только до тех пор пока поиск рецепта лазаньи искали тысячи людей не нашли и один самый умный написал в форуме. А что если нужно найти результат умозаключений. Вот тут-то и булет проблема? Хотя врядли семантические сети смогут выводить сложные и жизненные запросы — все так больше по мелочам… Лазаньи там всякие…
разные сервисы, разные боты, разные компании предлагают
хранить инфу о пользователях в FOAF
описывать паутину в OWL
как и раньше, для упрощения индексации использовать robots.txt + sitemap.xml + RSS + XML RPC ( WebLogs.Update )
для глобальной идентификации использовать OpenID (непременно с упрощённой регистрацией) + Pavatar
для особо одарённых ботов и современных людей/наученных браузеров — внедрять в HTML Микроформатыа ещё есть:
Atom
RDF
DC
SPARQL
SHOE
SOA и WSDL
...
я ни когда всё это не впихну в свой маленький мультибложек =(, да и вообще, не могу себе представить подобный семантичный сайтец. Я достойной семантики не обнаруживаю даже в популярных соц.сетях — там, где она сама собой напрашивается.
Для нормального семантичного поиска нужен осемантиченный контент. Википедия — единственное место в сети, где семантика реально присутствует в более или менее удобном для поиска виде. Остальным ресурсам в сети довольно не просто внедрять семантичность. Очень жаль =(
Семантический поиск: мифы и реальность