Search
Write a publication
Pull to refresh

Comments 14

интересно)
А может попросить гугл, что бы он попробовал построить такие небольшие сети, в пределах десятка сайтов и даст погулять по ним?)
Зачем Google? Можно просто запустить RDF-Browser и ходить по этой семантической паутинке.
попросить гугл конечно можна,
а что без него не получится, промоделировать работу?
кстати, на работе используем продукт называется семантический архив. очень дорого стоил. идея в том что каждый день скрипт дергает поисковики на ключевые слова. если появились новые заметки, то программа пытается выделить триплеты из каждого предложения, там где она не смогла это сделать, нужен человек, но с каждым разом триплеты которые знает система становится больше. она различает персоны, события, места и прочие классы. конечный итог: можно строить дайджесты статей по персоне или событию. На словах красиво, на деле на мой взгляд, бесполезно :)
Напрасно, напрасно… в первой «Матрице» Нео Морфеуса искал тоже по такому принципу — и сами помните к чему это привело :)
совершенно очевидно, что за семантическим вэбом будущее. Другое дело реализация нашей системы… ниочень.
URI лондона… Уже сейчас гугловая(и не только) контекстная реклама основана на триплете пользователь-смотрелстраницу-сключевымисловами. Вот и получим, что при более тесной интеграции человека и веба упрощенные средства посылания сигналов в мозг. При [:digit:]M связей для сущности найдется кто-то, кому автомобилисты доверят не показывать им информацию о грядущем повышении цен на топливо. А то и похуже что. Семантик-веб российский школьный портал.
Тьфу-тьфу-тьфу, конечно. Перспективы, все таки, наполнены упоительной романтикой)
Интересная статьи и неплохой перевод, могу только добавить, что ключиком, который свяжет текущие html странички и то о чем пишется в статье — RDFa, который позволяет вставлять описания сущностей прямо в html и совсем недавно получил рекомендацию w3c (http://www.w3.org/TR/rdfa-syntax/).
Хаос — составляющая нашего мира. Интернет — типичное проявление информационного хаоса. Упорядочить такую махину, думаю, вообще невозможно.
Кстати, поисковики тогда вообще будут не нужны! И это не должно быть выгодно Google, если только он не захочет его (семантический веб) прикупить…
Полностью структурировать хаус конечно же не получится, да и не надо. А вот по поводу Google полностью согласен, им важно держать в своих руках контроль за поиском и как следствие за рекламой на которой они зарабатывают себе на жизнь. Семантический же веб по сути своей децентрализован и это не на руку поисковику №1.
Главная проблема в семантическом вебе — человеческая. Технически всё было готово уже лет пять назад, а вот создатели контента все эти вещи игнорируют. И не думаю, что здесь что-либо поменяется. Бардак никуда не денется. В качестве иллюстрации приведу свежий пример.

Есть такой замечательный формат — FictionBook2. Есть сайты, на которых выложено огромное количество файлов в этом формате. В каждом таком файле есть поле (условно говоря) имя_автора. Казалось бы, чего такого особенно сложного? А вот нет, бардак начинается прямо оттуда. имя_автора имеет вид кортежа (last_name, middle_name, first_name), и разнообразные «творцы» документа умудряются накосячить. Самые частые варианты: перепутанный порядок элементов, вместо (иванов, иванович, иван) пишут (иванов, иван, иванович); «всё-в-одном»: (иванов иван иванович,,). Про всякие мелочи типа регистра символов я даже не упоминаю. И в итоге получается вместо стройной системы какая-то огромная куча разнородного контента.

После такого я уже не верю в человечество.
Семантический поиск так или иначе будет основан на поисковике №1, только в иной форме. Гуглу это на руку. Контекстная реклама примет более масштабные размеры, гибкие формы и превратиться просто в информацию.

Проблема недавно «изобретенных» пользовательских тегов показало свою личину.
По запросу madonna на LastFm система выдает такие теги:

fun
gay
guilty
pleasure
guilty
pleasures
house
i like
icon
indie
diva
eighties
energetic
favorite artists
favorite artist (разница в одной букве !)
www.lastfm.ru/music/Madonna/+tags

Новая проблема современного Веба — отделение «потока сознания» рядового пользователя от необходимой информации.

Sign up to leave a comment.

Articles