Comments 14
3 минуты как нету ката. :) А не помешал бы уже…
интересно)
А может попросить гугл, что бы он попробовал построить такие небольшие сети, в пределах десятка сайтов и даст погулять по ним?)
А может попросить гугл, что бы он попробовал построить такие небольшие сети, в пределах десятка сайтов и даст погулять по ним?)
попросить гугл конечно можна,
а что без него не получится, промоделировать работу?
а что без него не получится, промоделировать работу?
кстати, на работе используем продукт называется семантический архив. очень дорого стоил. идея в том что каждый день скрипт дергает поисковики на ключевые слова. если появились новые заметки, то программа пытается выделить триплеты из каждого предложения, там где она не смогла это сделать, нужен человек, но с каждым разом триплеты которые знает система становится больше. она различает персоны, события, места и прочие классы. конечный итог: можно строить дайджесты статей по персоне или событию. На словах красиво, на деле на мой взгляд, бесполезно :)
URI лондона… Уже сейчас гугловая(и не только) контекстная реклама основана на триплете пользователь-смотрелстраницу-сключевымисловами. Вот и получим, что при более тесной интеграции человека и веба упрощенные средства посылания сигналов в мозг. При [:digit:]M связей для сущности найдется кто-то, кому автомобилисты доверят не показывать им информацию о грядущем повышении цен на топливо. А то и похуже что. Семантик-веб российский школьный портал.
Тьфу-тьфу-тьфу, конечно. Перспективы, все таки, наполнены упоительной романтикой)
Тьфу-тьфу-тьфу, конечно. Перспективы, все таки, наполнены упоительной романтикой)
Интересная статьи и неплохой перевод, могу только добавить, что ключиком, который свяжет текущие html странички и то о чем пишется в статье — RDFa, который позволяет вставлять описания сущностей прямо в html и совсем недавно получил рекомендацию w3c (http://www.w3.org/TR/rdfa-syntax/).
Хаос — составляющая нашего мира. Интернет — типичное проявление информационного хаоса. Упорядочить такую махину, думаю, вообще невозможно.
Кстати, поисковики тогда вообще будут не нужны! И это не должно быть выгодно Google, если только он не захочет его (семантический веб) прикупить…
Кстати, поисковики тогда вообще будут не нужны! И это не должно быть выгодно Google, если только он не захочет его (семантический веб) прикупить…
Полностью структурировать хаус конечно же не получится, да и не надо. А вот по поводу Google полностью согласен, им важно держать в своих руках контроль за поиском и как следствие за рекламой на которой они зарабатывают себе на жизнь. Семантический же веб по сути своей децентрализован и это не на руку поисковику №1.
Главная проблема в семантическом вебе — человеческая. Технически всё было готово уже лет пять назад, а вот создатели контента все эти вещи игнорируют. И не думаю, что здесь что-либо поменяется. Бардак никуда не денется. В качестве иллюстрации приведу свежий пример.
Есть такой замечательный формат — FictionBook2. Есть сайты, на которых выложено огромное количество файлов в этом формате. В каждом таком файле есть поле (условно говоря) имя_автора. Казалось бы, чего такого особенно сложного? А вот нет, бардак начинается прямо оттуда. имя_автора имеет вид кортежа (last_name, middle_name, first_name), и разнообразные «творцы» документа умудряются накосячить. Самые частые варианты: перепутанный порядок элементов, вместо (иванов, иванович, иван) пишут (иванов, иван, иванович); «всё-в-одном»: (иванов иван иванович,,). Про всякие мелочи типа регистра символов я даже не упоминаю. И в итоге получается вместо стройной системы какая-то огромная куча разнородного контента.
После такого я уже не верю в человечество.
Есть такой замечательный формат — FictionBook2. Есть сайты, на которых выложено огромное количество файлов в этом формате. В каждом таком файле есть поле (условно говоря) имя_автора. Казалось бы, чего такого особенно сложного? А вот нет, бардак начинается прямо оттуда. имя_автора имеет вид кортежа (last_name, middle_name, first_name), и разнообразные «творцы» документа умудряются накосячить. Самые частые варианты: перепутанный порядок элементов, вместо (иванов, иванович, иван) пишут (иванов, иван, иванович); «всё-в-одном»: (иванов иван иванович,,). Про всякие мелочи типа регистра символов я даже не упоминаю. И в итоге получается вместо стройной системы какая-то огромная куча разнородного контента.
После такого я уже не верю в человечество.
Семантический поиск так или иначе будет основан на поисковике №1, только в иной форме. Гуглу это на руку. Контекстная реклама примет более масштабные размеры, гибкие формы и превратиться просто в информацию.
Проблема недавно «изобретенных» пользовательских тегов показало свою личину.
По запросу madonna на LastFm система выдает такие теги:
fun
gay
guilty
pleasure
guilty
pleasures
house
i like
icon
indie
diva
eighties
energetic
favorite artists
favorite artist (разница в одной букве !)
www.lastfm.ru/music/Madonna/+tags
Новая проблема современного Веба — отделение «потока сознания» рядового пользователя от необходимой информации.
Проблема недавно «изобретенных» пользовательских тегов показало свою личину.
По запросу madonna на LastFm система выдает такие теги:
fun
gay
guilty
pleasure
guilty
pleasures
house
i like
icon
indie
diva
eighties
energetic
favorite artists
favorite artist (разница в одной букве !)
www.lastfm.ru/music/Madonna/+tags
Новая проблема современного Веба — отделение «потока сознания» рядового пользователя от необходимой информации.
Sign up to leave a comment.
Как мы будем взаимодействовать с сетью данных?