dulanov 15 фев 2009 в 11:43

Семантический веб как операционная система: с пользователями и правами доступа!

8 мин

2.6K

Семантика*

Перевод

+28

Комментарии 29

TanKaDo 15 фев 2009 в 11:55

Не забывайте про хабракат, %username%!

dulanov 15 фев 2009 в 11:57

Ага, совсем забыл, спасибо.

НЛО прилетело и опубликовало эту надпись здесь

solvadore 15 фев 2009 в 16:25

Лично мне непонятно какую проблему подняли авторы статьи.
Семантический веб как я понимаю будет просто надстройка над текущим вебом. Добявяться новые метаданные в html-код и в этих новых тегах будет храниться смысловая нагрузка контента.
Проблема отсутствия анонимности мне кажется не возникнет, по крайней мере не больше чем сейчас (если государства не вмешаются)…
В общем непонятная какая-то статья.

seis 15 фев 2009 в 17:39

Проблема сформулирована в абзаце перед рисунком 3.

solvadore 15 фев 2009 в 17:42

Ничего нового в этом абзаце нет.

seis 15 фев 2009 в 17:52

>Добавятся новые метаданные в html-код и в этих новых тегах будет храниться смысловая нагрузка контента.
Этим SW не ограничивается. Собственно то, что вы написали, называется онтологией и описывается с помощью OWL.

solvadore 15 фев 2009 в 18:08

The Semantic Web is about two things. It is about common formats for integration and combination of data drawn from diverse sources, where on the original Web mainly concentrated on the interchange of documents. It is also about language for recording how the data relates to real world objects. That allows a person, or a machine, to start off in one database, and then move through an unending set of databases which are connected not by wires but by being about the same thing.
© W3C

seis 15 фев 2009 в 18:23

Вы пишете:
> Добавятся новые метаданные в html-код и в этих новых тегах будет храниться смысловая нагрузка контента.

W3C пишет:
>It is also about language for recording how the data relates to real world objects.

Кроме того W3C пишет:
> That allows a person, or a machine, to start off in one database, and then move through an unending set of databases which are connected not by wires but by being about the same thing.

Это и является проблемой. С одной стороны для эффективной работы в SW вам придётся предоставить довольно полные данные о себе. С другой стороны предоставление этих данных чревато тем, что в сети о вас будуть знать больше, чем в реальной жизни. Сейчас эта проблема менее актуальна, т.к. нет единого аккаунта и для того, чтобы собрать данные о человеке, нужно изрядно помучить поисковики.

solvadore 15 фев 2009 в 18:33

W3C пишет:
>It is also about language for recording how the data relates to real world objects.

Как это будет использоваться? Если по простому, то именно
> Добавятся новые метаданные в html-код и в этих новых тегах будет храниться смысловая нагрузка контента.

Не вижу проблемы.
Вы пишете:
> вам придётся предоставить довольно полные данные о себе

Придется ли? Что-то сомневаюсь. Обязывать вряд ли будут. Даже сейчас тот же facebook обладает данными людей, которые сами же их и выложили, по собственному желанию. Кто не хотел — не выдвигал из на всеобщее обозрение. Просто не будет необходимости в этих данных (если только государства не обяжут)

Вы пишете:
> Сейчас эта проблема менее актуальна, т.к. нет единого аккаунта

OpenID уже давно придуман и много где используется (у нас, правда, он пока не очень актуален) и пока этой проблемы не возникло.

seis 15 фев 2009 в 21:16

Конечно никто ни к чему никого обязывать не будет.
Но потрудитесь прочитать ещё раз указанный в моём первом комментарии абзац.
К анонимам нет доверия в серьёзных делах.

OpenID тут при чём? Это единая система авторизации.
И раз уж заговорили о профайлах на фэйсбуке. А каков процент закрытых профайлов? И вроде бы иноформация никакой ценности не представляет — где и с кем учился, интересы, фото с отпусков и пьянок. И преступлений ужасных вроде никто не совершал. А всё равно закрывают. Интересно почему?

Carry 16 фев 2009 в 11:33

>К анонимам нет доверия в серьёзных делах.
А как отличить анонима от не анонима? Как отличить Васю Пупкина от Пупы Васькина? Или это один человек? Или бот? Или для использования веба потребуется штрих-код на лбу?

danielkornev 15 фев 2009 в 19:51

Да нет, чем ты социально и интеллектуально активнее в сети, тем проще тебя найти в сети.

Чем больше ты знакомишься с подобными людьми, чем большим числом вопросов ты задаешься, чем больше ты размышляешь, чем чаще ты формируешь свое мнение на основе знаний, не «клише» из рекламы, тем более опасным ты становишся опасным для тоталитарного сообщества. Т.е в нашей стране тебя и найти легче, и поводов у той же власти (Большого брата) для поиска тебя больше.

Так что единого аккаунта уже сейчас не надо. :)

seis 15 фев 2009 в 21:01

> тем более опасным ты становишся опасным для тоталитарного сообщества. Т.е в нашей стране тебя и найти легче, и поводов у той же власти (Большого брата) для поиска тебя больше.
Не находите несколько странным то, что можете совершенно невозбранно написать этот комментарий про тоталитарное (со)общество? Вы о когнитивном диссонансе когда-нибудь слышали?

danielkornev 15 фев 2009 в 21:14

да, пожалуй, это как раз обо мне :) согласен, глупость сказал. ;)

beetleinweb 16 фев 2009 в 11:00

Искренне надеюсь, вы действительно знаете о тоталитаризме намного больше, чем я. Поэтому поправите, если я ошибаюсь. И надеюсь, это не офтоп: социумы, политика и анонимность — всё это тесно связано вроде как.

В моём понимании, тоталитарное общество — это вовсе необязательно общество, где не дают говорить и уж тем более думать. Просто тем, кто не то говорит, и не то думает, не дадут ничего сделать.

Пример. Вы когда-то что-то не то сказали. Отложилось в архивах. Через пять лет пытаетесь устроиться в гос. учреждение. Вам отказывают без объяснения причин. Или вычеркивают вашу кандидатуру из списка выборов куда-нить по надуманному предлогу. Или то, что я описал — демократическое общество? ;)

seis 16 фев 2009 в 13:49

> В моём понимании, тоталитарное общество — это вовсе необязательно общество, где не дают говорить и уж тем более думать. Просто тем, кто не то говорит, и не то думает, не дадут ничего сделать.

Если так рассматривать ваше понимание моего «невозбранно», то получается, что у нас дают воровать@убивать. Только за это в тюрьму посадят :)
Получается, что возбранно -> тоталитаричненько.

beetleinweb 16 фев 2009 в 18:54

Спасибо, что прояснили. Но всё же я вижу чёткую разницу (надеюсь, вы тоже сейчас заметите) между «возбранно» в том и другом случае. В вашем примере возбраняемость явно прописана в законе. Проведены более менее чёткие границы — это запрещено, а остальное, стало быть — разрешено.

В описанном же мной случае ничего нигде не прописано (открыто). Допустим, сегодня ведётся тайная прослушка по ключевым словам «король, голый», завтра добавляется «министр, дурак». Сегодня за такие слова не примут работать в гос. учреждение, а завтра — и из дворников уволят. И вы даже не узнаете, когда и за что попали в чёрный список.

В википедии ещё почитал про тоталитаризм. Там приводится один из признаков: когда, в отличии от полицейского государства (где всё делается более менее явно), контроль непредсказуем. А я вот ещё как бы добавляю — и невидим. Даже неочевидно, есть он или нет. Хотя по косвенным признакам можно судить о его существовании.

danielkornev 15 фев 2009 в 20:03

Нужно добавить вот что: перенести весь веб в семантик веб путем структурирования всей информации — сизифов труд.

Хотя бы потому, что каждый может информацию интерпретировать по своему, структурировать по своему. Кроме того, информацию можно рассматривать в разных ситуациях, и в процессе потребления информации пользователями будут восприниматься ее различные аспекты. Т.е. нет абсолютного представления, есть лишь ее «проекции» в различных контекстах.

Можно привести аналогию — есть сервис такой, Photosynth, который позволяет «слепить» какой-нибудь реальный объект в виртуальной реальности, путем создания множества фотографий этого объекта, которые этот сервис затем объединяет и создает трехмерное представление этого объекта. Так вот это представление отличается от реального, и в то же время с точки зрения автора, фотографировавшего этот объект, трехмерное представление будет тем, что он фотографировал. Но для каждого из фотографов он будет разным.

Мы все по разному представляем и обрабатываем информацию, кто-то педантично впитывает детали, кто-то поверхностный взгляд бросает.

Это я к тому, что на самом деле семантический веб — это возможность сети представить информацию вам в вашем контексте — контексте ваших знаний, вашего опыта, умений. Ведь мы не нуждаемся в абсолютном знании, когда, скажем выбираем фильм, который хочется посмотреть, — уже сейчас большинство фильмов на той же Афише.ру имеют по 100 с лишним рецензий — мы просто не читаем их все, а так, две-три. Редко больше 5-и. И нам достаточно для формирования некоторого мнения. Мы формируем свое мнение и накапливаем свое знание о том, что нам интересно, на ходу, подпитывая знания по ходу.

Так и семантический веб — это постоянно учащаяся система, которая неизбежно индивидуальна для каждого человека, которая вытаскивает факты, знания, мнения, предположения из массива хаоса знаний человечества в виде, удобном нам, людям.

Попытки собрать это в узкие рамки конкретных схем данных провалились еще во времена WinFS, когда Microsoft пыталась все в мире описать жесткими схемами данных. Это не получилось, потому что даже такой простой объект «message» несколько команд в Редмонде не смогли описать одинаково — Exchange команда видела этот объект в одной форме, Hotmail — по другому, MSMQ-команда — по третьему, и т.д. Говорят, это было одной из причин, по которой проект и был закрыт.

Будущее Паутины, как мне кажется, это интеллектуальные, самообучающиеся системы, которые живут и изучают мир вместе с нами, помогая познавать его вместе с ними, находу анализирующие мир и сверяющиеся со знаниями веба.

ИМХО, конечно… :)

seis 15 фев 2009 в 21:08

Собственно то, что уже существует огромное количество несемантизированной информации мешает возникновению семантической паутины. И привести её в должный формат не представляется возможным до появления ботов с искусственным интеллектом, которые семантизацией будут заниматься. Но что уж о ботах говорить, если ещё нет не то что семантических агентов, даже нет нормального семантического поисковика.

>Попытки собрать это в узкие рамки конкретных схем данных провалились еще во времена WinFS
Видимо, времена изменились или в семантической паутине рамки очень гибкие. Собственно уже создано довольно большое количество узкоспециализированных онтологий (медицинских например), которые ещё и используются.

danielkornev 15 фев 2009 в 21:24

да нет, как раз и не мешает. Просто мы пока еще не научили компьютеры воспринимать информацию неотрешенно, а в контекстах. Мы пытаемся научить компьютеры абсолютному знанию, думая, что затем сможем «отфильтровать» ее для решения конкретных задач.

ИМХО, это не так. Нет абсолюта, нет единственного наблюдателя, все относительно. Это я уже выше описал — что мы воспринимаем одно и то же в рамках собственного (не)знания. И делаем это по разному. И это прекрасно!!! Это-то и прекрасно. Пусть мир будет сложным, от этого он может показаться разобщенным, но есть «волшебная палочка» — мы сами, мы, люди, собою, своим воображением превращаем мир в легко читаемую карту. И каждый читает ее уникально и по своему.

И лучшее, что мы можем сделать, научить компьютеры воспринимать мир по своему. Создавать единые онтологии можно — главное, чтобы они не стали единственными трактованиями мира. Это очень удобно при написании парсеров, но это ужасно суживает наше восприятие мира. Ни в коем случае нельзя этого добиваться, это нужно не допустить.

Мне все же кажется, что все преимущество семантического веба и наших проводников в мире знаний — это умение контекстно-воспринимать жизнь и помнить то, какой она была до нынешнего момента. Это дает возможность анализа ситуации на основе прошлого опыта. Если вспомнить, что веб объединил множество компьютеров и множество информации, сделал сеть, то совокупность знаний, описанных в разных контекстах, приблизятся к описанию нашего мира. Это никогда не будет возможным для систем, в которых все слишком жестко.

Согласен, что онтологии работают, но они должны быть инструментом, а не идолом для поклонения. А это то, что меня и пугает в человечестве больше всего, в нас. Мы слишком привержены к попыткам остановить время, создать уютный мирок, в котором все остановилось и все предсказуемо.

beetleinweb 16 фев 2009 в 19:36

Я бы не смешивал множественность систем трактования и автоматизацию трактования. Одно другому-то нисколько не мешает.

Вообще-то, спасибо за толчок в интересном направлении (скорее, не этим комментом, а предыдущим вашим). Не так давно тут обсуждалась проблема хранения большого личного архива, и не только как неструктурированной информации, но и метаинформации. А на одну и ту же информацию можно завести множество разных систем метаинформации, параллельных и пересекающихся, и даже иерархических, типа стек подсистем (скорее даже «пирамида»).

Да, одна система описания, единичная — она чересчур жёсткая. Но ведь и чисто человеческие обобщения всегда неполны в силу отсечения лишнего — всего, что не попадает под формат. Так что это ограничение не механистичности процесса, а чисто количественное. Больше различных систем метаинформации — больше гибкость.

Я всё же надеюсь, что постепенно автоматизация в строительстве таких систем станет возможной, рентабельной, и даже рутинной. И количество информации не будет здесь препятствием. Чем больше ракушек на пляже, тем легче найти подходящую. Нет ведь нужды собирать их все (по крайней мере — все сразу).

Сначала стройные системы метаинформации будут строиться вручную, и процесс этот будет очень свободным и творческим. Затем опыт аккамулируют и создадут рекомендации для ручной обработки. Затем рекомендации станут правилами, их опишут формально, а там уже и автоматизация придёт. Всё как всегда, и во веки веков. Аминь :)

P. S.
Для меня сейчас таким «сборником метаинформации» является википедия. Всё чаще начинаю поиск оттуда. И не я один, судя по всему: вот только что набирал в гугле [википедия тоталитаризм], и сразу подсказка, таких как я — 7 450. И так почти на любое слово.

beetleinweb 16 фев 2009 в 19:53

Да, по поводу последнего абзаца. Мне кажется, не надо бояться естественного стремления человека создавать «уютные мирки», островки стабильности. В болото непредсказуемости забиваются сваи глубокого понимания. Это ведь для чего делается? Не для того, чтобы закостенеть там. А чтобы было на чём строить очень даже динамические здания. Которые однажды из воздушных замков превратяться в твёрдый фундамент для новых свершений. И так всё выше и выше. А кроме того, человек время от времени разрушает чуть ли не до основания всё слишком старое, неспособное поддерживать новое.

А вы что же предлагаете? Всю жизнь прыгать по кочкам среди непредсказуемого болота, и гордиться этим своим умением, типа «вот я крутой сёрфер, не тону там, где другой не пройдёт, хожу по воде, аки по суху»? А тех, кто строит мостики между кочками, презирать за стремление к закостенелости? И с ужасом думать, что однажды всё это заасфальтруют скоростными шоссе автоматические бульдозеры? :) Не волнуйтесь, для непредсказуемости и борьбы с ней вручную всегда будет время и место. Только уровнем выше :)

beetleinweb 16 фев 2009 в 19:57

* «Непредсказуемость» было бы лучше заменить на «хаос».

cowboywithgun 15 фев 2009 в 22:17

у меня есть гипотеза, что фраза «семантический поисковик» это оксюморон, потому что если вся информация размечена, то возникает вопрос: «что такое поиск?».