Информационные интеллектуальные сети и Семантический Веб

Информационные интеллектуальные сети, Семантический Веб, Веб 3.0, ИИ… Эти слова все чаще стали появляться в нашем обиходе.

Целая эпоха универсального Интернета заканчивается. Она начинает сменяться до того, как мы начинаем это ощущать. На смену едва оформившемуся термину Web 2.0 уже приходит другой, непонятный и загадочный на первый взгляд — Web 3.0, или же просто «Семантический Веб».

О том, что это такое и куда движется наш интернет, я хотел поговорить в этой статье.

Сейчас сеть становится персональной. «Интернет все больше знает о нас». Отчасти, мы сами способствуем этому, раздавая свою персональную информацию в социальных сетях, пользуясь поисковыми системами, будучи авторизованными.

Это означает, что скоро, вводя в строку поиска «Хочу постричься недорого», пользователь получит ответ в виде ближайшей парикмахерской к его местоположению в виде четкого ответа на четкий вопрос – нам не надо будет переходить по 10, 20, 50 ссылкам из поисковой выдачи разных поисковиков, расстраиваясь в очередной раз, что очередная открытая вкладка – это очередной дорогой салон, продвигаемый силами SEO специалистов.

Это касается различных сфер жизни и деятельности человека – начиная от бытовых и заканчивая более глобальными. Например, покупка автомобиля или квартиры, поиск работы и другие.

Более того, поисковая система сможет определить, какой именно автомобиль нужен пользователю на основе информации о том, какими тест-драйвами он больше всего интересуется и какие автомобильные сайты посещает, в каком районе и в каком ценовом диапазоне вы хотите найти квартиру, не голодны ли вы, какую еду предпочитаете и так далее.

С развитием семантического веба после сбора определенных данных о пользователе технологии позволят составить его социально-демографический портрет. Собранные пользовательские данные компьютеры будут понимать уже как портрет личности.

Во многом такой динамике способствует стремление упростить сервисы и сделать упрощенный доступ пользователей к контенту. Ставшая модной в последняя время, авторизация через социальные сети (Вконтакте, Facebook), специальные сервисы (OpenID, OAuth), комментирование через виджеты социальных сетей.

Наши сотовые сети завязывают на себя персональную информацию.

Информация – вот что будет играть решающую роль в будущем интернете!

Продвигаемая крупными игроками рынка технология NFC – предоставляющая возможность совершать покупки, используя мобильный телефон (в том числе, оплачивать проезд в метро, например), все больше связывает наши сим-карты, телефоны, банковские карты, стягивая нашу персональную информацию в единую точку.

Попробуем во всем разобраться, но пока начнем по порядку с малого. Для начала давай-те вместе с вами рассмотрим интеллектуальные информационные системы (ИИС).

Информационные интеллектуальные системы


ИИС (intelligent information system)это информационная система, которая основана на концепции использования базы знаний для генерации алгоритмов решения задач различных классов в зависимости от конкретных информационных потребностей пользователей.

Особенности и признаки интеллектуальности ИС

Любая информационная система (ИС) выполняет следующие функции:
  • воспринимает вводимые пользователем информационные запросы и необходимые исходные данные;
  • обрабатывает введенные и хранимые в системе данные в соответствии с известным алгоритмом и формирует требуемую выходную информацию.

С точки зрения реализации перечисленных функций ИС можно рассматривать как фабрику, производящую информацию, в которой заказом является информационный запрос, сырьем — исходные данные, продуктом — требуемая информация, а инструментом (оборудованием) — знание, с помощью которого данные преобразуются в информацию.

Коммуникативные способности ИИС характеризуют способ взаимодействия (интерфейса) конечного пользователя с системой.

Интеллектуальными считаются задачи, связанные с разработкой алгоритмов решения ранее нерешенных задач определенного типа

Интеллект представляет собой универсальный алгоритм, способный разрабатывать алгоритмы решения конкретных задач.

Если в ходе эксплуатации ИС выяснится потребность в модификации одного из двух компонентов программы, то возникнет необходимость ее переписывания. Это объясняется тем, что полным знанием проблемной области обладает только разработчик ИС, а программа служит “недумающим исполнителем” знания разработчика. Этот недостаток устраняются в интеллектуальных информационных системах.

Недостатки ИС и их устранение в ИИС

  1. Слабая адаптируемость к информационным потребностям пользователя.
  2. Невозможность решать плохо формализуемые задачи.

Перечисленные недостатки устраняются в ИИС, которые имеют
следующие характерные признаки:
  • развитые коммуникативные способности;
  • умение решать сложные, плохо формализуемые задачи (характеризуются наполовину качественным и количественным описанием, а хорошо формализуемые задачи – полностью количественным описанием);
  • способность к развитию и самообучению.

Классификация ИИС

I класс: системы с интеллектуальным интерфейсом (коммуникативные способности):

  1. Интеллектуальные БД;
  2. Естественно-языковой интерфейс;
  3. Гипертекстовые системы;
  4. Контекстные системы;
  5. Когнитивная графика.

II класс: экспертные системы (решение сложных задач):

  1. Классифицирующие системы;
  2. Доопределяющие системы;
  3. Трансформирующие системы;
  4. Многоагентные системы.

III класс: самообучающиеся системы (способность к самообучению):

  1. Индуктивные системы;
  2. Нейронные сети;
  3. Системы, основанные на прецедентах;
  4. Информационные хранилища.

Интеллектуальные БД


Интеллектуальные БД – отличаются от обычных возможностью выборки по запросу информации, которая может явно не храниться, а выводиться из имеющейся БД (например, вывести список товаров, цена которых выше отраслевой).

Естественно-языковой интерфейс предполагает трансляцию естественно-языковых конструкций на машинный уровень представления знаний. При этом осуществляется распознавание и проверка написанных слов по словарям и синтаксическим правилам. Данный интерфейс облегчает обращение к интеллектуальным БД, а также голосовой ввод команд в системах управления.

Гипертекстовые системы предназначены для поиска текстовой информации по ключевым словам в базах.

Системы контекстной помощи – частный случай гипертекстовых и естественно-языковых систем.

Системы когнитивной графики позволяют осуществлять взаимодействие пользователя ИИС с помощью графических образов.

Семантический Веб


HTML-страница описывает как представить информацию визуально в Веб-браузере и трудно поддаётся смысловому анализу компьютерами. Для неё невозможно автоматизировать даже такие тривиальные задачи, как нахождение людей, проектов, программ в Интернете.

Технология Семантический Веб (Semantic Web) позволяет компьютеру интерпретировать информацию в Вебе наравне с людьми, для чего разработана графовая модель описания ресурсов RDF (Resource Description Framework), которая является спецификацией W3C.

С помощью RDF можно создавать любые утверждения о любых ресурсах.

Графовая модель RDF

Утверждения о ресурсах в модели RDF состоят из троек.

Ресурсы и свойства представляются в виде URI, а литералы в формате Unicode. URI позволяет уникальным образом идентифицировать ресурсы в Вебе, а Unicode решает проблему мультиязычности.

RDF схема – это не XML схема

RDF схема описана в утверждениях RDF.
В отличие от XML схемы определяет ресурсы (термины) предметной области, а не ограничивает структуру RDF.

За ресурсами RDF схемы в спецификации W3C закреплена семантика.
пример RDF схемы
Пример RDF схемы, описанной с помощью RDF

Семантика данных – что это такое?


Под семантикой данных будем понимать возможность формального описания смысла передаваемых данных, делая их независимыми от приложений. Это особенно важно в контексте рассматриваемых нами перспектив развития Интернета – побеждает тот, у кого есть данные. Может быть очень много приложений, сайтов, сервисов, но сами по себе они будут очень мало чего значить. Будут выигрывать те, кто сможет предоставлять свой контент в любом, удобном пользователю контенте.

Какие данные можно использовать независимо от сервисов, в которых они используются сегодня: данные из баз данных, XML-документы, приложения в социальных сетях? Нет, потому что их семантика зашита в логике программы и/или неформально в спецификациях. Только данные снабжённые явной семантикой можно сделать действительно независимыми от приложений!

Зачем нужен RDF? Чем плох XML?

Вложенность тегов XML несет только синтаксис, но не несёт никакой семантики. Если мы рассмотрим различные возможные формы представления утверждения “Иван Петров преподает курс информатики” в формате XML:

		<course name="Информатика">
			<lecturer>Иван Петров</lecturer>
		</course>

		<lecturer name="Иван Петров">
			<teaches>Информатика</teaches>
		</lecturer>
	


	<teachingOffering>
		<lecturer>Иван Петров</lecturer>
		<course>Информатика</course>
	</teachingOffering>


Приложение, которое использует первый формат, не сможет понять два других формата и наоборот. Поэтому, XML хорош только как формат (синтаксис) для обмена данными, но не как модель описания семантики данных! Это же можно сказать и про другие популярные форматы (JSON, например).

Где в RDF семантика?

На уровне модели RDF семантика появляется благодаря использованию онтологий OWL (Ontology Web Language), благодаря которым компьютер может понимать, как известный ему ресурс или свойство связано с другим, неизвестным ему ресурсом или свойством соответственно и производить другие логические выводы над утверждениями RDF.

Онтологии основываются на математическом аппарате формальной логики (description logic, DL), малое подмножество которого охвачено RDF схемой. DL является вычислимым подмножеством логики первого порядка.

Пример использования семантики

Как проинтерпретирует следующие утверждения приложение, которое понимает только ресурсы словаря foaf?

<Pugofka:rybmyas_day#30032011> <Pugofka:semantic#Lector> “Виталий Юшкевич”.
<Pugofka:semantic#Lector> <rdfs:subClassOf> <foaf:Person>


Оно поймёт, что Pugofka: semantic #Lector является foaf:Person и выведет новое утверждение:

<Pugofka: rybmyas_day#30032011> <foaf:Person> “Виталий Юшкевич”


Семантические хранилища


Предполагается, что большие объёмы RDF данных будут храниться в семантических хранилищах и для доступа к ним использоваться язык запросов SPARQL – аналог SQL.

Пример запроса “вывести все проекты, созданные Pugofka” на SPARQL:

PREFIX  dc: <http://purl.org/dc/elements/1.1/>
PREFIX  foaf: <http://xmlns.com/foaf/0.1/>
SELECT  ?title
WHERE   { ?project foaf:name “Pugofka”.
                  ?project  dc:title ?title}


В качестве примеров развития направления можно привести создание новых проектов. Так, например, компания «Clark&Parsia» (http://clarkparsia.com/) уже имеет несколько серьезных проектов в сфере Семантического Веба, и на первые числа Апреля назначен старт бета-тестирования RDF-базы данных под названием StarDog.

Уровни Семантического Веба

Уровни Семантического Веба

Эволюционный подход

Семантический Веб это не замещение существующего интернета, а всего лишь его эволюционное развитие. RDF/XML либо внедряется внутрь HTML или доступен по URL.

По этому принципу уже широко используются в WWW RDF-данные с использованием словарей RSS, FOAF (Friend Of A Friend), DOAP (Description Of A Project).

Пример кода FOAF на странице пользователя LiveJournal
Пример кода FOAF на странице пользователя LiveJournal

Семантический веб – цели, задачи, примеры


Технология Семантический Веб успешно решает следующие задачи:
  • независимость данных от приложений;
  • семантическая интеграция данных;
  • создание основы для повсеместного использования компьютерных агентов (сервисов);
  • Data Mining;
  • Экспертные системы;
  • Проблемы единой авторизации*.

*Если есть ресурс с несколькими возможными способами авторизации, и учетная запись на сайте, к которой привязываются сторонние аккаунты (VK, FB, Twi, OpenID, Oauth…), то мы можем научиться уникально идентифицировать, что это все один и тот же пользователь и связывать всю имеющуюся о нем информацию.

Семантический Веб создан не на пустом месте. В него заложены фундаментальные основы:

  • графовая модель представления полуструктурированных данных (OEM, Lore);
  • формальная логика (логика первого порядка, базы знаний, фреймы);
  • архитектура WWW (URI, Unicode, XML, HTTP);
  • криптография с открытым ключом.

Технологии, которые задействованы в Семантическом Вебе

  • семантический поиск;
  • вопросно-ответные системы;
  • агенты;
  • объединение знаний (интеграция баз данных);
  • всепроникающие вычисления (ubiquitous/pervasive computing)

Примеры программной поддержки технологии

  • библиотеки для интерпретации стека языков RDF для всех популярных языков программирования (Jena, Redland, RDFLib);
  • редакторы онтологий (Protégé);
  • системы рассуждений над онтологиями (Racer, KAON, FACT);
  • семантические хранилища (Sesame, Kowari, YARS);
  • семантические браузеры (Simile, Piggy Bank, Gnowsis, Haystack);
  • поисковики семантических данных (Swoogle);
  • конверторы из разных форматов представления данных в/из RDF/XML (Aperture, RDFizers, D2R);
  • прикладные программы (Bibster, FOAF Explorer);
  • Stardog, the RDF database;
  • Примеры

Направления исследования

  1. Foundations
    1. Knowledge Engineering and Ontology Engineering
    2. Knowledge Representation and Reasoning
    3. Information Management
    4. Basic Web Information technologies
    5. Agents
    6. Natural Language Processing
  2. Semantic Web Core topics
    1. Infrastructure
    2. Resource Description Framework and RDFSchema
    3. Languages
    4. Ontologies
    5. Rules and Logic
    6. Proof
    7. Security and trust and privacy
    8. Applications
  3. Semantic Web Special Topics
    1. Natural language processing and human language technologies
    2. Social impact of the Semantic Web
    3. Social networks and Semantic Web
    4. Peer-to-peer and Semantic Web
    5. Agents and Senatic Web
    6. Semantic Grid
    7. Outreach to industry
    8. Benchmarking and scalability

Задачи и проблемы Семантического Веба:

  • индексация и поиск информации;
  • разработка и поддержка метаданных;
  • разработка и поддержка методов аннотирования;
  • представление Web в виде большой, интероперабельной базы данных;
  • организация машинной добычи данных;
  • обнаружение (discovery) и предоставление веб-ориентированных сервисов;
  • исследования в области интеллектуальных программных агентов.

Заключение


Семантический Веб – это динамичная, постоянно развивающаяся концепция, а не набор комплексных, работающих систем.

Веб 3.0 – очень многогранное и, на текущий момент, до сих пор не сформированное понятие. Его можно рассматривать с разных точек зрения.

Например, с точки зрения машинной обработки данных – Семантический веб – это идея хранить данные такие образом, чтобы они были определенными и связанны, а также существовала возможность их дальнейшей автоматизированной обработки, интеграции и многократного использования в различных сервисах, приложениях и т.п.

С точки зрения интеллектуальных агентов, то целью будет являться более «машиноориентированный» Веб,
с тем, чтобы можно было наиболее эффективно использовать поисковых пауков (агентов) для поиска и обработки информации.

С точки зрения распределенных баз данных, баз знаний, то концепция Семантического Веба заключается в описании, добавлении дополнительной мета информации, которая позволяет однозначно идентифицировать и сопоставить информацию.

Концепция Веб 3.0 подразумевает наличие целой инфраструктуры.

С точки зрения обслуживания пользователей (потребителей контента) – идея Веб 3.0 заключается в минимизации действий пользователю и выдаче в качестве ответа на его запрос непосредственного ответа на его запрос, который будет учитывать не только его запрос, но и всю его историю, особенности (социально–психологический портрет), вкусы, интересы и многие другие факторы.

С точки зрения качества поиска – реализация поиска не только по ключевым словам или контексту, но и по контенту. Выдача точного ответа на запрос пользователя. Во многом, использование поисковой системы, как экспертной системы.

С точки зрения веб-сервисов Семантический Веб обеспечивает доступ не только к существующим статическим сайтам, но и к динамическим, приложениям, сервисам и другим ресурсам, содержащим полезный контент.

Similar posts

AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 43

  • UFO just landed and posted this here
      +1
      Согласен с тем, что данные не самые свежие. Старался комбинировать то, что смог найти из свежего и написать про старые фундаментальные основы.

      Сам начал погружаться в эту тему не так давно, но подобных полных обзоров не попадалось, поэтому постарался расписать все начала изучения.

      Что касается развития, не так давно попалась ссылка stardog.com/
      «Stardog is a commercial RDF database: insanely fast SPARQL query, transactions, and world-class OWL reasoning support.»

      Совсем свежая штука и достаточно активно развивается. Да, на семантике уже сейчас есть достаточно крупные проекты, но они все не сегодняшние далеко. Мне пока что «свежей крови» найти не удалось пока что. Да, этому направлению еще развиваться и развиваться. Теория за это время шагнула прилично, а практики (по крайней мере, я лично) не особо много то и нашел, к сожалению.

      Тем не менее, семантика дает очень интересные взгляды на способы решения задач.

      Если вы поделитесь ссылками на свежие проекты — буду благодарен.
      • UFO just landed and posted this here
          0
          Спасибо большое.
          +2
          Еще можете упомянуть о том, что в родимых странах учат технологиям, связанным с SW. В Петербурге я знаком с кафедрой в ЛЭТИ, где открыли специальность Технологии семантического веба.
          Мы в ИТМО тоже не отстаем и помимо обучения своих студентов SPARQL и OWL иногда проводим семинары-литние школы для всех желающих.
          +1
          Ну вы захотели, тогда еще ни RDF-Schema, ни OWL, ни SPARQL не было, тогда только все начиналось, а сейчас как раз подходящее время и уровень развития технологий чтобы начинать внедрять потихоньку.
          • UFO just landed and posted this here
              0
              Не важно что там плюс минус год, важно что в то время только сформировалась основа семантического веба, тогда это было лишь идеей и стандартами на бумажках, сейчас появилось много инструментов и технологий, которые дали возможность начать что-то внедрять и использовать.

              Всему свое время.
            0
            Из крупных коммерческих продуктов можно назвать пожалуй OpenLink Virtuosso, BigOwlim, Oracle Spatial (насколько знаю хранит данные в RDF)
            И эти проекты являются инструментами, но не решают прикладных задач. Грустный смайлик.

            В целом, с вами согласен. Хотя добавил бы пару оптимистичных ноток. Во-первых, как ни крути, а хотя бы одна технология из семантического стека вырвалась в мейнстрим — RDFa. Linked Data будет вторым в этом списке. Хотя впечатляющие его применения уже есть (тот же BBC'шный сайт Олимпиады), о мейнстриме пока говорить не приходится.
              0
              микроформаты часто объявляются кастрированными братьями RDF, но тут есть место для споров.
            0
            Ну поэтому и обратил внимание, что уровень развития теории \ технологий подрос, а проектов пока еще нет (опять таки, говорю нет лишь потому, что мною не были найдены достойные и современные).
              –3
              Какой пиздёш…
                –3
                Согласен. Кто-то выдает желаемое за действительное.
                Если уж на то пошло, я скорее согласен признать Социальные сети — Веб 3.0
                Рядовые пользователи проводят в соц. сетях значительную часть своей онлайн-жизни.

                Все эти семантические сети и утверждения о важности информации, упускают факт, что в интернете дохрена информации! И каждые 3-4 года она удваивается.
                Информацию нужно сортировать, сравнивать, анализировать. Ей нужно управлять. И определять ее важность. Тот же феномен «I like it» от Facebook — шикарный пример нового уровня социализации интернета и общества.

                А насчет информации. Зайдите в гугл, вбейте запрос, получите в ответ «по вашему запросу найдено 100 миллионов страниц» и задумайтесь насколько было бы лучше если бы их было 100 миллиардов?
                  0
                  Вопрос не в количестве, а в качестве
                0
                Ох… Для начала определилась с ключевыми понятиями: информация, данные, знания и база зананий. Вы часто путаете первое со вторым, не даете определения базе знаний да и вообще самим знаниям, а это между прочим совсем нерешенный вопрос и определений ему сотни.

                Как говорилось выше, семантические сети — это вопрос начала 2000-х, называть это вебом 3.0 не стоит.

                В общем смысл статьи не уловил.
                • UFO just landed and posted this here
                    0
                    Мне казалось, что противоречий в статье нет. Я не давал четких определений таким терминам, как информация, данные и другим. Я посчитал, что это уже устоявшиеся термины.

                    В статье упоминалось об интеллектуальных базах данных, базах данных и базах знаний, это все таки несколько разные понятия, и мне казалось я вполне однозначно определил их.

                    Насчет того, что определения термину «знания» на текущий момент может быть и нет точного, хотя мне казалось, что оно вполне достаточно определено (http://ru.wikipedia.org/wiki/%D0%97%D0%BD%D0%B0%D0%BD%D0%B8%D0%B5), но я не ставил себе задачу в этой статье раскрыть этот термин. Ставились совсем другие задачи, и на мой взгляд, они решены.

                    Вы написали, что семантические сети — это вопрос начала 2000-х и что их не следует называть вебом 3.0. Не буду спорить о датах. Лишь обращу внимание, что семантические сети и семантический веб — это все таки разные понятия. И вот последнее — семантический веб — на мой взгляд, вполне достоин чести носить имя «Веб 3.0».

                    Это лишь мое мнение.

                    Очень жаль, что я не смог достаточно хорошо донести основную мысль своей статьи, поэтому вы не уловили ее смысл.
                      +1
                      Мне стоит извинится. Для меня «интеллектуальное что-то» подобно «красной» тряпке, и поздно вечером тянет критиковать, а не идти спать.) Утром я бы просто прошёл мимо.

                      Чуть-чуть оправдаю свою позицию. Интеллектуальность – это способность творчески мыслить, такого машинам не дано и говорить об интеллектуальности машин можно только после изобретения ИИ.

                      Более честно описываемые вами «интеллектуальные БД» было бы назвать «mash-up сервисы с функцией поиска», на подобие mash-up сервисов Yahoo Pipes, MS Popfly, которые позволяют агрегировать информацию из разных источников.

                      Что касается терминов информация и прочее – они совсем не устоявшиеся в философском плане. Есть интуитивное представление этих терминов, не спорю, и его вполне достаточно, чтобы с ними работать, но в научном плане определений пока очень много (можете посмотреть в туже википедию), и стоит хотя бы в начале определять, каким понятием вы оперируете.
                      +1
                      Говорить, что Semantic Web — вопрос начала 2000-х некорректно. Semantic Web активно развивается и еще надерет всем задницу.

                      — Видишь суслика?
                      — Нет
                      — А он есть!

                      Так и с Semantic Web. Это не та технология, которая должна быть на виду (как социальные сети). Лучшие умы как раз трудятся над тем, как сделать использование семантики незаметным для обычных пользователей.
                      0
                      Очень много текста, который вроде как нацелен на экскурс в семантический веб, но при этом не объясняет кучи мелких важных штук.

                      Ну и да, сейчас модно говорил про LOD :D
                        +2
                        Не обижайтесь, но статья водянистая и очень-очень нереалистичная. «Страшно далеки они от народа» (с).
                        Самое главное — это всё конечно здорово, но непонятно зачем. С задачами слежения за пользователем, поисковой выдачи на базе геолокации и прочими там NFC отлично справляются обычные дедовские математические алгоритмы, а других внятных плюшек в статье не озвучено.
                        Есть мнение, что вся эта ваша семантика — это попытка переложить задачу по пониманию естественных языков с машин на программистов/верстальщиков, то есть не построить, наконец, ИИ, а избежать его построения. Это путь в никуда, в итоге получится тот же естественный язык, только с красивыми угловыми скобочками а-ля XML.
                        Особенно странно все эти попытки выглядят на фоне достаточно толковых и даже иногда проходящих тест Тьюринга чат-ботов и заявлений поисковиков о том, что они в целом уже понимают естественные языки.
                          0
                          Совершенно согласен, что не люди должны разжевывать смысл текста бестолковым компьютерам, а компьютеры сами должны учиться его понимать. А вот логический вывод на основе этого смысла — вполне интересное и перспективное дело. Так что семантические сети могут «выстрелить», но только после того, как компьютеры начнут справляться с естественным языком.
                            0
                            Развитие технологий осмысления текста — это самое перспективное на сегодняшний день направление. Семантическая сеть по определению импотентна в этом отношении. И вообще, извлечение смысла из текста не подвластно лингвистике, пусть даже и компьютерной. Другое дело эвристико-ассоциативные методы на базе эвритического процессора, например, по технологии Ontology, использующая надлинвистические онтологотивные способы и средства.
                          0
                          На уровне модели RDF семантика появляется благодаря использованию онтологий OWL (Ontology Web Language)
                          А сам RDF разве не несет семантики? :)
                            0
                            Даже сам OWL не несёт семантики =)
                              0
                              Поясните, пожалуйста
                                0
                                www.loa-cnr.it/ontologies/DOLCE-Lite.owl — что-нибудь в этом документе понятно?
                                  0
                                  Вполне.

                                  Вернемся к RDF. Вот пример RDF-данных: <habr:Idsa> <habr:discussWith> <habr:CheatEx> Разве это выражение не несет семантики?
                                    0
                                    Давайте попробуем записать это выражение немного иначе: <wasap:user123456> <wasap:eatingBrainOf> <wasap:user789>. Очевидно, что с точки зрения машин, для которых язык RDF типа и предназначен, это выражение совершенно идентично вашему. Так-же очевидно, что для многих людей оно имеет некоторое значение, порождает в их умах некоторые образы.

                                    Итак, у нас есть два формально одинаковых выражения, которые при этом порождают разные ассоциации даже у одного человека. Вопрос: какая семантика в нём выражена?
                                      0
                                      Хорошо, допустим. Но когда же появляется семантика?
                                        0
                                        Не знаю. Есть мнение, что она опявляется вместе с человеком, но это уводит нас за пределы информатики :)
                                          0
                                          Интересный взгляд. Я в таком контексте не думал о семантике (или нужно брать в кавычки слово семантика? :) ). То есть вы клоните к тому, что RDF (как и OWL) являются лишь формой описания некоторой семантики (о которой договорились авторы и пользователи онтологии)? Если так, это во многом выглядит как придирка к моей фразе :) Ведь если RDF является формой представления некоторой семантики, то значит, что он несет в себе эту семантику.
                                  • UFO just landed and posted this here
                                      0
                                      Да, но вопрос то был про значение для людей, а не про формальный ризонинг.
                                      • UFO just landed and posted this here
                              +2
                              Semantic web — это, по-моему, такой Duke Nukem Forever из мира веб-технологий. Еще десять лет назад его апологеты говорили о том, как скоро SW изменит интернет. Помню все эти живописания, как интеллектуальные помощники-агенты будут отвечать на наши запросы не с помощью полнотекстового поиска, а с помощью логического вывода в базе знаний, и как SW поможет решить проблему омонимов и т.д. и т.п. Однако прошло 10 лет и интернет не только не превратился из помойки в структурированную базу знаний, но и вообще почти не приблизился к этой цели. Мне кажется, это доказывает, что концепция SW при всей своей изящности, перспективности и логичности слишком уж утопична.

                              Безусловно, у SW есть свои узкие профессиональные ниши, где польза перевешивает затраты на внедрение, но рассчитывать на распространение этих технологий во всем интернете в обозримом будущем не стоит. Одна из причин — все растущая доля user-generated content в интернете, который превратить в формализованные знания практически невозможно. Думаю, что ближайшее будущее за компьютерным анализом естественных языков.
                                +1
                                Это скорее не Duke Nukem, а программа Аполон. Зачем именно летят непонятно, но ряд полезных результатов достигнут.
                                +3
                                Хорошая статья, спасибо большое! Очень грустно, что так много отрицательных отзывов в духе «уу, нигде это не применяется, все это утопия».

                                Вам не кажется, что следующий топик можно посвятить более конкретному обзору успехов Semantic Web?

                                Ну вот например, появившейся поддержки RDFa в Drupal, Semantic MediaWiki, сервису OpenCalais, системе SNOMED-CT, использованию существующих SW-поисковиков типа sig.ma, обзору того, как используется представленные в RDF правительственные хранилища data.gov и data.gov.uk для создания аналитических обзоров, тому, как с помощью dbpedia можно искать данные по куче критериев, тому, как BBC использует LOD для того, чтобы связать свои данные.

                                А кровавый энтерпрайз? В T-Systems создают системы поддержки бизнес-процессов автомобильных компаний, где процесс начинается с того, что описывается онтология двигателя! В OWL. И система увязывает её с чертежами, документаций и прочим! Похожую систему от SAP использует BMW — и там полным полно вещей из стека Тима Бернерса-Ли. Решения компании Ontoprise можно щупать уже сейчас — и тупо идти ставить их в ближайшую контору, где мучаютя от обилия данных.
                                Ну а IBM-овские средства работы с RDF, а Oracle?

                                Буду рад помочь вам ссылками и статьями.
                                  0
                                  Спасибо огромное за отзыв!

                                  Буду признателен за материалы и следующий обзор постараюсь сделать более точным и конкретным.
                                  • UFO just landed and posted this here
                                    +1
                                    Офтопик — а кто может переименовать этот блог в Semantic Web или Семантическая паутина? Ведь семантическая сеть — это структура представления знаний из семидесятых (вместе с фреймами).
                                      0
                                      Тут Сеть с большой буквы =)
                                      0
                                      Семантика, как известно, охватывает раздел лингвистики, как научной дисциплины, изучающий ЗНАЧЕНИЯ слов и их РОЛИ в естественно-язычных текстах (речи).
                                      Во фразе «Патрон вошел в магазин» для слова «Патрон» имеется, как минимум, четыре значения (семантиса): как босс организации, как деталь токарного станка, как снаряд стрелкового оружия, как устройство для крепления лампы. А для слова «магазин» тоже имеется своя пара семантисов: как торговое предприятие, как устройство хранения патронов. Простым перемножением 2 на 4 получим 8 разных вариантов для смыслов этой фразы. При этом обращаю внимание на то обстоятельство, что термины «семантис» и «смысл» являются совершенно разными понятиями, значительно отстоящими друг от друга. Эти два термина постоянно путают между собою.

                                      Поскольку машина пока не умеет понимать смысл фразы, то разработчики программ по обработке текстов занимаются тем, что пытаются «заехать в Одессу через Херсон», то есть, решить искомую проблему с помощью так называемых «семантических связей и отношений» между словами, которые устанавливает, в общем-то, человек и может каждый раз делать это по разному, исходя из своего опыта и накопленных знаний.
                                      Когда эту «человеческую функцию» пытаются переложить на компьютер, то он начинает теряться и ему очень трудно понять, о каких именно «магазинах» и «патронах» идёт речь.

                                      Особенно выпукло это проявляется в системах машинного перевода, когда необходимо знать точный переводной аналог слова по его правильно по контексту выявленному семантису. Вот с этой целью и пытаются с помощью семантической сети определить верный вариант из восьми возможных для фразы «Патрон вошёл в магазин».

                                      Вообще у слов сплошь и рядом встречается многозначность сем, которая так и называется – полисемия, и семантика здесь не способна сама справиться с ней. Это известный факт из системного анализа, что система не может искоренить присущие ей свойства (проблемы), пока либо не воспользуется внесистемными технологиями, либо сама не перестроится.

                                      Поэтому с языковой многозначностью в компьютерной лингвистике нужно бороться на уровне надлингвистических методов и средств, например, привлекая эвристику и модели мироздания.

                                      Only users with full accounts can post comments. Log in, please.