Pull to refresh
  • by relevance
  • by date
  • by rating

W3C: Логотип семантической сети и юзербары

Semantics *
Всемирный Консорциум WWW опубликовал логотип семантической сети и полоски для пользователей:

И таблица юзербаров.

GRDDL SW Button - GRDDL - blue SW Button - GRDDL - green SW Button - GRDDL - orange SW Button - GRDDL - gray SW Button - GRDDL - magenta
OWL SW Button - OWL - blue SW Button - OWL - green SW Button - OWL - orange SW Button - OWL - gray SW Button - OWL - magenta
RDF SW Button - RDF - blue SW Button - RDF - green SW Button - RDF - orange SW Button - RDF - gray SW Button - RDF - magenta
SPARQL SW Button - SPARQL - blue SW Button - SPARQL - green SW Button - SPARQL - orange SW Button - SPARQL - gray SW Button - SPARQL - magenta


Далее опубликована лицензия и правила использования.
Total votes 34: ↑29 and ↓5 +24
Views 1K
Comments 33

Язык Web-онтологий OWL 2: начальное руководство (перевод)

Lumber room
На сайте SHCHERBAK.NET опубликован неофициальный перевод на русский язык чернового варианта
одного из наиболее важных стандартов Semantic Web — руководства по языку Web-онтологий OWL 2
Перевод можно почитать по адресу — shcherbak.net/perevody-w3c
Total votes 6: ↑5 and ↓1 +4
Views 1K
Comments 3

Простой RDF-репозиторий на PHP и MySQL для начинающих

Semantics *
Проблема: сложность практического освоения технологий семантической сети начинающими.

Предлагаю совместными усилиями выработать конкретное решение, позволяющее запустить у себя маленькое хранилище и научиться делать запросы.

Задача: разобраться в создании, хранении и обращении к словарю, в использовании языка запросов на начальном уровне на практике.

Если вы примете участие в обсуждении и будете подсказывать лучшие решения, то я буду обновлять этот пост по мере совместного нахождения новой информации. Надеюсь, в итоге получится небольшой урок для начинающих.
Читать дальше →
Total votes 9: ↑9 and ↓0 +9
Views 5.2K
Comments 20

немного о SPARQL точке доступа

Lumber room
SPARQL (рекурсивный акроним, SPARQL Protocol and RDF Query Language) — разработанный стандарт семантической паутины, прошедший стандартизацию RDF Data Access Working Group (DAWG) консорциума World Wide Web (W3C).©Wikipedia

Задача состоит в том, чтобы создать SPARQL точку доступа
В английских источниках предлагаются вариации названия от entry point до end point. Насколько я понимаю, это все про точку доступа.

сначала описание приложения:
База знаний — OWL, построена в Protege, поэтому соответствует логике image
Модуль логического вывода — пока не прикручен
язык программирования — java

SPARQL точка доступа по сути представляет собой комбинацию языка запросов SPARQL и протокола SPARQL. Все это также можно назвать веб-сервисом(веб-службой).

SPARQL протокол это здесь на русском ожидается здесь
про SPARQL язык запросов тут

Основные возможности точки доступа:
* Query composition — A client must know the capabilities of a server in order to compose suitable queries. ODBC and JDBC have fairly extensive metadata about each DBMS's SQL dialect and other properties. These may in part serve as a model.
* Content Discovery — What is the data about? What graphs does the end point contain?
* Query planning — When making an execution plan for federated queries, it is almost necessary to know the cardinalities of predicates and other things for evaluating join orders and the like.
* Query targeting — Does it make sense to send a particular query to this end point? The answer may contain things like whether the query could be parsed in the first place, whether it is known to be identically empty, estimated computation time, estimated count of results, optionally a platform dependent query plan.


Конечно, все сразу не получится, начнем с малого.
Здесь можно ближе присмотреться к sesame
Все бы хорошо, однако нам нужен SPARQL, здесь же предлагается альтернативный язык запросов SeRQL. Цитата «SeRQL (»Sesame RDF Query Language", pronounced «circle») is an RDF query language that is very similar to SPARQL, but with other syntax. SeRQL was originally developed as a better alternative for the query languages RQL and RDQL. A lot of SeRQL's features can now be found in SPARQL and SeRQL has adopted some of SPARQL's features in return. "

Есть еще инструменты для php типа ARC.

Речь же идет о реализации sparql точки доступа на java
Просмотрев все предлагаемые решения(собственно, со SPARQL в java не густо, или я не там и не то ищу ), остановилась на ARQ в Jena
в общем, да, написано немного, но хоть какие-то зацепки есть
Дальше напишу, что из этого вышло
Total votes 3: ↑3 and ↓0 +3
Views 1.3K
Comments 4

Семантическое будущее Веба — SemanticFuture.Net

Semantics *
Уважаемые читатели, в течение последних трех месяцев мы собирали материалы по семантическим технологиям. В результате мы создали SemanticFuture.Net для анализа применимости семантических технологий и средств, таких как Semantic MediaWiki, Virtuoso, OWL и Sparql, к русскоязычным ресурсам.

На страницах Semantic Future мы будем:
1) собирать актуальную информацию по современным семантическим технологиям и сервисам, по всему тому, что сейчас или в ближайшее время будет оказывать свое положительное влияние на развитие Веб;
2) делать презентацию наших трудов и достижений;
3) организовывать встречи и тематические мероприятия;
4) тестировать семантические программные продукты и подбирать для вас специалистов для внедрения семантик технологий в ваши системы и продукты.
Кто мы?
Мы это Semantic Web User Group (SWUG).
Читать дальше →
Total votes 45: ↑38 and ↓7 +31
Views 1.2K
Comments 28

Элементы семантической паутины

Semantics *
Сложность структуры современного информационного общества постоянно растёт. В связи с этим, требования к эффективности алгоритмов обработки информации также увеличиваются. В последнее время наиболее популярными направлениями в этой области являются Data Mining (DM), Knowledge Discovery in Databases (KDD) и Machine Learning (ML). Все они предоставляют теоретическую и методологическую базу для изучения, анализа и понимания огромных объёмов данных.
Однако этих методов не достаточно, если сама структура данных будет настолько плохо пригодной для машинного анализа, как исторически сложилось на сегодняшний момент в Internet.
Для решения данной проблемы предпринята глобальная инициатива реорганизации структуры данных Internet в целях преобразования его в Семантическую Паутину предоставляющую возможности по эффективному поиску и анализу данных как человеком так и программным агентам.
В этой статье рассмотрены основные технологии позволяющие реализовать Semantic WEB.

Читать далее..
Total votes 63: ↑57 and ↓6 +51
Views 13K
Comments 31

Осенняя школа Semantic Web в ИТМО

Semantics *
Порог вхождения в Semantic Web не то, чтобы сильно высок, однако первые пару-тройку недель приходится разгребать ужасную кашу из стандартов, языков, инструментов и внушительного математического аппарата, размышляя над тем, что же из всей этой каши наиболее полезно.
Наши семинары предназначены для тех, кто слышал о семантик вебе, но так и не понял
  1. что это такое,
  2. почему это благо, и, наконец,
  3. как этим пользоваться.
Читать дальше →
Total votes 2: ↑2 and ↓0 +2
Views 2K
Comments 8

Создание семантического веб-приложения

Ruby on Rails *
Tutorial
railsrdf
В рамках моего дипломного проекта мне предложили создать систему формирования проектных команд на основе технологий семантической паутины. Так как я уже переболел голым PHP, SQL, ZF, и имел опыт программирования на Ruby on Rails, ознакомившись с существующими гемами и решениями для работы с RDF, решил писать на нём, т.к. не очень люблю яву (да простят меня ява-разработчики), хотя она и является самым передовым языком в области semantic web, intelligent agents, data mining.
Читать дальше →
Total votes 79: ↑70 and ↓9 +61
Views 16K
Comments 30

Автор «Джона Потрошителя» выступит на PHDays 2012

Positive Technologies corporate blog
В 1996 году Александр Песляк (Solar Designer) создал программу John the Ripper. Эта кроссплатформенная утилита для анализа стойкости паролей вошла в топ-10 самого популярного софта в сфере ИБ, а сайт программы посетили 15 млн человек.

Кроме того, Александр является основателем проекта Openwall и ведущим разработчиком Openwall GNU/Linux (Owl) — операционной системы с большой степенью защищенности.

Александр Песляк считается величайшим специалистом по взлому паролей со времен Али-Бабы и Абу Юсуфа аль-Кинди. В 2007 году такие проекты, как phpBB 3, WordPress и Drupal приняли разработанные им усовершенствования безопасности пароля.
Читать дальше →
Total votes 12: ↑11 and ↓1 +10
Views 4.9K
Comments 1

Редактор онтологий на естественном языке

Semantics *
На выставке CeBIT я познакомился с представителями польской компании Cognitum, которая разрабатывает семантический фреймворк Ontorion. Важнейшей частью этого фреймворка является редактор онтологий Fluent Editor, который показался мне замечательным и достойным обзора. Главное достоинство Fluent Editor'а состоит в том, что он позволяет создавать OWL-онтологии людям, не имеющим представления о синтаксисе OWL (хотя иметь представление о его концепциях, и о моделировании информационных структур, конечно, все равно нужно). Онтологии создаются на естественном языке, Controlled English — то есть на обычном английском, к которому применены определенные правила и ограничения. Приведу обзор основных возможностей синтаксиса этого языка, не забывая смотреть на то, в каком виде его основные выражения будут сохраняться в OWL.

Для примера начнем составлять онтологию, содержащую сведения о бизнесе некой компании. У этой компании, как у любой коммерческой организации, есть поставщики и покупатели. Те и другие являются организациями, причем одна и та же организация может быть одновременно и поставщиком, и покупателем. Запишем соответствующие выражения на Controlled English:

Every customer is a organization.
Every supplier is a organization.

Читать дальше →
Total votes 32: ↑31 and ↓1 +30
Views 18K
Comments 14

Базы знаний. Часть 1 — введение

Semantics *API *Open data *
Одной из причин слабого использования Linked Data-баз знаний в обычных, ненаучных приложениях является то, что мы не привыкли придумывать юзкейсы, видя перед собой только данные. Трудно спорить с тем, что сейчас в России производится крайне мало взаимосвязанных данных. Однако это не значит, что разработчик, создающий приложение для русскоязычной аудитории совсем уж отрезан от мира семантического веба: кое-что всё-таки у нас есть.
image
Основными источниками данных для нас являются международные базы знаний, включающие русскоязычный контент: DBpedia, Freebase и Wikidata. В первую очередь это справочные, лингвистические и энциклопедические данные. Каждый раз когда вам в голову приходит мысль распарсить кусочек википедии или викисловаря — ущипните себя как следует и вспомните о том, что всё, что хранится в категориях, инфобоксах или таблицах, уже распарсено и доступно через API с помощью SPARQL или MQL-интерфейса.

Я попробую привести несколько примеров полезных энциклопедических данных, которые вы не найдете нигде, кроме Linked Data.

Эта статья — первая из цикла Базы знаний. Следите за обновлениями.


Читать дальше →
Total votes 69: ↑66 and ↓3 +63
Views 64K
Comments 29

Технологии Semantic Web

Высшая школа ИТИС КФУ corporate blog Search engines *Semantics *Open data *
Tutorial
Semantic Web (он же Web of Data, Linked Data, Linking Open Data) — это направление развития Всемирной паутины, позволяющее машинам не только отображать информацию в интернете, но и понимать ее смысл.



Несколько лет назад Semantic Web вырвался за пределы исследовательских лабораторий и стал достоянием широкого круга разработчиков. К сожалению, в русскоязычном сообществе SW распространен пока слабо. Мало русскоязычных наборов данных. Мало приложений, которые с ними работают.

Одна из причин — отсутствие на русском языке полноценного открытого обучающего материала. Есть хорошие узкоспециализированные статьи. Есть хорошие обзоры. Но нет систематического обучающего курса.

Мы с коллегами из ИТИС КФУ при поддержке Computer Science клуба и сообщества SWUG решили сделать такой курс, который я хочу представить хабралюдям. Он состоит из шести частей:

  1. Введение в семантику и Semantic Web;
  2. Формат представления данных RDF;
  3. Формальные онтологии;
  4. Язык описания онтологий OWL;
  5. Язык запросов SPARQL;
  6. Semantic Web в дикой природе: популярные ресурсы, онтологии и сервисы.

Я решил оформить курс не в виде сплошного текста, а виде слайдов с примерами и картинками. Надеюсь, его будет интереснее читать, чем традиционные учебники. (См. ответ на замечание ivanych относительно выбора формата).

Смотрите первые две части под катом.
Смотреть первые две части
Total votes 30: ↑26 and ↓4 +22
Views 26K
Comments 44

Семантические технологии просто и доступно на примере родословных

Python *Semantics *Data Mining *Algorithms *Data visualization
Tutorial
Программа, способная к логическим выводам в рамках поставленной задачи, может казаться техническим чудом и воплощением Скайнета. Но, как можно убедиться ниже, на сегодняшний день создать такую программу на языке Python не составит труда, если использовать семантические технологии. Мы остановимся на наглядном примере онтологий — родословных — и для любого члена семьи в родословной сможем выводить его родственные отношения произвольной сложности (она ограничена вычислительными ресурсами). К примеру, на фамильном древе семьи Романовых ниже показан внучатый двоюродный племянник (first cousin twice removed) российского императора Петра II.

image

Так что если вы хотите познакомиться с технологиями семантического веба на практике, добро пожаловать под кат, где мы потренируемся на кошках на родословных.
Читать дальше →
Total votes 12: ↑12 and ↓0 +12
Views 16K
Comments 2

Как запутать аналитика. Часть первая

Semantics *System Analysis and Design *IT Standards *ООP *Mathematics *
— В армии научились совмещать пространство и время.
— Как?
— Очень просто! Прапорщик дает задание: «Сегодня будем копать от забора и до обеда»

В этой статье я начну рассказ о путаницах, которые регулярно встречаются, и которые кочуют в информационные модели без всякого критического анализа.

В прошлой статье я дал определения типу и атрибуту. Напомню их:

  • Тип – это выделение кучки (подмножества) из кучи (множества) и наделение объектов этой кучки уникальным именем — существительным.
  • Атрибут разделяет кучу (множество) на кучки (подмножества) и наделяет объекты этих кучек разными прилагательными.

Это было определение типа и определение атрибута на основе анализа – мы делили кучу на части. Фактически, это было построение типа при помощи анализа. Теперь я покажу, как можно строить типы и атрибуты на основе синтеза.
Читать дальше →
Total votes 16: ↑13 and ↓3 +10
Views 10K
Comments 14

Как запутать аналитика. Часть вторая: что такое моделирование предметной области?

Semantics *System Analysis and Design *Designing and refactoring *IT Standards *ООP *
В прошлой статье я говорил о заблуждениях, к которым склонны программисты и обещал рассказать про заблуждения, к которым склонны не только программисты, но и каждый из нас.

Объект учета и результат его классификации (существительные)


Проведем мысленный эксперимент. Представьте себе два хранилища моделей. В одном хранилище созданы классы для хранения моделей плавательных средств, в другом – классы для хранения моделей автомобилей. Допустим, что есть объект, который в одном хранилище описан как объект класса плавсредство, а во второй – как объект класса автомобиль. Допустим, что стоит задача объединения этих хранилищ в одно. Как вы это сделаете?
Читать дальше →
Total votes 16: ↑13 and ↓3 +10
Views 8.7K
Comments 63

Semantic Web и Linked Data. Исправления и дополнения

Semantics *NoSQL *IT Standards *Professional literature Research and forecasts in IT
Tutorial

Хочу представить публике фрагмент вот этой недавно вышедшей книги:

Онтологическое моделирование предприятий: методы и технологии [Текст]: монография / [С. В. Горшков, С. С. Кралин, О. И. Муштак и др.; ответственный редактор С. В. Горшков]. — Екатеринбург: Изд-во Уральского ун-та, 2019. — 234 с.: ил., табл.; 20 см. — Авт. указаны на обороте тит. с. — Библиогр. в конце гл. — ISBN 978-5-7996-2580-1: 200 экз.

Обложка и корешок книги


Цель выкладки этого фрагмента на Хабре троякая:


  • Собрать вопросы и замечания, чтобы учесть их при включении этого текста в переработанном виде в другие издания.
  • Внести дополнения, не очень совместимые с форматом печатной монографии: злободневные примечания (ниже они под спойлерами) и гиперссылки; а также внести исправления (ниже они никак не выделены).
  • Многие адепты Semantic Web и Linked Data до сих пор считают, что их круг столь узок в основном потому, что широкой публике все еще по-хорошему не объяснили, что же это такое — Semantic Web и Linked Data. Автор фрагмента, хоть к этому кругу и принадлежит, такого мнения не придерживается, но, тем не менее, считает себя обязанным сделать еще одну попытку.
Глава I. Параграф 5. Semantic Web и Linked Data
Total votes 4: ↑4 and ↓0 +4
Views 4K
Comments 3

Проектируем мульти-парадигменный язык программирования. Часть 3 — Обзор языков представления знаний

Semantics *Programming *Prolog *Business Models
Продолжаем рассказ о создании мульти-парадигменного языка программирования, поддерживающего декларативный логический стиль для описания модели предметной области. Прошлые публикации находятся здесь и здесь. Теперь пришло время для описания основных особенностей и требований к языку описания модели предметной области. Но для начала сделаем небольшой обзор наиболее популярных языков представления знаний. Это довольно обширная область, имеющая давнюю историю и включающая ряд направлений — логическое программирование, реляционное исчисление, технологии семантической паутины, фреймовые языки. Я хочу сравнить такие языки как Prolog, SQL, RDF, SPARQL, OWL и Flora, выделить те их особенности, которые были бы полезны в проектируемом мульти-парадигменном языке программирования.
Читать дальше →
Total votes 7: ↑7 and ↓0 +7
Views 2.5K
Comments 5

Проектируем мульти-парадигменный язык программирования. Часть 4 — Основные конструкции языка моделирования

Semantics *Programming *Prolog *Business Models
Продолжаем рассказ о создании мульти-парадигменного языка программирования, сочетающего декларативный стиль с объектно-ориентированным и функциональным, который был бы удобен при работе со слабоструктурированными данными и интеграции данных из разрозненных источников. Наконец-то после введения и обзоров существующих мульти-парадигменных технологий и языков представления знаний мы добрались до описания той части гибридного языка, которая ответственна за описание модели предметной области. Я назвал ее компонентой моделирования.

Компонента моделирования предназначена для декларативного описания модели предметной области в форме онтологии — сети из экземпляров данных (фактов) и абстрактных понятий, связанных между собой с помощью отношений. В ее основе лежит фреймовая логика — гибрид объектно-ориентированного подхода к представлению знаний и логики первого порядка. Ее основной элемент — понятие, описывающее моделируемый объект с помощью набора атрибутов. Понятие строится на основе других понятий или фактов, исходные понятия назовем родительскими, производное — дочерним. Отношения связывают значения атрибутов дочернего и родительских понятий или ограничивают их возможные значения. Я решил включить отношения в состав определения понятия, чтобы вся информация о нем находилась по возможности в одном месте. Стиль синтаксиса для определений понятий будет похож на SQL — атрибуты, родительские понятия и отношения между ними должны быть разнесены по разным секциям.

В этой публикации я хочу представить основные способы определения понятий.
Читать дальше →
Total votes 8: ↑7 and ↓1 +6
Views 1.4K
Comments 25

Дата-центрическая архитектура: «волшебная пуля» от интеграционных проблем

Semantics *Cloud computing *Data storage *

Каждая организация использует множество приложений, каждое приложение имеет свою базу данных. В этих базах хранится описание одних и тех же объектов бизнес-процессов с разных точек зрения. Это порождает необходимость в сложных, дорогих и не всегда эффективных интеграционных решениях.

Мы расскажем о дата-центрической архитектуре — «волшебной пуле», позволяющей забыть об интеграции и открыть новые возможности для создания гибких и управляемых бизнес-приложений, аналитики и монетизации данных за счет их использования при принятии решений.

Читать далее
Total votes 9: ↑8 and ↓1 +7
Views 3.1K
Comments 14