Обновить
0.33

Семантические сети *

Веб 3.0

Сначала показывать
Порог рейтинга
Уровень сложности

Осенняя школа Semantic Web в ИТМО

Время на прочтение2 мин
Количество просмотров2.2K
Порог вхождения в Semantic Web не то, чтобы сильно высок, однако первые пару-тройку недель приходится разгребать ужасную кашу из стандартов, языков, инструментов и внушительного математического аппарата, размышляя над тем, что же из всей этой каши наиболее полезно.
Наши семинары предназначены для тех, кто слышал о семантик вебе, но так и не понял
  1. что это такое,
  2. почему это благо, и, наконец,
  3. как этим пользоваться.
Читать дальше →

Google приобрёл компанию Metaweb и базу знаний Freebase

Время на прочтение1 мин
Количество просмотров2K
Поисковый стартап Metaweb, который разрабатывал технологии семантической разметки Веба и поддерживал открытую базу знаний Freebase (12 млн людей, мест и объектов, связанных друг с другом), на прошлой неделе куплен компанией Google. Похоже, поисковый гигант наконец-то созрел для реализации в жизнь футуристических технологий Семантической сети, которые с 2006 года обсуждались на Хабре.

Как известно, Семантическая сеть подразумевает внедрение нового формата разметки веб-документов, удобных для машинной обработки. Таким образом, любой текст может восприниматься машиной как набор фактов и иерархических понятий, а весь интернет выйдет на уровень Веб 3.0, превратившись в единую распределённую и постоянно обновляющуюся базу данных.
Читать дальше →

RDF Это просто

Время на прочтение5 мин
Количество просмотров40K
image
В этой заметке я попытаюсь объяснить на пальцах ключевые моменты и обосновать преимущества модели RDF.
Более 10 лет концепция Semantic Web, частью который является RDF развивалась, была предметом споров и обсуждений, и сегодня ее все активнее поддерживает сообщество в своих приложениях.

Однако для многих все еще совсем не понятно:

  • Зачем все это?
  • Как с этим работать?
  • Что это даст именно мне?


Давайте во всем разберемся

FOAF и пример

Время на прочтение2 мин
Количество просмотров5K
FOAF (англ. Friend of a Friend) — проект по созданию модели агенто-читаемых домашних страниц и социальных сетей. Основатели Либби Миллером и Дэном Брикли. Основанием проекта является спецификация, которая определяет некоторые выражения, используемые в высказываниях (англ. statements) о ком-либо: например, имя, пол и другие характеристики. Это для тех кто не знает, что это такое, но на Хабре про это писали, но без практического примера.

Для примера работы с FOAF страничкой пользователя будем использовать LAMP. Для легкой работой с FOAF можно использовать библиотеку ARC, которая помогает очень быстро и легко манипулировать rdf данными и делать запросы sparql. Также эту библиотеку часто советуют автора книг по Семантическому Вебу за рубежом.

Например, создадим свою страничку для FOAF:
Читать дальше →

Графический редактор на HTML5 + JS

Время на прочтение1 мин
Количество просмотров11K
Недавно на просторах интернета был найден графический редактор, причем написанный чисто на HTML5 + JS без Flash и прочего
image
Читать дальше →

Web 3.0 или жизнь без рекламы?

Время на прочтение2 мин
Количество просмотров1.1K
Этот небольшой пост решил посвятить вопросам рекламы на веб страничках. Особых познаний в этой предметной области у меня нет, но… пару слов скажу.
Итак, один из моих любимых сайтов — Хабр. Давно думал, как такой большой и популярный сайт обходится без рекламы. И каково было мое прозрение, когда я решил опубликовать пост на Хабре и что? И ничего, я не смог это сделать. Ремарка — мой браузер Файрфокс с парой сотен плагинов, включая AdBlock Plus и NoScript. Так вот какие то мои плагины резали нещадно всю рекламу, которая встречалась у них на пути и я был счастливый обладатель жизни без рекламы. Но вот публикация поста на Хабре показала, что без Javascripta, возможно без чего то еще, публиковаться на Хабре сложно. У меня даже как то получилось опубликоваться — вернее продублировать два раза один пост — ужс. Все проблемы естественно решились, когда я включил показ рекламы. А жаль… Ничего ведь не надоедало.
Читать дальше →

Внедрение семантических данных в HTML

Время на прочтение4 мин
Количество просмотров1.9K
Тоже хочу принять участие в размышлениях на тему семантического веба, начатого здесь и здесь.

Мной было потрачено определенное количество времени на исследования принципов и тенденций развития семантического веба, хочу поделиться основными результатами и мыслями.
Читать дальше →

Семантическая паутина — что мы можем делать уже сейчас

Время на прочтение4 мин
Количество просмотров4.8K
Буквально только что в топе проскочила замечательная статья "Элементы семантической паутины". Начал писать на нее ответ, но он получился слишком большим, поэтому выделяю его в отдельный топик.

Итак, большинство комментариев делится на две категории: «Да ну, рядовому юзеру семантическая разметка информации непонятна, недоступна, и соответственно, он не будет ей заниматься» и «Да ладно, все будет хорошо, как-нибудь добредем то этого светлого будущего».

Я считаю, что правы и те, и те, и у нас, у тех, кто считает «семантическую паутину» желанным будущим, есть возможности ускорить его приход.
Если интересно - прошу под кат

Элементы семантической паутины

Время на прочтение10 мин
Количество просмотров16K
Сложность структуры современного информационного общества постоянно растёт. В связи с этим, требования к эффективности алгоритмов обработки информации также увеличиваются. В последнее время наиболее популярными направлениями в этой области являются Data Mining (DM), Knowledge Discovery in Databases (KDD) и Machine Learning (ML). Все они предоставляют теоретическую и методологическую базу для изучения, анализа и понимания огромных объёмов данных.
Однако этих методов не достаточно, если сама структура данных будет настолько плохо пригодной для машинного анализа, как исторически сложилось на сегодняшний момент в Internet.
Для решения данной проблемы предпринята глобальная инициатива реорганизации структуры данных Internet в целях преобразования его в Семантическую Паутину предоставляющую возможности по эффективному поиску и анализу данных как человеком так и программным агентам.
В этой статье рассмотрены основные технологии позволяющие реализовать Semantic WEB.

Читать далее..

Семантическое будущее Веба — SemanticFuture.Net

Время на прочтение1 мин
Количество просмотров1.4K
Уважаемые читатели, в течение последних трех месяцев мы собирали материалы по семантическим технологиям. В результате мы создали SemanticFuture.Net для анализа применимости семантических технологий и средств, таких как Semantic MediaWiki, Virtuoso, OWL и Sparql, к русскоязычным ресурсам.

На страницах Semantic Future мы будем:
1) собирать актуальную информацию по современным семантическим технологиям и сервисам, по всему тому, что сейчас или в ближайшее время будет оказывать свое положительное влияние на развитие Веб;
2) делать презентацию наших трудов и достижений;
3) организовывать встречи и тематические мероприятия;
4) тестировать семантические программные продукты и подбирать для вас специалистов для внедрения семантик технологий в ваши системы и продукты.
Кто мы?
Мы это Semantic Web User Group (SWUG).
Читать дальше →

Сравнительный анализ фреймворков для работы с онтологиями под .NET и Java

Время на прочтение6 мин
Количество просмотров6.4K
Ни для кого не секрет, что львиная доля проектов, связанных с Semantic Web, разрабатывается на Java. Фреймворки для работы с семантическими онтологиями не являются исключением: все основные проекты (Jena, OWL API, Sesame и т. д.) написаны именно на Java. Единственным серьезным представителем, использующим .NET, является фирма Intellidimension с продуктами RDF Gateway и Semantics.SDK.

В этой статье опишу свой опыт работы с вышеуказанными фреймворками и поделюсь результатами тестирования.
Читать дальше →

Машинная обработка естественных языков: Apache UIMA

Время на прочтение5 мин
Количество просмотров10K
Первоначально разработанная спецами из IBM, Архитектура управления неструктурированной информацией (UIMA) сейчас обитается в инкубаторе от Apache, являет собой образец открытого ПО и распространяется по апачевой лицензии.

Что это?


Это — программная инфраструктура, цель которой — анализ больших массивов информации и извлечение из этой информации знаний. Тут мы осторожно остановимся, заглянем в пропасть семантического веба, на дне которой лежит искусственный интеллект, и сделаем осторожный шаг назад.

Apache UIMA хороша тем, что не таит в себе никакой мистики. Всё можно пощупать, поковырять, подпилить.

Она предлагает модульный подход к анализу текста. Например, последовательность анализа может быть такой:
  1. определяем язык текста;
  2. находим границы предложений;
  3. ищем именованные вхождения (имена, названия и т.д.).

Каждая операция выполняется определённым компонентом, связь между которыми обеспечивается фреймворком (доступны UIMA Java Framework и UIMA C++ Framework).

Читать дальше →

Новый перевод стандарта W3C — Sparql protocol for RDF

Время на прочтение1 мин
Количество просмотров1.9K
На сайте SHCHERBAK.NET опубликован перевод стандарта W3C — Sparql protocol for RDF.
Оригинальную версию стандарта можно посмотреть здесь .
Перевод доступен здесь!

Ближайшие события

Семантический веб как операционная система: с пользователями и правами доступа!

Время на прочтение8 мин
Количество просмотров2.7K
Очень скоро семантические сетевые данные будут точно размечены, так что искать их станет существенно легче. Это еще сильнее ускорит развитие тренда, когда Интернет и глобальное сообщество превратятся в две тесно связанных друг с другом сети, которые будут постоянно увеличивать взаимосвязи и прозрачность друг для друга. Обязаны ли мы жертвовать анонимностью для того, чтобы сохранить доверие для такого сотрудничества? Или мы увидим возникающую «новую сеть», которая будет функционировать как в своем роде операционная система с различными пользователями и правами, — и будет запущена на этой глобальной машине, которую мы и называем Интернетом.
Читать дальше →

SEMANTIC WEB for the WORKING ONTOLOGIST

Время на прочтение3 мин
Количество просмотров3K
В этом посте я хотел бы поговорить о литературе по Web 3.0, точнее об одном из лучших ее представителей — книге «SEMANTIC WEB for the WORKING ONTOLOGIST».
Читать дальше →

Простой RDF-репозиторий на PHP и MySQL для начинающих

Время на прочтение6 мин
Количество просмотров5.9K
Проблема: сложность практического освоения технологий семантической сети начинающими.

Предлагаю совместными усилиями выработать конкретное решение, позволяющее запустить у себя маленькое хранилище и научиться делать запросы.

Задача: разобраться в создании, хранении и обращении к словарю, в использовании языка запросов на начальном уровне на практике.

Если вы примете участие в обсуждении и будете подсказывать лучшие решения, то я буду обновлять этот пост по мере совместного нахождения новой информации. Надеюсь, в итоге получится небольшой урок для начинающих.
Читать дальше →

Как мы будем взаимодействовать с сетью данных?

Время на прочтение10 мин
Количество просмотров1.3K
image

Семантический веб — общее информационное пространство связанных данных, предназначенное скорее для машин, чем для людей. Так ли это? И да и нет. Действительно, машинно-читаемые данные, наделённые точной семантикой и опубликованые в сети в совокупности с возможностью связывать данные в распределённые наборы являются основной характерной чертой семантического веба. Вместе эти особенности позволяют собирать и объединять разнородные данные в невиданных ранее масштабах, а всю рутину для нас выполнят машины.

Однако всё это бессмысленно без человека, способного пожинать плоды появляющихся возможностей. Сеть машинно-читаемых данных (семантический веб или сеть данных) далека от вычёркивания человека из процесса. Более того, она открывает огромные перспективы для взаимодействия человека и машины.

К настоящему моменту сообщество семантического веба в основном занималось разработкой технической инфраструктуры, чтобы сделать сеть данных реализуемой в принципе, и публикацией наборов связанных данных, чтобы наполнить её содержанием. Если мы хотим полностью использовать перспективы и возможности сети данных, нам нужно преодолеть этот начальный этап и работать над осознанием того, как меняется парадигма взаимодействия пользователя с сетью.

В этой статье я рассмотрю некоторые аспекты того, как наше взаимодействие с сетью данных может отличаться от взаимодействия с существующей сетью документов, и что это может означать как для пользователей, так и для создателей содержимого сети.
Читать дальше →

Семантический поиск: мифы и реальность

Время на прочтение6 мин
Количество просмотров24K

О семантическом поиске говорят уже на протяжении нескольких лет. Любая технология, которая сможет сместить Google с вершины, вызывает всеобщий интерес. Особенно если речь идет о долгожданной и часто обсуждаемой возможности семантического поиска. Однако нас ни столько интересует прогресс в этой области, сколько огорчает отсутствие реальных результатов проводимых исследований, ведь итоги поиска не так уж и сильно отличаются от итогов поиска Google. В чем же дело?

Например, при вводе в строку поиска «Столица Франции», оба метода дают один и то же правильный ответ: «Париж». Кроме того, большинство запросов, которые мы вбиваем в строку поиска в виде аббревиатур, дают те же результаты, если вводить термин полностью. Очевидно, что тут что-то не так. Всем известно, что семантические технологии способны на многое, но почему? И как они работают? Ознакомившись с этой статьей, вы узнаете, что на самом деле, мы просто-напросто задаем не те вопросы.
Читать дальше →

Конференция SemTech 2008

Время на прочтение1 мин
Количество просмотров635
11-22 мая в San Jose (California) проходила конференция SemTech 2008. Это событие было посвящено Semantic Web в целом, а также сопутствующим ей технологиям. Были представлены презентации об уже работающих web-решениях и множество докладов, посвященных внедрению semantic-технологий в существующие проекты.

Официальный сайт конференции
Блог-пост о конференции с кратким обзором
Статья, посвященная вопросам инвестирования semantic web стартапов (интервью с инвесторами)