Pull to refresh

Comments 28

И тут опять следует обратить внимание на то, что никто не мешает таким же образом выводить “новые знания” в приложениях с реляционными БД: добавьте колонку для атрибута “дедушка” и программно контролируйте добавление факта рождения ребенка.

Я тут выделил слово программно. Прикол в том, что если будете осуществлять этот контроль кучкой if'ов или например, графовыми методами, никто не гарантирует вам, что полученные ответы будут логически правильными. А если «программно» означает ризонерами, основанными на тех же дескрипционных логиках — то вывод будет математически верным. Ризонер работает заведомо правильно и ошибки в этом случае могут быть только в данных, которые вы ему скормили.
Позвольте с вами не согласиться. Отличие ризонера от if'ов не в точности, а в универсальности. Вывод по любой аксиоме, той же «дедушка есть папа папы», можно однозначно запрограммировать стандартными языковыми средствами, и итог будет гарантированно правильным. Ведь языки программирования также основаны на строгих логиках. Вывод же ризонером просто использует общие логические правила и аксиомы. То есть разница лишь в том, что не надо писать для каждой аксиомы, каждого правила свой обработчик.
Ну да, то есть, если мы стремимся к логической точности, нам либо надо взять ризонер, либо реализовать свой ризонер для того набора выразительных средств, что мы используем.
Это если мы озабочены универсальными инструментами. А если мы пилим свое приложение, то можно просто на каждое правило/аксиому написать фрагмент кода. Итог будет такой же, но не масштабируемый. Новая аксиома — новый обработчик. Это я все к тому, что вывод новых утверждений из существующих возможно в любой программе. Это не особенность семантических технологий.
Но логика этого вывода по уровню сопоставима с умозаключением трехлетнего ребенка “дедушка — это папа моего папы”.

Ну нет, то, что вы написали — это в учебниках по DL пишут с целью, чтобы пример был понятнее. В реальности же сложность этого вывода зависит от того, какая у вас была база знаний. Например, есть такой мега-мужик Ian Horrocks, который уже лет двадцать точит медицинский Galen Project (вот наугад его презенташка с какой-то конфы). Вопросы в нем можно задать крайне нетривиальные, и количество знаний, которые использует система, очень велико.
Собственно такая же ситуация с любыми другими экспертными системами, будь они написаны на PROLOG или используют логику предикатов или еще чего-нибудь. Сложность и нетривиальность вопросов и ответов определяется не языком, а тем, что за база у нас имеется.
Какая бы база ни была, каким бы языком мы ни пользовались, мы не получим ничего нового, никакого дополнительного знания, кроме того, что есть в базе и задано аксиомами.

Понятно, что пример (с дедом и папой) приведен тривиальный, но кумулятивное его усложнение не приводит к новому эффекту, к добыче новых знаний. Можно говорить только об автоматизации извлечения того, автоматизации того, что предельно трудоемко для извлечения глазами.
Я вообще не представляю себе, а как может быть иначе, даже в теории? Вроде бы все компьютерные системы работают так, да и некомпьютерные тоже — получают инпут, перехерачивают его так и этак, и выдают аутпут. Ни ризонер, ни нейронная сетка, ни человеческий мозг (предчувствую философскую дискуссию) не добавит ничего, что не следовало бы из этих данных и механизма, которым он их обрабатывает.
Человеческий иногда добавляет новое, ранее не существующее. Хотя точнее следовало бы написать так: непонятно что там откуда берется, но посредством человека (его мышления) иногда появляются новые знания. И мы говорим о творчестве. Поэтому, когда произносят фразу «вывод новых знаний» надо уточнять — о чем речь? О простом логическом выводе или действительно о творчестве. И да, это философская тема)
Я вот считаю, что не добавляет он никакого нового и ранее не существующего. Просто данные, которые он получал всю жизнь меняют структуру его мозгового аппарата, а значит это ваше «новое» и «творчество»- это просто функция от «старого». Чтобы спрашивать что-то о «действительно о творчестве» нужно доказать, что это «действительное творчество» и впрямь существует.
это просто функция от «старого».
Тут главный вопрос о природе этой самой «функции». Если вы имеете в виду логическую/математическую функцию, то ничего нового вообще не получится. Если же речь об абстрактном заявлении, мол новое порождается уже существующем, то это не аргумент в пользу того, что нет ничего нового.

Новации определяются довольно просто: указываете на что угодно и задаетесь вопросом, а был ли момент времени, когда этого вообще не было? Не было телевизора, не было обезьяны, не было живой клетки… Не было «функции», согласно которой из «старых» одиноких клеток получился человек)

Позиция «ничего нового» чаще всего формируется пониманием невозможности дать ответ на вопрос об источнике нового.
Уникальная человеческая функция по добавлению совсем нового — скорее всего есть. По крайней мере, пока что не удалось показать, что все человеческие функции реализуются компьютером. Но это и не имеет отношения к используемому слову «знания».
Со всем можно согласиться, кроме утверждений и «знаниях». Знания в «семантическом» графе есть. Есть они, разумеется, и в реляционной базе, и в бинарном дампе памяти, хранящей этот граф или эту базу. Не ясно, как надо определить «знания», чтобы утверждать, что их там нет.

Но семантический граф удобнее для совместной работы человека и компьютера, чем база (и сильно удобнее, чем двоичные дампы). Это удобство связано именно с тем, что отличает графовую модель от реляционной. Хотя, ещё раз соглашусь, количество знаний в них одинаково.
Я наверное не совсем явно поставил акцент. В тексте было «что семантические технологии, в отличие от традиционных, работают со знаниями». То есть мысль была не в том, что в графе нет знаний, а в том, что это не является особенностью семантики. Знания свободно мапятся в любую схему.

Посморел, понял где у меня ошибка — в последней фразе «не про знания». Сейчас исправлю на не про «новые знания». Спасибо.
Вот тут не совсем понятно. Я всегда считал, что знания и факты это не одно и то же. Может вопрос чисто терминологический. Но всё же, знание это что-то чем может обладать разум. А факт существует независимо от разума. То есть знание — это осмысленный, осознанный разумом факт. К примеру, квадрат гипотенузы всегда равнялся сумме квадратов катетов. Но я не всегда знал об этом. Факт существовал всегда. Знание появилось с какого-то момента времени. И вот в этом смысле, новые логические выводы — это новые знания.
К примеру, квадрат гипотенузы всегда равнялся сумме квадратов катетов. Но я не всегда знал об этом. Факт существовал всегда.

Не факт. Только в рамках абстракций некоторых геометрий. И даже в физическом мире есть (физики утверждают, что это факт) искривления пространства.

Ну это понятно, что любое правило имеет границы применимости.
Про знания и факты можно ответить на двух уровнях: (1) философском и (2) айтишном. (1) Когда вы узнали о факте, то фактом для вас будет именно то, что вы узнали и ничего другого. То есть до знания факта для вас не существовал ни факт, ни знание. А после — фактом стали знания о факте. (2) Когда в IT обсуждают факты, то имеют в виду записи неких утверждений. Просто ничего другого в системе нет, кроме этих записей.
Жаль, что я всего лишь экспериментатор, но разве за это ругают… (?)
А что если нам вновь начать с фонетики, плавно перетекающей в новую глифику?
— И да, пока я читаю статью — мой компьютер простаивает.
Ему нужна фоновая игра-забава, чтобы генерить «недоработанные утверждения».
Эти утверждения и будут являться его «интуицией», а я ему буду помогать типизировать и классифицировать сей ещё никем недооформленный фонетический «бардак».
Пример помощи: (навскидку)))
«пт? к» — фоноклапан. (губы, зубы, нёбо, гортань)
«бд? г» — гласоклапан. (губы, зубы, нёбо, гортань)
«фсшх» — фонощель. (губы, зубы, нёбо, гортань)
«взж(г/х)» — гласощель. (губы, зубы, нёбо, гортань)
Твёрдые — «мажоры», мягкие — «миноры».
«уоа» — губ-глас-мажоры. «эы» — глубь-глас-мажоры.
«юёяеи» — глас-миноры. (поскольку йу йо йа йэ йы ещё и мягкими бывают, а также имеют «обратку» в виде окончаний уй ой ай эй ый)
Далее:
1. глифуем фон, клапан, щель, губы, зубы, нёбо, гортань, глас, мажор, минор.
(навскидку — всего 10 глифов)
2. совмещаем нужный набор глифов в знакоместе.
— Всё… (да и лишних споров не будет про сигареты «Ява», язык «Жаба/Джаба» и град Вифлеем/Бетляшем/Бетлехем)))
Круто. Но не совсем по теме.

Вот не согласен с дедушкой. Из факта рождения дочери у сына друга и определения дедушки (одного из) я делаю вывод, что друг стал дедушкой с момента рождения этой дочери. И это новое для меня знание. Кстати, может быть даже ложное.

Ложное или нет, но все же ЗНАНИЕ.

Не безызвестный онтологам А.Левенчук писал тут недавно что, «мышление происходит в мозгах+экзокортексах, и происходит оно обычно при письме». Т.е. пишу — значит мыслю, генерирую знание. Но если так, то получается мышление тесно связано с языком в целом и его грамматикой в частности. А грамматика — это уже почти RDF: подлежащее, сказуемое, дополнение. Еще бы в модель добавить определение с обстоятельством и был бы полный набор (готовлю под это «формуляр» — соответствующий стиль использования RDF). Итого, по этой цепочке выходит, что есть что-то мыслительное в SemanticWeb.

Да, триплсторы без потерь транслируются в реляционки. Т.е., как ни крути, автор прав. Но только на данный момент. RDF — перспективный знаниевый бульон в силу моделирования языковой грамматики. И как жизнь появилась из бульона аминокислот, так и генерация нового знания может появиться скорее именно здесь — в rdf-котле. Нужно еще подключать какую-то хитрую вычислительную обработку, но питательная основа первична.
А.Левенчук писал тут недавно что, «мышление происходит в мозгах+экзокортексах, и происходит оно обычно при письме». Т.е. пишу — значит мыслю, генерирую знание.
Во-первых, это у Левенчука так. Огромное количество людей думаю, когда говорят или вообще молча. Не стоит абсолютизировать персональные особенности. Во-вторых, логически (и только для Левенчука) из «мыслю когда пишу» не следует «пишу — значит мыслю» (можно писать бессмысленный набор слов).
так и генерация нового знания может появиться скорее именно здесь — в rdf-котле.
В это можно верить. Но мне мое знание (включая знание эволюционной биологию) подсказывает, что не появится. Хотя достаточно остановится на том, что современный уровень развития семантической технологии не про мышление и уж подавно не про новое знание.
Увы, так. По текущему состоянию даже в предельном случае идеальной оцифровки в RDF даже и бизнес-логики на выходе получается не более чем крутая экспертная система. Это несколько обескураживает, но деваться некуда. Надежда (не хочется про религиозное «вера») помогает, но не более. Впрочем, и без нее задача построения идеальной корпоративной экспертки очень мотивирует.
Эта серия текстов по теме «семантика» как раз и затеяна для того, чтобы подвести моделированию бизнес-логики. Хотя бы в теории.
Шикарно. Тема обработки бизнес-логики представляется самой пикантной и многообещающей во всей этой эпопее. Ну на данном этапе. Не зря её во главу угла ставят как основатель Stardog, так и новички из TerminusDB.
С нетерпением ожидаем итоговую часть.
А Rete одним селектом напишете?
Sign up to leave a comment.

Articles