boldachev May 19 2020 at 17:12

Мифы семантической технологии

4 min

3.8K

Semantics*

+14

Comments 28

ganqqwerty May 19 2020 at 17:35

И тут опять следует обратить внимание на то, что никто не мешает таким же образом выводить “новые знания” в приложениях с реляционными БД: добавьте колонку для атрибута “дедушка” и программно контролируйте добавление факта рождения ребенка.

Я тут выделил слово программно. Прикол в том, что если будете осуществлять этот контроль кучкой if'ов или например, графовыми методами, никто не гарантирует вам, что полученные ответы будут логически правильными. А если «программно» означает ризонерами, основанными на тех же дескрипционных логиках — то вывод будет математически верным. Ризонер работает заведомо правильно и ошибки в этом случае могут быть только в данных, которые вы ему скормили.

boldachev May 19 2020 at 17:58

Позвольте с вами не согласиться. Отличие ризонера от if'ов не в точности, а в универсальности. Вывод по любой аксиоме, той же «дедушка есть папа папы», можно однозначно запрограммировать стандартными языковыми средствами, и итог будет гарантированно правильным. Ведь языки программирования также основаны на строгих логиках. Вывод же ризонером просто использует общие логические правила и аксиомы. То есть разница лишь в том, что не надо писать для каждой аксиомы, каждого правила свой обработчик.

ganqqwerty May 19 2020 at 18:07

Ну да, то есть, если мы стремимся к логической точности, нам либо надо взять ризонер, либо реализовать свой ризонер для того набора выразительных средств, что мы используем.

boldachev May 19 2020 at 18:20

Это если мы озабочены универсальными инструментами. А если мы пилим свое приложение, то можно просто на каждое правило/аксиому написать фрагмент кода. Итог будет такой же, но не масштабируемый. Новая аксиома — новый обработчик. Это я все к тому, что вывод новых утверждений из существующих возможно в любой программе. Это не особенность семантических технологий.

ganqqwerty May 19 2020 at 17:52

Но логика этого вывода по уровню сопоставима с умозаключением трехлетнего ребенка “дедушка — это папа моего папы”.

Ну нет, то, что вы написали — это в учебниках по DL пишут с целью, чтобы пример был понятнее. В реальности же сложность этого вывода зависит от того, какая у вас была база знаний. Например, есть такой мега-мужик Ian Horrocks, который уже лет двадцать точит медицинский Galen Project (вот наугад его презенташка с какой-то конфы). Вопросы в нем можно задать крайне нетривиальные, и количество знаний, которые использует система, очень велико.
Собственно такая же ситуация с любыми другими экспертными системами, будь они написаны на PROLOG или используют логику предикатов или еще чего-нибудь. Сложность и нетривиальность вопросов и ответов определяется не языком, а тем, что за база у нас имеется.

boldachev May 19 2020 at 18:06

Какая бы база ни была, каким бы языком мы ни пользовались, мы не получим ничего нового, никакого дополнительного знания, кроме того, что есть в базе и задано аксиомами.

Понятно, что пример (с дедом и папой) приведен тривиальный, но кумулятивное его усложнение не приводит к новому эффекту, к добыче новых знаний. Можно говорить только об автоматизации извлечения того, автоматизации того, что предельно трудоемко для извлечения глазами.

ganqqwerty May 19 2020 at 18:09

Я вообще не представляю себе, а как может быть иначе, даже в теории? Вроде бы все компьютерные системы работают так, да и некомпьютерные тоже — получают инпут, перехерачивают его так и этак, и выдают аутпут. Ни ризонер, ни нейронная сетка, ни человеческий мозг (предчувствую философскую дискуссию) не добавит ничего, что не следовало бы из этих данных и механизма, которым он их обрабатывает.

boldachev May 19 2020 at 18:25

Человеческий иногда добавляет новое, ранее не существующее. Хотя точнее следовало бы написать так: непонятно что там откуда берется, но посредством человека (его мышления) иногда появляются новые знания. И мы говорим о творчестве. Поэтому, когда произносят фразу «вывод новых знаний» надо уточнять — о чем речь? О простом логическом выводе или действительно о творчестве. И да, это философская тема)

ganqqwerty May 19 2020 at 18:28

Я вот считаю, что не добавляет он никакого нового и ранее не существующего. Просто данные, которые он получал всю жизнь меняют структуру его мозгового аппарата, а значит это ваше «новое» и «творчество»- это просто функция от «старого». Чтобы спрашивать что-то о «действительно о творчестве» нужно доказать, что это «действительное творчество» и впрямь существует.

boldachev May 19 2020 at 18:49

это просто функция от «старого».

Тут главный вопрос о природе этой самой «функции». Если вы имеете в виду логическую/математическую функцию, то ничего нового вообще не получится. Если же речь об абстрактном заявлении, мол новое порождается уже существующем, то это не аргумент в пользу того, что нет ничего нового.

Новации определяются довольно просто: указываете на что угодно и задаетесь вопросом, а был ли момент времени, когда этого вообще не было? Не было телевизора, не было обезьяны, не было живой клетки… Не было «функции», согласно которой из «старых» одиноких клеток получился человек)

Позиция «ничего нового» чаще всего формируется пониманием невозможности дать ответ на вопрос об источнике нового.

vvagr May 19 2020 at 19:26

Уникальная человеческая функция по добавлению совсем нового — скорее всего есть. По крайней мере, пока что не удалось показать, что все человеческие функции реализуются компьютером. Но это и не имеет отношения к используемому слову «знания».

vvagr May 19 2020 at 19:30

Со всем можно согласиться, кроме утверждений и «знаниях». Знания в «семантическом» графе есть. Есть они, разумеется, и в реляционной базе, и в бинарном дампе памяти, хранящей этот граф или эту базу. Не ясно, как надо определить «знания», чтобы утверждать, что их там нет.

Но семантический граф удобнее для совместной работы человека и компьютера, чем база (и сильно удобнее, чем двоичные дампы). Это удобство связано именно с тем, что отличает графовую модель от реляционной. Хотя, ещё раз соглашусь, количество знаний в них одинаково.

boldachev May 19 2020 at 19:42

Я наверное не совсем явно поставил акцент. В тексте было «что семантические технологии, в отличие от традиционных, работают со знаниями». То есть мысль была не в том, что в графе нет знаний, а в том, что это не является особенностью семантики. Знания свободно мапятся в любую схему.

Посморел, понял где у меня ошибка — в последней фразе «не про знания». Сейчас исправлю на не про «новые знания». Спасибо.

Cryvage May 21 2020 at 06:16

Вот тут не совсем понятно. Я всегда считал, что знания и факты это не одно и то же. Может вопрос чисто терминологический. Но всё же, знание это что-то чем может обладать разум. А факт существует независимо от разума. То есть знание — это осмысленный, осознанный разумом факт. К примеру, квадрат гипотенузы всегда равнялся сумме квадратов катетов. Но я не всегда знал об этом. Факт существовал всегда. Знание появилось с какого-то момента времени. И вот в этом смысле, новые логические выводы — это новые знания.

VolCh May 21 2020 at 06:36

К примеру, квадрат гипотенузы всегда равнялся сумме квадратов катетов. Но я не всегда знал об этом. Факт существовал всегда.

Не факт. Только в рамках абстракций некоторых геометрий. И даже в физическом мире есть (физики утверждают, что это факт) искривления пространства.

Cryvage May 21 2020 at 07:47

Ну это понятно, что любое правило имеет границы применимости.

boldachev May 21 2020 at 11:46

Про знания и факты можно ответить на двух уровнях: (1) философском и (2) айтишном. (1) Когда вы узнали о факте, то фактом для вас будет именно то, что вы узнали и ничего другого. То есть до знания факта для вас не существовал ни факт, ни знание. А после — фактом стали знания о факте. (2) Когда в IT обсуждают факты, то имеют в виду записи неких утверждений. Просто ничего другого в системе нет, кроме этих записей.

warsand May 22 2020 at 13:42

Жаль, что я всего лишь экспериментатор, но разве за это ругают… (?)
А что если нам вновь начать с фонетики, плавно перетекающей в новую глифику?
— И да, пока я читаю статью — мой компьютер простаивает.
Ему нужна фоновая игра-забава, чтобы генерить «недоработанные утверждения».
Эти утверждения и будут являться его «интуицией», а я ему буду помогать типизировать и классифицировать сей ещё никем недооформленный фонетический «бардак».
Пример помощи: (навскидку)))
«пт? к» — фоноклапан. (губы, зубы, нёбо, гортань)
«бд? г» — гласоклапан. (губы, зубы, нёбо, гортань)
«фсшх» — фонощель. (губы, зубы, нёбо, гортань)
«взж(г/х)» — гласощель. (губы, зубы, нёбо, гортань)
Твёрдые — «мажоры», мягкие — «миноры».
«уоа» — губ-глас-мажоры. «эы» — глубь-глас-мажоры.
«юёяеи» — глас-миноры. (поскольку йу йо йа йэ йы/и ещё и мягкими бывают, а также имеют «обратку» в виде окончаний уй ой ай эй ый)
Далее:
1. глифуем фон, клапан, щель, губы, зубы, нёбо, гортань, глас, мажор, минор.
(навскидку — всего 10 глифов)
2. совмещаем нужный набор глифов в знакоместе.
— Всё… (да и лишних споров не будет про сигареты «Ява», язык «Жаба/Джаба» и град Вифлеем/Бетляшем/Бетлехем)))

boldachev May 22 2020 at 13:58

Круто. Но не совсем по теме.

VolCh May 20 2020 at 04:36

Вот не согласен с дедушкой. Из факта рождения дочери у сына друга и определения дедушки (одного из) я делаю вывод, что друг стал дедушкой с момента рождения этой дочери. И это новое для меня знание. Кстати, может быть даже ложное.

vin2809 May 20 2020 at 05:11

Ложное или нет, но все же ЗНАНИЕ.

ru7701 May 20 2020 at 06:46

Не безызвестный онтологам А.Левенчук писал тут недавно что, «мышление происходит в мозгах+экзокортексах, и происходит оно обычно при письме». Т.е. пишу — значит мыслю, генерирую знание. Но если так, то получается мышление тесно связано с языком в целом и его грамматикой в частности. А грамматика — это уже почти RDF: подлежащее, сказуемое, дополнение. Еще бы в модель добавить определение с обстоятельством и был бы полный набор (готовлю под это «формуляр» — соответствующий стиль использования RDF). Итого, по этой цепочке выходит, что есть что-то мыслительное в SemanticWeb.

Да, триплсторы без потерь транслируются в реляционки. Т.е., как ни крути, автор прав. Но только на данный момент. RDF — перспективный знаниевый бульон в силу моделирования языковой грамматики. И как жизнь появилась из бульона аминокислот, так и генерация нового знания может появиться скорее именно здесь — в rdf-котле. Нужно еще подключать какую-то хитрую вычислительную обработку, но питательная основа первична.

boldachev May 20 2020 at 07:53

А.Левенчук писал тут недавно что, «мышление происходит в мозгах+экзокортексах, и происходит оно обычно при письме». Т.е. пишу — значит мыслю, генерирую знание.

Во-первых, это у Левенчука так. Огромное количество людей думаю, когда говорят или вообще молча. Не стоит абсолютизировать персональные особенности. Во-вторых, логически (и только для Левенчука) из «мыслю когда пишу» не следует «пишу — значит мыслю» (можно писать бессмысленный набор слов).

так и генерация нового знания может появиться скорее именно здесь — в rdf-котле.

В это можно верить. Но мне мое знание (включая знание эволюционной биологию) подсказывает, что не появится. Хотя достаточно остановится на том, что современный уровень развития семантической технологии не про мышление и уж подавно не про новое знание.

ru7701 May 20 2020 at 08:30

Увы, так. По текущему состоянию даже в предельном случае идеальной оцифровки в RDF даже и бизнес-логики на выходе получается не более чем крутая экспертная система. Это несколько обескураживает, но деваться некуда. Надежда (не хочется про религиозное «вера») помогает, но не более. Впрочем, и без нее задача построения идеальной корпоративной экспертки очень мотивирует.

boldachev May 20 2020 at 09:41

Эта серия текстов по теме «семантика» как раз и затеяна для того, чтобы подвести моделированию бизнес-логики. Хотя бы в теории.

ru7701 May 20 2020 at 14:05

Шикарно. Тема обработки бизнес-логики представляется самой пикантной и многообещающей во всей этой эпопее. Ну на данном этапе. Не зря её во главу угла ставят как основатель Stardog, так и новички из TerminusDB.
С нетерпением ожидаем итоговую часть.

dponyatov Jun 7 2020 at 10:31

А Rete одним селектом напишете?

boldachev May 20 2020 at 07:53