Как стать автором
Обновить

Восхитительная теория [якорных] баз данных от Ларса Рённбека

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров6.8K
Всего голосов 10: ↑7 и ↓3+5
Комментарии21

Комментарии 21

Смущает, но такое случается.

В любой нормальной (в обоих смыслах) реляционной БД такое не случается. Ибо нормализация как раз и направлена на недопущение таких вот моментов.

Думаю, что стоит привести высказывание К. Дж. Дейта:
"База данных в действительности - это множество истинных высказываний"

Он как раз утверждает (ещё есть по этому поводу ряд статей), что временные метки вносят такую сложность, что возможно всё...

В реляционной БД должно стоять ограничение на уникальность пары "номер - дата", но стоит ли оно? И что если стоит, но поступила такая информация - затирать ли предыдущую? Не записывать?

И что если стоит, но поступила такая информация - затирать ли предыдущую? Не записывать?
Что ж вы меня спрашиваете?
Спросите лучше архитектора вашей модели данных.

Собственно, якорное моделирование данных - это 6NF, судя по статье в википедии. Поэтому нет никакого противоречия между РСУБД и якорными БД. Данные якорной модели хранятся в нескольких таблицах в РСУБД по факту.

Если кто впервые услышал про Anchor Modelling, может показаться, что это что-то свежее, экспериментальное и академическое, но Anchor Modelling давно (больше десяти лет) используется в проде, на хабре десятки статей, вот например от Авито 2014 год, 2017 + , много еще можно нарыть даже на хабре.

С этой точки зрения информация не содержит фактов

Сомнительное утверждение. Если добавить к кортежу вероятностную оценку, то он не перестанет описывать факт, просто теперь этот факт определяется другим предикатом. Что здесь имелось ввиду?

Это такой субъективный подход к информации- все, что мы получаем из внешних источников, считаем позициями, мнениями, оценками, но не фактами. А чтобы стать фактом, им предстоит ещё пройти проверку на непротиворечивость с другими данными и на соответствие реальности...

Это такой "подход аудитора": если на документе стоит запись "на складе остатки 500 шт", это не факт. Факт - это увиденные и пересчитанные аудитором лично 500 шт )))

А если он обсчитался?

Нужно понимать о субъективности оценки - и аудитор может обсчитаться, но вероятность этого несколько меньше, а вероятность 500 шт, при том, что и склад подтверждает 500 шт, и аудитор насчитал 500 шт - вообще неотличима от 100%...

Если же аудитор обсчитался, мы зафиксируем 2 позиции - аудитора и склада. И зафиксируем противоречие между ними...

А в чём восхитительность очередной (из огромного множества) теории представления данных?

Разделяются факты и субъективные оценки, вводится оценка вероятности, можно фиксировать противоречия. И всё это привязано ко времени.

Не сочтите за радикализм, но товарищ с апломбом несёт полный бред, выдаваемый за потрясающую новизну. Подход, формализованный Байесом (в каком году?), здесь подаётся как открытие с глубокомысленной недосказанностью: "Подумайте во так, а может оно и не так, а вот если ещё поменяю контекст, так оно вообще не так, но может и так" Такое ощущение, что высосанная из пальца псевдонаука (главное вовремя придумать новые термины - позиция...), чтобы получить гранты на исследования.

По крайней мере, это альтернатива существующему (3 нормальная форма) подходу к формированию баз данных. Субъективность против объективности. Внесение еще дополнительных мнений и оценок.

Для применения байесовского подхода нужна статистика, здесь же отмечаются только отдельные позиции, которые могут быть и ошибочными...

Хорошо, допустим это альтернатива. Но тогда скажите, какая польза может быть от присутствия в БД субъективности? Иначе, если пользы нет, то это просто игра словами.

Польза в том, чтобы зафиксировать все мнения, оцифровать буйный и сомневающийся мир... А не итоговый единственный факт "на складе 500 шт" ( а аудитор насчитал 499, а 4 штуки наполовину разобраны и фактически их можно превратить в 2 полноценных...)

Допустим зафиксировали то, что вы описали - что дальше с этим делать? И опять же что восхитительного в этой идее? Разные взгляды - это добавим поле с принадлежностью к автору. Изменение во времени - темпоральные БД. Где та самая новизна, которая даст реально полезный выхлоп? Если просто фиксировать все мнения, то БД превращается в сундук со сказками.

Наш спор сводится к следующему: должна ли БД отражать только окончательное мнение (например, то, что фиксируется в бухучете) или она должна описывать все высказанные мнения, с субьъективно оцениваемыми вероятностями, и таким образом, быть столь же неоднозначной, как и окружающий мир?

Возможно, данные движутся ко второму варианту...

В чём теория то состоит? Где тут математика? Не увидел ни в статье на Хабре ни у автора в оригиналах статей.

Я рассчитывал какие-то математические выкладки увидеть, которые позволят эффективно делать запросы к БД.

А тут из теории просто "давайте короч вот так хранить как список списков, не пойми чего, не пойми к чему"

Поскольку этому теорию выдвинул математик, у него в столе, очевидно, лежат тексты на птичьем языке... эти статьи с сайта рассчитаны на широкую ИТ-публику.

Что же он их в стол то пишет? Без выкладок пока только ощущение какой-то Фоменковщены. Искал по всем интернетам - статей с выкладками не нашёл.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории