Pull to refresh
3
0

User

Send message

похоже на страшилку... у нас в РБ в деревне/в глубинке всё проще - тараканов никогда не водилось ттт, муравьи мелкие только на участке тлю разносят, домой не лезут, мыши-крысы в дом лезут только по осени, по первому этажу им пролезть негде, на мансарде отлично ловушки с клеем справляются, крайне редко какую-то залётную кот отлавливает. Пищевые отходы - на компост, подальше от дома, участок 25+ соток позволяет. На участке-пару грядок с капельным поливом помидорчик/огурчик съесть с куста, остальное-дикий луг, в сезон пару раз в месяц с косой выйти вместо фитнеса или профи нанять, если лень. Руккола-петрушка, иван-чай, яблоки-сливы-орехи и прочее сами растут. Да, надо обрезать, иногда побрызгать - отличный способ переключиться в выходные от компьютерных дел. Зато пейзаж, городского шума не слышно и воздух посвежее...

Sounds inspiring, but it depends... on trusted data source! See https://blog.ibagroupit.com/2024/01/large-language-models-vs-knowledge-graphs-in-creating-golden-records-for-material-master-data/ for detailed example when LLM itself generates data, looking correct, but with flaws, making data unacceptable. So, the trusted data source is a key, imho.

Apache Jena Fuseki+Protege, их open source альтернативы, их производные и приложения поверх них вполне подходят под определение СУЗ. Stardog cloud в ограниченном варианте тоже доступен без лицезионных отчислений.

Обзор МДМ систем и их инструментария - тема отдельной статьи, если не диссертации, которая устареет в момент публикации. Этим периодически издательство Гартнер балуется с магическими квадрантами. Здесь решалась задача попроще.

Есть такой момент. С другой стороны - типичный справочник номенклатуры компании нефтегазового сектора (из тех, что проходили через мои руки) - 200-250тыс записей, которые пилятся на 100-5000 однородных групп по 0,01-10 тыс записей. На такие объемы для Openrefine достаточно 8-16Гб ОЗУ.

Чем может помочь статье про инструменты нормализации данных упоминание МДМ?

Экспертам НСИ (целевой аудитории статьи) необязательно задумываться о том, что их активность встроена в бизнес -процессы по управлению мастер-данными. Но если есть конструктивные предложения - можно и про МДМ написать.

Information

Rating
Does not participate
Registered
Activity