Комментарии 1
Довольно фрагментарная статья. Для введения в курс дела содержит слишком много общих саморазумеющихся слов. Технологии — это не что, а как. Для понимания внутрненней кухни хранилищ данных совершенно не хватает конкретики. Между тем, крайне интересно было бы прочитать про задачи:
поиска и разработки признаков;
доработки, обучения и отладки моделей;
обнаружения признаков и предоставления доступа к ним;
доставки данных моделям, работающим в продакшене, с целью формирования логических заключений;
оперативного мониторинга состояния системы.
Во-первых, любое хранилище — это надстройка над СУБД. А это значит, что и рассуждать следует в терминах моделей данных (реляционная, семантическая, иерархическая и т.д. и т.п.) и языков структурированных запросов.
Во-вторых, нужно провести классификацию признаков и операций над ними и показать, что происходит в той или иной ситуации, как происходит маршрутизация запросов, как это делается при описании страдиционных СУБД.
В-третьих, крайне интересно прокрутить задачи машинного обучения. (Скорее, не сами задачи, а типы задач.)
В-четвёртых, ... возникает большой соблазн сделать хранилище призаков самому. С нуля. Чтобы понять и обсудить все вопросы.
Будем считать данную статью начальным введением в тему. Приглашением к разговору.
Что такое хранилище признаков?