Data Visualization: Data Discovery от Oracle BI

    До недавнего времени решение для бизнес-анализа Oracle BI обладало исключительно классической архитектурой, для которой характерны единая платформа с высоким уровнем безопасности данных и централизованное управление правами доступа. Также классический BI позволяет работать со сложными моделями данных, ETL-инструментами и множеством источников данных.

    Но в конце 2015 г., с выходом Oracle BI 12c, архитектура данного решения была дополнена функциями систем класса Data Discovery (подробнее о Data Discovery). А именно: был разработан новый компонент визуализации – Data Visualization, в котором не только качественно улучшена визуализация данных, но и появилась функция самообслуживания. Также оптимизированы процессы обработки в оперативной памяти, позволяющие максимально полно использовать ресурсы и анализировать больше локальных данных, данных уровня департамента, корпоративных данных и BigData. А вместе с упрощенным администрированием и оптимизированным процессом обновления новая версия платформы позволяет компаниям существенно улучшить показатели TCO (Total Cost of Ownership) и ROI (Return on Investment) по внедрению, так как снижаются затраты на ИТ и сокращается время на создание новых отчетов.

    Oracle Data Visualization (далее DV) – ключевое нововведение в Oracle BIEE 12с. DV отвечает самым актуальным требованиям к инструментам BI ‒ это наличие self-service (позволяет бизнес-пользователям без участия ИТ-специалистов подключать новые источники данных и строить новые визуализации), интуитивная графика, удобный интерфейс позволяющий в считанные секунды строить отчеты и диаграммы.


    DV представлен как в традиционной для Oracle серверной web-версии (Visual Analyzer в составе BIEE), так в desktop-версии, позволяющей работать автономно. При использовании Desktop DV пользователь добавляет свои источники ‒ базы данных различного формата, преднастроенные отчеты приложений серверного Oracle BI и, конечно, файлы Excel. Серверная же версия позволяет подключаться и к преднастроенным предметным областям BI. Перечень поддерживаемых типов источников отображен на скриншоте интерфейса Desktop DV:


    Интерфейс DV достаточно прост к освоению, и пользователю, имеющему опыт построения диаграмм в Excel, не составит труда разобраться.


    Для построения визуализаций применяется drag’n’drop. Пользователь отмечает необходимые атрибуты и показатели в левой части экрана (элементы предметной области Oracle BI или поля таблиц внешних источников) и перебрасывает в область построений. При этом DV автоматически выбирает тип визуализации и выполняет построение диаграммы. Далее пользователь может сам выполнить правки: изменить тип диаграммы, выбранные атрибуты, добавить при необходимости новые вычисляемые поля, наложить фильтры или выставить форматирование и цветовое оформление элементов диаграмм. При работе с текущей визуализацией возможно сделать drill-down по любому показателю модели и получить нужную детализацию. Интерфейс главной формы визуализации позволяет создавать несколько закладок и быстро перемещаться между панелями. При этом все визуализации сохраняются в качестве проектов, которые можно выгрузить и передать коллеге (в случае desktop-версии) как модель для построения – без настроек внешних источников или данных (если используются файлы) либо с ними.

    DV имеет полезную функцию «история анализа», что позволяет отменить последние изменения представлений, если вы случайно что-то «поломали». Есть возможность сделать «снэпшот» текущего анализа, добавить в него комментарии и, если сделать серию таких снимков анализа, можно их проиграть позднее на презентации, избавив пользователя от рутинных повторений выставления параметров.

    Стандартный набор DV содержит более двух десятков типов диаграмм и имеет функцию подключения внешних плагинов среди интересных типов диаграмм ‒ тепловая матрица, sunkey, древовидная структура, воронка продаж, диаграмма Ганта, географические представления с подключением собственных карт (это могут быть не только карты территорий, но и схемы помещений или элементы механизмов). Для подключения собственных слоев карт DV поддерживает формат GeoJSON.


    DV позволяет строить отчеты «на лету» по поисковому запросу терминов из модели данных. Например, в строку поиска вводится «прибыль» ‒ срабатывает инкрементный поиск и подставляется наименование показателя, далее DV отображает суммарную прибыль за заданный период. Затем вводим «группа» ‒ строится столбиковая визуализация по группам продукта и т.д., пока не получим отчет требуемой детализации. При этом DV сам выбирает тип диаграммы, исходя из заданного набора параметров, и, конечно, построенный таким образом отчет сразу готов к любым изменениям пользователем, как если бы он создавался через стандартный drag’n’drop.


    Для оценки качества анализируемых данных DV предлагает функцию профилирования: сводные диаграммы по каждому атрибуту.


    Среди встроенных функций имеются расширения для предиктивной аналитики. Можно оперативно построить прогнозы, определить тренды или выбросы. Конечно, можно дополнить встроенные функции внешними или разработать собственные (на языке R).


    Отдельно хочется отметить полезную функцию Data Flow. Она позволяет делать предобработку подключенных данных по шагам, например: выбрать часть полей из исходного набора данных, далее объединить с другим дата-сетом, добавить вычислимые показатели, наложить фильтры и в завершение выполнить группировку данных. На выходе получаем набор данных, готовый к визуализации. Также данную функцию можно использовать для сегментирования клиентской базы.


    Отдельно хотим отметить адекватную ценовую политику на DV ‒ стоимость 1 лицензии от 1300$.

    Подведем итоги. Oracle Data Visualization как отдельный инструмент анализа, несомненно, может быть полезен, но это функция, скорее всего, актуальна для небольших компаний. Полностью функциональность DV раскрывается при использовании совместно с классическим Oracle BI за счет подключения к преднастроенным предметным областям внешних данных и использование серверных вычислительных мощностей. Среди минусов desktop-версии отметим отсутствие на текущий момент версии под OS X и задержки в работе при загрузке больших Excel-файлов (тестировали с 3000 строк и 80 столбцами). В первом случае проблема компенсируется web-версией, а во втором, при работе с большими внешними файлами необходимо выполнять предварительную подготовку данных: удалять лишнюю аналитику, группировать строки или, наконец, разбивать таблицы на несколько по разным группам отчетов. А для этого в DV уже предусмотрен функционал Data Flow.

    Материал подготовил Денис Крылов, бизнес-аналитик компании «Инфосистемы Джет».
    Инфосистемы Джет
    523,00
    Компания
    Поделиться публикацией

    Комментарии 7

      –1
      Коллеги, просьба по возможности комментировать свою «отрицательную» оценку поста. Хотелось бы разобраться в причинах, а из-за отсутствия вменяемой обратной связи, это невозможно.
        +1
        Я не голосовал отриательно (просто не мог), поэтому только мое предположение. Вы притащили на Хабр обычный маркетинг. Сказали что штука стоит 1300 USD, но не показали ни одного примера, почему она стоит этих денег. Графиками, пусть даже самыми красивыми, никого не удивить последние лет 20.
          –1
          Спасибо за комментарий. Попробуем в перспективе уделить внимание этим деталям.
          0
          Если речь заходит про улучшение TCO и ROI — то, относительно чего считается, есть ли практические данные. Российский рынок несколько отличается и имеет свою сложившуюся оценку стоимости владения и оценки инвестирования в ПО. Кроме этого, что означает «небольшая компания» в качестве позиционирования на целевую аудиторию. От 1300$ — цена за пользовательскую лицензию или это на 25 пользователей как было для BI EE?
            –1
            Говоря об улучшении TCO и ROI, мы в первую очередь подразумеваем эффект от дополнения классического BI функциями DataDiscovery. Здесь самообслуживание позволяет экономить бюджет (исключаем вовлечение ИТ и интеграторов) и сокращать время (не требуется согласование изменения модели данных при насыщении ее аналитикой внешних источников) на реализацию новых идей анализа данных.

            На DV можно купить хоть 1 лицензию и пользоваться, в том числе, серверной версией.
            –1
            Коллеги, считаем нужным дать комментарий по статье в целом. DV это не только красивые графики. Он дополняет классическую платформу BI от Oracle и позволяет экономить время и деньги на создание новых отчетов с добавлением доп. источников данных. Это прежде всего актуально для пользователей, которые уже эксплуатируют OBI. Наша статья не посвящена сравнению данного продукта с конкурентными (это тема будущих статей J): задачей было донести новость о том, что Oracle BI совершил качественный рывок добавлением self-service.
              0
              Я self-service OBI наблюдал в презентации Ольги Горчинской, продвигающий этот продукт. И это было прекрасно реализовано уже 4-5 лет назад

              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

              Самое читаемое