Rupper 13 фев 2017 в 15:27

Мультифакторный анализатор деятельности произвольного предприятия на IEM-платформе

3 мин

Блог компании UltimaBig Data*Математика*Разработка под e-commerce*Машинное обучение*

Recovery Mode

WANTED: талантливые математики на интересный и денежный контракт
Целевая специализация — матстатистика, матмоделирование, нейросети.
Описание задачи — ниже.

Вторая попытка по человечески сформулировать задачу из предыдущего постинга.

Цель

Разработка приложения для глубокого анализа данных о деятельности предприятия, накапливаемых в IEM-системе. На выходе предполагается получить промышленный коммерческий продукт, универсальное решение для анализа средствами Big Data, совместимое со всеми IEM-решениями на платформе Ultimate Solid.

Общая формулировка задачи

Разработка механизма поиска нетипичных отклонений в данных результатов исполнения стандартизированных бизнес-процессов. Изначально предполагается использование методов матстатистики, возможно — нейронных сетей. И все, что пригодится тоже. “Нетипичность” отклонений является настраиваемым параметром градуса параноидальности системы (она же чувствительность, скаляр).

Развернутая попытка описать хотелки

В БД IEM-системы собирается полная структурированная информация о ходе исполнения бизнес-процессов предприятия в реальном времени.

Пример визуализации структуры данных реального эксплуатанта системы в финансовой проекции

Сохраняется вся история, транзакции и прочие (в том числе агрегированные) атрибуты процессов и событий процессов. Ход исполнения бизнес-процессов жестко стандартизирован и гарантированно закрывается контуром системы.

На выходе получаются данные по результатам выполнения большого количества однотипных процедур (например, “выписка счета” — “приход денег на счет” — “резервирование товара” — “отгрузка товара”, и так миллион раз). Глубина детализации не имеет принципиальных ограничений, и определяется глубиной стандартизации реальных бизнес-процессов.

Внутри массива структурированных данных и предлагается искать нестандартные (относительно заданного градуса параноидальности) отклонения.

Пример: у всех менеджерам по продажам примерно одинаковый оборот, рентабельность (прибыль), однако у одного нетипично много возвратов по гарантии.

Непрерывная достоверность, согласованность и полнота данных БД IEM гарантируется платформой. Помимо прочего, они содержат информацию об объектах учета в разнообразных справочниках и о всех происходящих событиях и процессах в документах, регистрах и прочих механизмах. Все структуры данных и их связи и взаимодействия описываются метаданными, хранящимися в той же базе данных в структурированном, нормализованном виде.

В идеале работа будущего приложения должна выглядеть так: настраивается доступ к нужной базе данных, указывается градус параноидальности, и все.

Приложение самостоятельно считывает метаданные, исчерпывающе описывающие бизнес-логику предприятия, строит цепочки бизнес-процессов, группирует по ним фактически результаты их отработки, и в каждой группе отыскивает нетипичные.

Далее производит с ними некие действия, понимание природы которых входит в рамки задачи (теоретическая часть), а на выходе выплевывает факторы риска — контрагента, сотрудника, офис, время оформления заказов или другой сущности, информация о поведении которой хранится в системе.

Закончили про идеал.

Требования к исполнителю

На текущем этапе нам нужен человек (группа товарищей), которые а) глубоко осознАют о чем идет речь, б) построят математическую методологию решения задачи в общем случае.

К методологии можно отнести методы и эвристики определения значащих параметров (или определение неразличимости при заданном наборе параметров), определение процесса построения анализа данных и прочие технические детали.

С учетом расплывчатости и нетипичности задачи любые другие адекватные предложения от людей, которые смогут аргументировать собственную компетентность, будут рассмотрены. Искомое приложение обладает высокой рыночной емкостью, посему возможны различные варианты сотрудничества со вменяемым подрядчиком.

Технические моменты

В качестве СУБД используется Oracle 12c EE.
При необходимости может реализована real-time трансляция в Hadoop или аналогичные хранилища. Но, следуя методологии IEM, прямой сбор данных с сервера приложений является более предпочтительным решением.

Предложения направлять bigdata@ultimatebusinessware.ru

Теги:

Хабы:

Мультифакторный анализатор деятельности произвольного предприятия на IEM-платформе

Цель

Общая формулировка задачи

Развернутая попытка описать хотелки

Требования к исполнителю

Технические моменты

Публикации

Информация

Истории