Спасибо за статью. То есть получается что Splunk передает данные Python-о в виде стандартных потоков данных (stdin, stdout) по типу Hadoop Streaming или как?
Splunk может передавать в Python свои данные (события) в виде списка словарей Python. Для этого я использую функцию getOrganizedResults пакета splunk.Intersplunk.
Полученные результаты (results) я могу обрабатывать в Python.
В дальнейшем, с помощью функции outputResults, можно вывести результаты обработки (трансформаций) обратно в Splunk.
Я использовал для вывода в Splunk просто print. Этого было достаточно для демонстрации.
Splunk может передавать в Python свои данные (события) в виде списка словарей Python. Для этого я использую функцию getOrganizedResults пакета splunk.Intersplunk.
Полученные результаты (results) я могу обрабатывать в Python.
В дальнейшем, с помощью функции outputResults, можно вывести результаты обработки (трансформаций) обратно в Splunk.
Я использовал для вывода в Splunk просто print. Этого было достаточно для демонстрации.
Можно и так. "В дальнейшем, возможно, я подключу необходимые внешние библиотеки в интерпретатор Python, используемый Splunk’ом.".
Дело в том, что просто подключить в Splunk'овский Python библиотекуscikit-learn у меня не получилось.
Я отдельно указал «плюсы» и «минусы» такой реализации (с двумя модулями) в разделе «Описание подхода».
Кроме того, специалисты Splunk рекомендуют «отделять» реализацию в отдельном модуле (см. https://answers.splunk.com/answers/8/can-i-add-python-modules-to-the-splunk-environment.html).
Не совсем так, а точнее наоборот. Немного более полно процитирую фразу "...Some of our users setup whichever script they've configured in Splunk as a pass-through to a script that runs using their system Python".
Далее идет пошаговое пояснение.
Расширение функциональных возможностей Splunk – это просто