Зачем вам нужен Splunk? Аналитика работы приложений



    Почему мобильное приложение вышло из строя? Можем ли мы выявить проблемы с приложениями до того, как с этим столкнутся конечные пользователи? Является ли последняя версия приложения лучше или хуже, чем предыдущие? В этой статье мы расскажем, как вам может помочь Splunk в поиске ответов на эти вопросы.

    Этой статьей мы начинаем цикл статей о том, для решения каких задач можно использовать Splunk. Все решения можно условно разделить на 5 направлений. Сегодня начнем разбираться более подробно с аналитики приложений.



    В настоящее время бизнес опирается на приложения для обработки практически каждого процесса. Низкий уровень удовлетворенности качеством работы этих приложений может поставить под угрозу репутацию, конкурентные преимущества и в конечном итоге доход. Поэтому получение инсайдов из приложений и инфраструктуры, на которой они работают, становится важной задачей для любого бизнеса.

    Splunk позволяет агрегировать машинные данные об использовании приложений, их доступности и производительности. Данные могут собираться из широкого спектра источников в режиме реального времени.




    Давайте разберемся подробнее, какую ценность из мониторинга работы приложений мы можем получить.

    Расширенный мониторинг приложений и алертинг


    Измерение в режиме реального времени доступности приложений, производительности и использования пользователями способствует возможности обеспечения высокого качества обслуживания и получения положительного клиентского опыта. Когда вы комбинируете видимость машинных данных на разных уровней вашей инфраструктуры с мониторингом в реальном времени, вы может предвидеть события даже до того, как они произошли.

    Исправление проблем


    Сокращение среднего времени на восстановление работоспособности системы (MTTR) и на устранение неполадок, определяя причины сбоев в работе и узкие места системы. Распределенные приложения могут генерировать много ошибок, а корень проблемы найти не просто, так как разработчики приложений и администраторы могут не иметь прямого доступа к машинным данным, которые им нужны. Splunk может предоставить доступ ко всем вашим данным, что позволит быстро исправит проблемы и сократить время простоя.



    Планирование мощности


    Оптимизация производительности приложения и стоимости обслуживания за счет понимания использования приложения. А также прогноз будущих значений и планирование мощности, за счет машинного обучения

    Управление уровнем обслуживания (SLA)


    Анализ и составление отчетности об общей доступности сервиса и ключевых показателях эффективности (KPI), а также способность быстро определить причину, в случае отклонения от оптимальных значений.

    Бизнес-аналитика


    Возможность интегрировать в Splunk не только IT-данные, но и данные из источников не относящихся к IT, позволяет разработчикам и разным бизнес направлениям оценивать влияние транзакций на бизнес и то, как приложения способствуют ведению бизнеса.

    DevOps


    Для ИТ-специалистов, использующих DevOps, программное обеспечение Splunk помогает повысить скорость и качество работы над приложениям. В отличие от других решений, ориентированных на отдельные компоненты разработки, Splunk предоставляет информацию в реальном времени на всех этапах жизненного цикла разработки продукта, что позволяет сократить время разработки и выхода продукта на рынок. Видео о DevOps

    Success story


    Давайте посмотрим, как компания Zillow, занимающаяся продажей и арендой недвижимости, использует Splunk для обеспечения бесперебойной работы своего веб-сайта.



    Трафик веб-сайта Zillow генерируется клиентами с мобильных устройств, ПК и планшетов. Раньше, когда случались случайные сбои веб-сайта, руководители Zillow были обеспокоены удовлетворенностью клиентов, рискуя потерями в миллионах долларов дохода от рекламы или неспособностью заключать договорные соглашения с компаниями, которые предоставляют данные о недвижимости для Zillow.

    «Если веб-сайт «упал» в 2 часа ночи, мне пришлось бы кропотливо просмотреть терабайты журналов, чтобы выяснить, что не так» — говорит Jerome Ibanes, архитектор данных в Zillow.

    Продолжать использовать устаревшие инструменты было невозможно: Zillow нуждался в эффективных решениях для обработки и анализа постоянно изменяющихся неструктурированных данных. Ранее Zillow приходилось перемещать терабайты данных по нескольким инструментам, чтобы использовать машинное обучение и получать понимание происходящего.

    Zillow изначально развернули Splunk Enterprise для устранения неполадок ИТ — инфраструктуры. А уже успех в обработке ошибок привел к дополнительным задачам: от прогнозирования трафика веб-сайта и мониторинга среды тестирования приложений до получения информации о посещениях сайта клиентами и их действиях на сайте, чтобы предоставить наилучший контент.

    Видео, в котором Jerome Ibanes рассказывает об опыте внедрения Splunk в Zillow, можно посмотреть тут.

    Проблемы, которые требовали решения


    • Нарушения работы веб-сайта влияли на отношение клиентов
    • Нарушения веб-сайта влияли на доходы от рекламы и компрометировали договорные соглашения с компаниями, которые предоставляют данные для Zillow
    • На идентификацию причины затрачивались часы
    • Разработчики продуктов ждали от одного до двух дней для доступа к данным

    Источники данных


    • Веб-серверы
    • Серверы Java
    • Приложения на Python
    • Базы данных
    • Брандмауэры
    • Балансировщики нагрузки
    • Мобильные устройства

    Влияние на бизнес


    • Улучшение качества обслуживания клиентов
    • Сокращение величины упущенной прибыли размерами в миллионы долларов за счет сокращения сбоев веб-сайта
    • Сокращение времени выявления причины инцидента от часов до нескольких минут или секунд
    • Ускорение времени выхода на рынок, предоставляя разработчикам продуктов данные работы приложений в режиме реального времени

    Таким образом, аналитика работы приложений в Splunk позволяет:

    1. Улучшить производительность приложений, путем выявления проблем, которые затрагивают доступность и быстродейсвие
    2. Сократить среднее время на восстановление работоспособности системы и устранение неполадок
    3. Получить информацию использования приложений, включая поведение пользователей и производительность приложения
    4. Улучшить DevOps и уменьшить время выхода на рынок продукта


    • +17
    • 3.7k
    • 5
    TS Solution
    98.22
    Системный интегратор
    Share post

    Comments 5

      +1
      Отличный Вы выбрали пример компании! :)

      Я DevOps инженер в Zillow, отвечу на общие технические вопросы, не подпадающие под NDA.
        0
        круто =) напишите как вам спланк, было бы интересно из первых уст послушать)
          0
          В компании несколько брендов, в основном из-за поглощений, соответсвенно каждый бренд «пришёл» со своей инфраструктурой. Со временем всё логирование глобально перевели на Splunk.
          Туда пишутся как обычные файловые логи, так и информация напрямую из приложения.
          В целом, все команды довольны, реализована интеграция с SSO, разделение прав: кто из какого бренда какие логи может видеть, настроено большое количество фильтров, проводятся внутренние тренинги.
          Стоимость продукта окупается его эффективностью, в рамках большой компании экономический эффект от системы логирования преобладает над ценой.
            0
            Спланк — это хорошо для бизнес-аналитиков, для L3 саппорта — вполне френдли UI, гибкие фильтры, отчеты — все наглядно. Полезно для архитекторов.

            Еще Спланк — хорошо, если у вас крупная компания с множеством проектов и в спланк можно интегрировать все проекты, ибо покупать его для одного приложения — дорого.

            А просто для мониторинга (для админов/девопсов) — IMHO слишком большой оверхед
          +1

          Splunk — это прекрасно. Это офигенный поиск и агрегация. Удобные отчёты. Но. Очень. Дорого.

          Only users with full accounts can post comments. Log in, please.