12 кейсов по биг дате: подтвержденные примеры из индустрии, когда биг дата приносит деньги

    Хабр, привет! Проанализировали кейсы по big data, в которых технологии больших данных помогли компаниям более эффективно работать с клиентами или оптимизировать внутренние процессы.

    Кстати, совсем скоро у нас стартует первый набор программы Big Data for Executives, цель которой подготовить руководителя или владельца бизнеса к использованию данных в своей деятельности. Почитать о ней подробнее можно здесь.

    Ориентация на клиента


    1.Компания: Bookmate.


    Отрасль: предоставление контента по подписке — электронные книги.

    Bookmate – российский сервис для чтения электронных книг по подписке на мобильных устройствах, имеет более 3 млн. пользователей по всему миру. Совместно с компанией E-Contenta компании удалось решить проблему «холодного старта» — рекомендаций новым пользователям, которые еще не выбирали никаких книг в приложении. Для предложения книг новым пользователям была разработана рекомендательная система, использующая внешние данные – данные социальных сетей и DMP (история кликов, поисковых запросов в Интернете и другие данные о поведении пользователей).

    Результат: число просмотров рекомендованных книг новыми пользователями выросло в 2,17 раз, конверсия в платных пользователей выросла в 1,4 раза.

    image

    2. Компания: BikeBerry.


    Отрасль: розничная торговля, интернет-магазин.

    BikeBerry.com – американский интернет-магазин велосипедов, мотоциклов и запчастей и аксессуаров к ним. При помощи компании RetentionScience были внедрены сложные алгоритмы машинного обучения и статистические модели для отслеживания и предсказания покупательского поведения. Используемые технологии позволили выявлять и использовать в моделях схемы поведения на сайте, также использовались данные по истории покупок, демографическая и поведенческая информация. В результате магазин смог рекомендовать клиентам наиболее релевантные для них товары и делать персонализированные предложения о скидках только тем клиентам, которые действительно в них нуждались, что позволило увеличить прибыльность, более чем удвоить объем продаж и улучшить ряд других показателей.

    Результат: увеличение продаж на 133%, прирост активности пользователей на 200%, удвоение числа клиентов, совершающих повторные покупки, увеличение среднего чека таких клиентов на 30%.

    3. Компания: Red Roof Inn.


    Отрасль: гостиничный бизнес.

    Зимой 2014 г. американская сеть гостиниц Red Roof Inn столкнулась со снижением потока туристов в связи с суровой зимой и неблагоприятными погодными условиями. Однако из-за таких погодных условий в аэропортах ежедневно отменяли большое количество рейсов, пассажиры надолго оставались в аэропортах и нуждались в гостинице. Используя открытые данные о погодных условиях и отмене рейсов, компания смогла отправлять пассажирам задержанных рейсов персонализированные предложения с контактными данными ближайшей к аэропорту гостиницы сети как раз тогда, когда они были наиболее востребованы.

    Результат: дополнительный прирост выручки на 10% к предыдущему году даже в условиях сниженного потока туристов.

    4. Компания: Skillsoft.


    Отрасль: образование.

    Skillsoft – американская компания, разрабатывающая образовательное программное обеспечение и контент, один из мировых лидеров в сфере корпоративных образовательных программ. В партнерстве с IBM компания использовала внутренние данные о взаимодействии пользователей с системой, напрямую через программу и через e-mail рассылки, чтобы персонализировать их опыт, увеличить вовлеченность и улучшить результаты обучения. Данные о поведении пользователя в программе использовались для контроля вовлеченности, для определения лучшего времени и канала коммуникации, с помощью которого можно привлечь внимание пользователя. Также на основе предпочтений данного и других пользователей была построена рекомендательная система образовательного контента (84% пользователей оценили рекомендации как релевантные), были предложены оптимальные для каждого пользователя способы визуализации материала.

    Результат: рост вовлеченности пользователей во взаимодействие с контентом на 128%.

    image

    5. Компания: Huffington Post.


    Отрасль: медиа, журналистика.

    Huffington Post – популярное американское интернет-издание, агрегатор и блог, имеющее множество локализованных версий для различных территорий и языков. Компания использует A-B тестирование для выбора лучших заголовков статей, изучает поведение и предпочтения целевой аудитории, чтобы публиковать материалы, интересные отдельным группам, в часы их наибольшей активности (например, материалы для родителей публикуются поздно вечером по будням, когда дети уже уснули). Компания использует анализ поведения пользователя в браузере и рекомендательные системы, чтобы предлагать пользователям наиболее интересный им контент и делать его наиболее доступным и привлекательным начиная с главной страницы сайта (технология Gravity).

    Результат: в августе 2014 г. превышен порог в 100 млн. уникальных посетителей в месяц, достигнуто первое место по популярности в США среди интернет-изданий, среднее число просматриваемых статей за одну сессию возросло до 10-12.

    6. Компания: VidiMax.


    Отрасль: предоставление контента – фильмы.

    VidiMax – российский сервис, предоставляющий лицензированный доступ к художественному и документальному кино, сериалам, мультфильмам, спортивным трансляциям и телешоу. Доступен через смарт-ТВ, имеет около 1 млн. пользователей. Для повышения лояльности пользователей во время бесплатного пробного двухнедельного использования сервиса совместно с компанией E-Contenta была внедрена рекомендательная система, появился блок персональных рекомендаций.

    Результат: фильмы в блоке персональных рекомендаций смотрят в 2,5 раза чаще, чем фильмы в подборке из самых популярных фильмов.

    Внутренняя оптимизация


    1.Компания: Сбербанк.


    Отрасль: банки.

    Сбербанк использует большие данные и машинное обучение во многих областях, в том числе в кредитном скоринге. Для решения этой задачи компания использует не только традиционные данные, такие как социально-демографические параметры, кредитная история, история трансакций, финансовая отчетность, но и ряд других. Для кредитного скоринга Сбербанк использует также графы связей клиентов, построенные на основе данных о денежных переводах и данных социальных сетей. Для кредитного скоринга компаний используются тексты новостей с их упоминанием, для которых проводится автоматический анализ тональности. В 2015 году компания добавила в модели данные сотовых операторов, что позволило улучшить качество классификатора на 7 п.п. по коэффициенту Джини. Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки. Для розничных клиентов использование алгоритмов машинного обучения позволило повысить качество скоринговых моделей на 4 п.п. по коэффициенту Джини за счет более точного отбора факторов.

    Результат: постоянный рост качества скоринговых моделей, в том числе за счет последних нововведений.

    2. Компания: Union Pacific Railroad


    Отрасль: транспорт.

    Union Pacific Railroad – крупнейшая железнодорожная компания США, имеет более 8 тыс. локомотивов и владеет крупнейшей в США сетью железных дорог. На дне каждого состава компании были установлены термометры, акустические и визуальные сенсоры и другие датчики. Данные от них передаются в центр обработки по волоконно-оптическим кабелям, протянутым вдоль сети железных дорог. Центр обработки также получает данные о погодных условиях, данные о состоянии тормозных и других систем, GPS-координаты составов. Собранные данные и построенные по ним предиктивные модели позволяют отслеживать состояние колес и железнодорожного полотна и предсказывать сход составов с рельсов за несколько дней или даже недель до возможного инцидента. Этого времени достаточно для того, чтобы оперативно устранить проблемы, избежать повреждений состава и задержки остальных поездов.

    Результат: компании удалось снизить число схождений составов с рельсов на 75% и избежать значительных потерь (ранее потери от одного схода с рельсов могли достигать 40 млн. $).

    3. Компания: Los Angeles Police Department.


    Отрасль: государственный сектор – полиция.

    Используя решения, разработанные компанией PredPol, полиция Лос-Анджелеса смогла получать наиболее вероятное время и районы (с высокой точностью, порядка 50 кв. м) совершения различных типов преступлений и для их предотвращения направлять туда дополнительные силы полиции. Система использует исторические данные о времени, типе и районе совершения преступлений, обрабатывает их с помощью алгоритмов кластеризации в пространстве и во времени. Предсказательное моделирование осуществляется с помощью математических моделей точечных процессов (Self-Exciting Point Process Modeling). Никакие персональные данные находящихся в городе людей и данные об их местонахождении при этом не используются, что позволяет соблюсти требования приватности частной жизни. Снижение числа преступлений привело к сокращению затрат в полиции, судебной системе и системе исполнения наказаний.

    Результат: сокращение числа краж на 33%, снижение числа насильственных преступлений на 21%.

    4. Компания: Entro.py.


    Отрасль: эксплуатация зданий.

    St. Vincent’s – крупная австралийская сеть государственных и частных клиник, расположенных преимущественно в Сиднее и Мельбурне. Управляющая зданиями клиник компания Entro.py совместно с компанией BuildingIQ провела внедрение решения, анализирующего текущие данные по использованию помещений, температурному режиму и погодным условиям, а также характеристики зданий и исторические данные по энергопотреблению для снижения затрат на отопление и охлаждение зданий.

    Результат: в 2014 г. затраты на климат-контроль снизились на 12%.

    5. Компания: United Parcel Service (UPS).


    Отрасль: логистика.

    UPS – американская логистическая компания, крупнейшая в мире по доставке посылок и управлению цепями поставок, доставляет более 16,9 миллионов грузов в день в более чем 220 странах мира. UPS использует большие данные для оптимизации маршрутов, сокращения затрат топлива и нагрузки на окружающую среду. Компания применяет радиолокацию для отслеживания грузов, собирает и анализирует показатели множества датчиков для контроля состояния транспортных средств и поведения водителей, использует данные мобильных CRM для мониторинга доставки и качества обслуживания клиентов. Для оптимизации маршрутов и сокращения затрат в компании внедрена система ORION – одна из крупнейших в мире систем, основанных на результатах математической теории исследования операций. Построение оптимальных маршрутов производится в реальном времени с использованием огромных вычислительных мощностей. Для решения этой задачи система использует картографические данные, данные о пунктах отправления и прибытия, размерах и требуемых сроках доставки грузов.

    Результат: экономия порядка 6 млн. литров топлива в год, сокращение выбросов углерода в атмосферу на 13 тыс. тонн ежегодно, повышение скорости доставки.

    image

    6. Компания: ThyssenKrupp AG.


    Отрасль: машиностроение.

    ThyssenKrupp AG – один из ведущих мировых производителей лифтов, обслуживает более 1,1 млн. лифтов по всему миру. В партнерстве с Microsoft компания запустила систему MAX, которая через Интернет вещей собирает данные от множества датчиков, установленных в лифтах компании (отслеживают скорость кабины, функционирование дверей, температуру мотора и др.) и по ним строит предиктивные модели на платформе Azure Machine Learning. Модели позволяют предупредить инцидент до его возникновения и передать технику конкретный код поломки, один из 400 возможных, чтобы сократить время обслуживания. В результате сокращаются затраты на обслуживание и ремонт (одна поломка обходится минимум в 300$) и создается дополнительная ценность для клиентов: лифты становятся более надежными, безопасными, владельцы расположенных в зданиях магазинов, гостиниц и других организаций не несут убытки.

    Результат: время бесперебойной работы лифтов выросло в среднем на 50%.

    Узнать о нашей программе Big Data for Executives можно здесь. А тут новый набор на программу «Специалист по большим данным», и до 15 ноября действует скидка 15%.

    New Professions Lab

    94,00

    Обучение в области работы с данными с 2015 г.

    Поделиться публикацией
    Комментарии 12
      –3
      «когда биг дата приносит деньги — но в статье ни полслова конкретно про деньги =(
      • НЛО прилетело и опубликовало эту надпись здесь
        +1
        В 2015 году компания добавила в модели данные сотовых операторов, что позволило улучшить качество классификатора на 7 п.п. по коэффициенту Джини. Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки.

        Очень интересно, как Сбер получает эти данные? Это же очень похоже на тайну связи…
          0
          Билайн программатик
            0
            Типа всё автоматизировано и люди в принятии решенй не участвуют? Но всё равно, оно принимается на основании информации ограниченного доступа.
              0
              да, были какие-то разговоры, что с ЗПД что-то не так, с продажей этой информации,
              но они говорили, что данные обезличены, поэтому можно.
                0
                Сбер проводит кредитный скоринг для конкретного субъекта (или группы), а обезличенность данных подразумевает невозможность однозначно его/её установить. Противоречие, однако :)
                Мы у себя пару проектов по bigdata для внешнего рынка потому и зарубили, что были ненулевые риски нарушения ЗПДн и ТС.
            0
            Видимо, под тайной связи понимается содержание. Никто же не анализирует, о чем вы говорите и пишете.
            Просто время и место. Обычные логи смотрят))
            0
            Весьма интересно, каким легальным образом, без получения разрешения на использование персональных данных, Сбербанк получает информацию «Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки»
            Тут банки действуют на грани добра и зла, скорее даже за гранью. Мне один из банков позвонил, когда я перевыпустил симкарту и не смог оператор не смог ответить разумно, откуда они узнал о замене карты. Ситуацию я не развивал, не было времени. Но надо попробовать еще раз )
              0
              Если у вас есть привязка номера телефона к карточному счёту в банке, то банк может, помимо номера телефона, запросить у сотового оператора IMSI для авторизации абонента. Это делается для защиты от мошенничества при замене sim-краты или смене владельца номера. Сбер, кстати, снял с себя ответсвенность, прописав в условиях «Мобильногго банка» следующее: «Держатель обязан информировать Банк о прекращении использования номера мобильного телефона, подключенного к услуге «Мобильный банк».»
              0
              Непонятно как считали результат, применение бигдата скорее всего тюнилось и было размазано по времени, а часть «результата» могли принести какие-то совсем другие изменения в бизнесе.
                0

                Обработка данных сотового оператора по конкретному человеку- это не биг-дата ни разу.

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                Самое читаемое