Хабр, привет! Проанализировали кейсы по big data, в которых технологии больших данных помогли компаниям более эффективно работать с клиентами или оптимизировать внутренние процессы.
Кстати, совсем скоро у нас стартует первый набор программы Big Data for Executives, цель которой подготовить руководителя или владельца бизнеса к использованию данных в своей деятельности. Почитать о ней подробнее можно здесь.
Отрасль: предоставление контента по подписке — электронные книги.
Bookmate – российский сервис для чтения электронных книг по подписке на мобильных устройствах, имеет более 3 млн. пользователей по всему миру. Совместно с компанией E-Contenta компании удалось решить проблему «холодного старта» — рекомендаций новым пользователям, которые еще не выбирали никаких книг в приложении. Для предложения книг новым пользователям была разработана рекомендательная система, использующая внешние данные – данные социальных сетей и DMP (история кликов, поисковых запросов в Интернете и другие данные о поведении пользователей).
Результат: число просмотров рекомендованных книг новыми пользователями выросло в 2,17 раз, конверсия в платных пользователей выросла в 1,4 раза.
Отрасль: розничная торговля, интернет-магазин.
BikeBerry.com – американский интернет-магазин велосипедов, мотоциклов и запчастей и аксессуаров к ним. При помощи компании RetentionScience были внедрены сложные алгоритмы машинного обучения и статистические модели для отслеживания и предсказания покупательского поведения. Используемые технологии позволили выявлять и использовать в моделях схемы поведения на сайте, также использовались данные по истории покупок, демографическая и поведенческая информация. В результате магазин смог рекомендовать клиентам наиболее релевантные для них товары и делать персонализированные предложения о скидках только тем клиентам, которые действительно в них нуждались, что позволило увеличить прибыльность, более чем удвоить объем продаж и улучшить ряд других показателей.
Результат: увеличение продаж на 133%, прирост активности пользователей на 200%, удвоение числа клиентов, совершающих повторные покупки, увеличение среднего чека таких клиентов на 30%.
Отрасль: гостиничный бизнес.
Зимой 2014 г. американская сеть гостиниц Red Roof Inn столкнулась со снижением потока туристов в связи с суровой зимой и неблагоприятными погодными условиями. Однако из-за таких погодных условий в аэропортах ежедневно отменяли большое количество рейсов, пассажиры надолго оставались в аэропортах и нуждались в гостинице. Используя открытые данные о погодных условиях и отмене рейсов, компания смогла отправлять пассажирам задержанных рейсов персонализированные предложения с контактными данными ближайшей к аэропорту гостиницы сети как раз тогда, когда они были наиболее востребованы.
Результат: дополнительный прирост выручки на 10% к предыдущему году даже в условиях сниженного потока туристов.
Отрасль: образование.
Skillsoft – американская компания, разрабатывающая образовательное программное обеспечение и контент, один из мировых лидеров в сфере корпоративных образовательных программ. В партнерстве с IBM компания использовала внутренние данные о взаимодействии пользователей с системой, напрямую через программу и через e-mail рассылки, чтобы персонализировать их опыт, увеличить вовлеченность и улучшить результаты обучения. Данные о поведении пользователя в программе использовались для контроля вовлеченности, для определения лучшего времени и канала коммуникации, с помощью которого можно привлечь внимание пользователя. Также на основе предпочтений данного и других пользователей была построена рекомендательная система образовательного контента (84% пользователей оценили рекомендации как релевантные), были предложены оптимальные для каждого пользователя способы визуализации материала.
Результат: рост вовлеченности пользователей во взаимодействие с контентом на 128%.
Отрасль: медиа, журналистика.
Huffington Post – популярное американское интернет-издание, агрегатор и блог, имеющее множество локализованных версий для различных территорий и языков. Компания использует A-B тестирование для выбора лучших заголовков статей, изучает поведение и предпочтения целевой аудитории, чтобы публиковать материалы, интересные отдельным группам, в часы их наибольшей активности (например, материалы для родителей публикуются поздно вечером по будням, когда дети уже уснули). Компания использует анализ поведения пользователя в браузере и рекомендательные системы, чтобы предлагать пользователям наиболее интересный им контент и делать его наиболее доступным и привлекательным начиная с главной страницы сайта (технология Gravity).
Результат: в августе 2014 г. превышен порог в 100 млн. уникальных посетителей в месяц, достигнуто первое место по популярности в США среди интернет-изданий, среднее число просматриваемых статей за одну сессию возросло до 10-12.
Отрасль: предоставление контента – фильмы.
VidiMax – российский сервис, предоставляющий лицензированный доступ к художественному и документальному кино, сериалам, мультфильмам, спортивным трансляциям и телешоу. Доступен через смарт-ТВ, имеет около 1 млн. пользователей. Для повышения лояльности пользователей во время бесплатного пробного двухнедельного использования сервиса совместно с компанией E-Contenta была внедрена рекомендательная система, появился блок персональных рекомендаций.
Результат: фильмы в блоке персональных рекомендаций смотрят в 2,5 раза чаще, чем фильмы в подборке из самых популярных фильмов.
Отрасль: банки.
Сбербанк использует большие данные и машинное обучение во многих областях, в том числе в кредитном скоринге. Для решения этой задачи компания использует не только традиционные данные, такие как социально-демографические параметры, кредитная история, история трансакций, финансовая отчетность, но и ряд других. Для кредитного скоринга Сбербанк использует также графы связей клиентов, построенные на основе данных о денежных переводах и данных социальных сетей. Для кредитного скоринга компаний используются тексты новостей с их упоминанием, для которых проводится автоматический анализ тональности. В 2015 году компания добавила в модели данные сотовых операторов, что позволило улучшить качество классификатора на 7 п.п. по коэффициенту Джини. Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки. Для розничных клиентов использование алгоритмов машинного обучения позволило повысить качество скоринговых моделей на 4 п.п. по коэффициенту Джини за счет более точного отбора факторов.
Результат: постоянный рост качества скоринговых моделей, в том числе за счет последних нововведений.
Отрасль: транспорт.
Union Pacific Railroad – крупнейшая железнодорожная компания США, имеет более 8 тыс. локомотивов и владеет крупнейшей в США сетью железных дорог. На дне каждого состава компании были установлены термометры, акустические и визуальные сенсоры и другие датчики. Данные от них передаются в центр обработки по волоконно-оптическим кабелям, протянутым вдоль сети железных дорог. Центр обработки также получает данные о погодных условиях, данные о состоянии тормозных и других систем, GPS-координаты составов. Собранные данные и построенные по ним предиктивные модели позволяют отслеживать состояние колес и железнодорожного полотна и предсказывать сход составов с рельсов за несколько дней или даже недель до возможного инцидента. Этого времени достаточно для того, чтобы оперативно устранить проблемы, избежать повреждений состава и задержки остальных поездов.
Результат: компании удалось снизить число схождений составов с рельсов на 75% и избежать значительных потерь (ранее потери от одного схода с рельсов могли достигать 40 млн. $).
Отрасль: государственный сектор – полиция.
Используя решения, разработанные компанией PredPol, полиция Лос-Анджелеса смогла получать наиболее вероятное время и районы (с высокой точностью, порядка 50 кв. м) совершения различных типов преступлений и для их предотвращения направлять туда дополнительные силы полиции. Система использует исторические данные о времени, типе и районе совершения преступлений, обрабатывает их с помощью алгоритмов кластеризации в пространстве и во времени. Предсказательное моделирование осуществляется с помощью математических моделей точечных процессов (Self-Exciting Point Process Modeling). Никакие персональные данные находящихся в городе людей и данные об их местонахождении при этом не используются, что позволяет соблюсти требования приватности частной жизни. Снижение числа преступлений привело к сокращению затрат в полиции, судебной системе и системе исполнения наказаний.
Результат: сокращение числа краж на 33%, снижение числа насильственных преступлений на 21%.
Отрасль: эксплуатация зданий.
St. Vincent’s – крупная австралийская сеть государственных и частных клиник, расположенных преимущественно в Сиднее и Мельбурне. Управляющая зданиями клиник компания Entro.py совместно с компанией BuildingIQ провела внедрение решения, анализирующего текущие данные по использованию помещений, температурному режиму и погодным условиям, а также характеристики зданий и исторические данные по энергопотреблению для снижения затрат на отопление и охлаждение зданий.
Результат: в 2014 г. затраты на климат-контроль снизились на 12%.
Отрасль: логистика.
UPS – американская логистическая компания, крупнейшая в мире по доставке посылок и управлению цепями поставок, доставляет более 16,9 миллионов грузов в день в более чем 220 странах мира. UPS использует большие данные для оптимизации маршрутов, сокращения затрат топлива и нагрузки на окружающую среду. Компания применяет радиолокацию для отслеживания грузов, собирает и анализирует показатели множества датчиков для контроля состояния транспортных средств и поведения водителей, использует данные мобильных CRM для мониторинга доставки и качества обслуживания клиентов. Для оптимизации маршрутов и сокращения затрат в компании внедрена система ORION – одна из крупнейших в мире систем, основанных на результатах математической теории исследования операций. Построение оптимальных маршрутов производится в реальном времени с использованием огромных вычислительных мощностей. Для решения этой задачи система использует картографические данные, данные о пунктах отправления и прибытия, размерах и требуемых сроках доставки грузов.
Результат: экономия порядка 6 млн. литров топлива в год, сокращение выбросов углерода в атмосферу на 13 тыс. тонн ежегодно, повышение скорости доставки.
Отрасль: машиностроение.
ThyssenKrupp AG – один из ведущих мировых производителей лифтов, обслуживает более 1,1 млн. лифтов по всему миру. В партнерстве с Microsoft компания запустила систему MAX, которая через Интернет вещей собирает данные от множества датчиков, установленных в лифтах компании (отслеживают скорость кабины, функционирование дверей, температуру мотора и др.) и по ним строит предиктивные модели на платформе Azure Machine Learning. Модели позволяют предупредить инцидент до его возникновения и передать технику конкретный код поломки, один из 400 возможных, чтобы сократить время обслуживания. В результате сокращаются затраты на обслуживание и ремонт (одна поломка обходится минимум в 300$) и создается дополнительная ценность для клиентов: лифты становятся более надежными, безопасными, владельцы расположенных в зданиях магазинов, гостиниц и других организаций не несут убытки.
Результат: время бесперебойной работы лифтов выросло в среднем на 50%.
Узнать о нашей программе Big Data for Executives можно здесь. А тут новый набор на программу «Специалист по большим данным», и до 15 ноября действует скидка 15%.
Кстати, совсем скоро у нас стартует первый набор программы Big Data for Executives, цель которой подготовить руководителя или владельца бизнеса к использованию данных в своей деятельности. Почитать о ней подробнее можно здесь.
Ориентация на клиента
1.Компания: Bookmate.
Отрасль: предоставление контента по подписке — электронные книги.
Bookmate – российский сервис для чтения электронных книг по подписке на мобильных устройствах, имеет более 3 млн. пользователей по всему миру. Совместно с компанией E-Contenta компании удалось решить проблему «холодного старта» — рекомендаций новым пользователям, которые еще не выбирали никаких книг в приложении. Для предложения книг новым пользователям была разработана рекомендательная система, использующая внешние данные – данные социальных сетей и DMP (история кликов, поисковых запросов в Интернете и другие данные о поведении пользователей).
Результат: число просмотров рекомендованных книг новыми пользователями выросло в 2,17 раз, конверсия в платных пользователей выросла в 1,4 раза.
2. Компания: BikeBerry.
Отрасль: розничная торговля, интернет-магазин.
BikeBerry.com – американский интернет-магазин велосипедов, мотоциклов и запчастей и аксессуаров к ним. При помощи компании RetentionScience были внедрены сложные алгоритмы машинного обучения и статистические модели для отслеживания и предсказания покупательского поведения. Используемые технологии позволили выявлять и использовать в моделях схемы поведения на сайте, также использовались данные по истории покупок, демографическая и поведенческая информация. В результате магазин смог рекомендовать клиентам наиболее релевантные для них товары и делать персонализированные предложения о скидках только тем клиентам, которые действительно в них нуждались, что позволило увеличить прибыльность, более чем удвоить объем продаж и улучшить ряд других показателей.
Результат: увеличение продаж на 133%, прирост активности пользователей на 200%, удвоение числа клиентов, совершающих повторные покупки, увеличение среднего чека таких клиентов на 30%.
3. Компания: Red Roof Inn.
Отрасль: гостиничный бизнес.
Зимой 2014 г. американская сеть гостиниц Red Roof Inn столкнулась со снижением потока туристов в связи с суровой зимой и неблагоприятными погодными условиями. Однако из-за таких погодных условий в аэропортах ежедневно отменяли большое количество рейсов, пассажиры надолго оставались в аэропортах и нуждались в гостинице. Используя открытые данные о погодных условиях и отмене рейсов, компания смогла отправлять пассажирам задержанных рейсов персонализированные предложения с контактными данными ближайшей к аэропорту гостиницы сети как раз тогда, когда они были наиболее востребованы.
Результат: дополнительный прирост выручки на 10% к предыдущему году даже в условиях сниженного потока туристов.
4. Компания: Skillsoft.
Отрасль: образование.
Skillsoft – американская компания, разрабатывающая образовательное программное обеспечение и контент, один из мировых лидеров в сфере корпоративных образовательных программ. В партнерстве с IBM компания использовала внутренние данные о взаимодействии пользователей с системой, напрямую через программу и через e-mail рассылки, чтобы персонализировать их опыт, увеличить вовлеченность и улучшить результаты обучения. Данные о поведении пользователя в программе использовались для контроля вовлеченности, для определения лучшего времени и канала коммуникации, с помощью которого можно привлечь внимание пользователя. Также на основе предпочтений данного и других пользователей была построена рекомендательная система образовательного контента (84% пользователей оценили рекомендации как релевантные), были предложены оптимальные для каждого пользователя способы визуализации материала.
Результат: рост вовлеченности пользователей во взаимодействие с контентом на 128%.
5. Компания: Huffington Post.
Отрасль: медиа, журналистика.
Huffington Post – популярное американское интернет-издание, агрегатор и блог, имеющее множество локализованных версий для различных территорий и языков. Компания использует A-B тестирование для выбора лучших заголовков статей, изучает поведение и предпочтения целевой аудитории, чтобы публиковать материалы, интересные отдельным группам, в часы их наибольшей активности (например, материалы для родителей публикуются поздно вечером по будням, когда дети уже уснули). Компания использует анализ поведения пользователя в браузере и рекомендательные системы, чтобы предлагать пользователям наиболее интересный им контент и делать его наиболее доступным и привлекательным начиная с главной страницы сайта (технология Gravity).
Результат: в августе 2014 г. превышен порог в 100 млн. уникальных посетителей в месяц, достигнуто первое место по популярности в США среди интернет-изданий, среднее число просматриваемых статей за одну сессию возросло до 10-12.
6. Компания: VidiMax.
Отрасль: предоставление контента – фильмы.
VidiMax – российский сервис, предоставляющий лицензированный доступ к художественному и документальному кино, сериалам, мультфильмам, спортивным трансляциям и телешоу. Доступен через смарт-ТВ, имеет около 1 млн. пользователей. Для повышения лояльности пользователей во время бесплатного пробного двухнедельного использования сервиса совместно с компанией E-Contenta была внедрена рекомендательная система, появился блок персональных рекомендаций.
Результат: фильмы в блоке персональных рекомендаций смотрят в 2,5 раза чаще, чем фильмы в подборке из самых популярных фильмов.
Внутренняя оптимизация
1.Компания: Сбербанк.
Отрасль: банки.
Сбербанк использует большие данные и машинное обучение во многих областях, в том числе в кредитном скоринге. Для решения этой задачи компания использует не только традиционные данные, такие как социально-демографические параметры, кредитная история, история трансакций, финансовая отчетность, но и ряд других. Для кредитного скоринга Сбербанк использует также графы связей клиентов, построенные на основе данных о денежных переводах и данных социальных сетей. Для кредитного скоринга компаний используются тексты новостей с их упоминанием, для которых проводится автоматический анализ тональности. В 2015 году компания добавила в модели данные сотовых операторов, что позволило улучшить качество классификатора на 7 п.п. по коэффициенту Джини. Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки. Для розничных клиентов использование алгоритмов машинного обучения позволило повысить качество скоринговых моделей на 4 п.п. по коэффициенту Джини за счет более точного отбора факторов.
Результат: постоянный рост качества скоринговых моделей, в том числе за счет последних нововведений.
2. Компания: Union Pacific Railroad
Отрасль: транспорт.
Union Pacific Railroad – крупнейшая железнодорожная компания США, имеет более 8 тыс. локомотивов и владеет крупнейшей в США сетью железных дорог. На дне каждого состава компании были установлены термометры, акустические и визуальные сенсоры и другие датчики. Данные от них передаются в центр обработки по волоконно-оптическим кабелям, протянутым вдоль сети железных дорог. Центр обработки также получает данные о погодных условиях, данные о состоянии тормозных и других систем, GPS-координаты составов. Собранные данные и построенные по ним предиктивные модели позволяют отслеживать состояние колес и железнодорожного полотна и предсказывать сход составов с рельсов за несколько дней или даже недель до возможного инцидента. Этого времени достаточно для того, чтобы оперативно устранить проблемы, избежать повреждений состава и задержки остальных поездов.
Результат: компании удалось снизить число схождений составов с рельсов на 75% и избежать значительных потерь (ранее потери от одного схода с рельсов могли достигать 40 млн. $).
3. Компания: Los Angeles Police Department.
Отрасль: государственный сектор – полиция.
Используя решения, разработанные компанией PredPol, полиция Лос-Анджелеса смогла получать наиболее вероятное время и районы (с высокой точностью, порядка 50 кв. м) совершения различных типов преступлений и для их предотвращения направлять туда дополнительные силы полиции. Система использует исторические данные о времени, типе и районе совершения преступлений, обрабатывает их с помощью алгоритмов кластеризации в пространстве и во времени. Предсказательное моделирование осуществляется с помощью математических моделей точечных процессов (Self-Exciting Point Process Modeling). Никакие персональные данные находящихся в городе людей и данные об их местонахождении при этом не используются, что позволяет соблюсти требования приватности частной жизни. Снижение числа преступлений привело к сокращению затрат в полиции, судебной системе и системе исполнения наказаний.
Результат: сокращение числа краж на 33%, снижение числа насильственных преступлений на 21%.
4. Компания: Entro.py.
Отрасль: эксплуатация зданий.
St. Vincent’s – крупная австралийская сеть государственных и частных клиник, расположенных преимущественно в Сиднее и Мельбурне. Управляющая зданиями клиник компания Entro.py совместно с компанией BuildingIQ провела внедрение решения, анализирующего текущие данные по использованию помещений, температурному режиму и погодным условиям, а также характеристики зданий и исторические данные по энергопотреблению для снижения затрат на отопление и охлаждение зданий.
Результат: в 2014 г. затраты на климат-контроль снизились на 12%.
5. Компания: United Parcel Service (UPS).
Отрасль: логистика.
UPS – американская логистическая компания, крупнейшая в мире по доставке посылок и управлению цепями поставок, доставляет более 16,9 миллионов грузов в день в более чем 220 странах мира. UPS использует большие данные для оптимизации маршрутов, сокращения затрат топлива и нагрузки на окружающую среду. Компания применяет радиолокацию для отслеживания грузов, собирает и анализирует показатели множества датчиков для контроля состояния транспортных средств и поведения водителей, использует данные мобильных CRM для мониторинга доставки и качества обслуживания клиентов. Для оптимизации маршрутов и сокращения затрат в компании внедрена система ORION – одна из крупнейших в мире систем, основанных на результатах математической теории исследования операций. Построение оптимальных маршрутов производится в реальном времени с использованием огромных вычислительных мощностей. Для решения этой задачи система использует картографические данные, данные о пунктах отправления и прибытия, размерах и требуемых сроках доставки грузов.
Результат: экономия порядка 6 млн. литров топлива в год, сокращение выбросов углерода в атмосферу на 13 тыс. тонн ежегодно, повышение скорости доставки.
6. Компания: ThyssenKrupp AG.
Отрасль: машиностроение.
ThyssenKrupp AG – один из ведущих мировых производителей лифтов, обслуживает более 1,1 млн. лифтов по всему миру. В партнерстве с Microsoft компания запустила систему MAX, которая через Интернет вещей собирает данные от множества датчиков, установленных в лифтах компании (отслеживают скорость кабины, функционирование дверей, температуру мотора и др.) и по ним строит предиктивные модели на платформе Azure Machine Learning. Модели позволяют предупредить инцидент до его возникновения и передать технику конкретный код поломки, один из 400 возможных, чтобы сократить время обслуживания. В результате сокращаются затраты на обслуживание и ремонт (одна поломка обходится минимум в 300$) и создается дополнительная ценность для клиентов: лифты становятся более надежными, безопасными, владельцы расположенных в зданиях магазинов, гостиниц и других организаций не несут убытки.
Результат: время бесперебойной работы лифтов выросло в среднем на 50%.
Узнать о нашей программе Big Data for Executives можно здесь. А тут новый набор на программу «Специалист по большим данным», и до 15 ноября действует скидка 15%.