Монетизация машинного обучения: как превратить данные в деньги

    Машинное обучение — одна из самых быстрорастущих отраслей в IT. Каждый год эта сфера растёт на 44 %. И, по аналитике экспертов-прогнозистов, до 2024 года размер рынка будет составлять уже свыше 30 млрд. долларов — это в 25 раз больше, чем было в 2017 году. Многие компании уже понимают ценность машинного обучения для собственного бизнеса. И цель здесь прагматичная — деньги. ML-специалисты помогают компаниям увеличивать свой доход.

    Но если инженер машинного обучения может приносить профит компаниям, то он может и создать собственный успешный проект. В этом материале мы расскажем, в каких отраслях и как именно он сможет монетизировать свои навыки. Итак, поехали!


    Персонализация маркетинга

    Любая крупная компания, которая занимается онлайн-торговлей, собирает огромное количество информации о своих клиентах (увы). Предпочтения, характер и история заказов каждого собираются с CMS и часто лежат мёртвым грузом, занимая место на сервере.

    Инженер по машинному обучению способен настроить систему персонификации маркетинга, чтобы каждый посетитель сразу видел в интернет-магазине товары и рубрики, которые его заинтересуют. 

    За примерами не нужно далеко ходить. В Facebook зарегистрировано свыше 1,6 млрд. человек — в соцсети есть данные об именах, геолокациях, работе, хобби, семейном положении, наличии детей и прочее, прочее. 

    Вместе с тем в Фейсбуке свыше 60 млн. бизнес-страниц, которые запускают рекламные кампании. Нейросеть соцсети каждый день обрабатывает свыше 60 млрд. интеракций пользователей с друг с другом и больше миллиарда — с рекламой и товарами, чтобы подбирать более актуальные предложения.

    Даже несмотря на некоторые проблемы с сохранностью данных, система машинного обучения Facebook для персонификации рекламных кампаний остаётся одной из самых мощных в мире.

    Но для грамотного анализа совсем не обязательно обрабатывать такое огромное количество информации. К примеру, в интернет-магазине Amazon персонализация работает так. В рекомендуемом покупателю будут попадаться товары из рубрик, которые он просматривает и покупает чаще всего. Если человек покупает книги, то в рекомендуемом будут книги:

    Довольно простая придумка, но она позволила увеличить продажи в целевых категориях, которыми интересуются посетители, на 15 %. 

    Работает это не только для онлайн-магазинов, но для любых компаний, даже для небольших и довольно узкопрофильных. Многие данные можно узнать, просто попросив покупателя авторизоваться через социальную сеть. Но что ещё интереснее, для персонализации маркетинга даже не всегда нужны личные данные пользователей. 

    Вот, к примеру, как сделал интернет-магазин Very. Для персонализации маркетинга он использует только имя пользователя. Но при этом учитывает погоду за окном и геолокацию пользователя. В результате при попадании на сайт человек получает максимально личностное предложение.

    Это работает не только на продажи, но и на повышение лояльности клиентов. И интеграция с любым погодным сервисом — одна из самых простых, но эффективных идей для машинного обучения. 

    Для создания системы анализа, как у Facebook, нужны огромный отдел ML и колоссальные производственные мощности. Реализовать идею, как у Amazon, тоже сложно, но систему, как у Very, может запустить даже middle-спец в одиночку. Все зависит от творческого подхода и грамотной реализации.

    Анализ рынка и поиск новых направлений 

    Сразу после появления нейронных сетей их пытались использовать для анализа фондовых рынков. Успехи были довольно слабыми, потому что на фондовые биржи влияют сотни и тысячи параметров, а очень часто даже случайные события. 

    Но чем уже сфера анализа, тем лучшие результаты показывает машинное обучение. Причём для небольших компаний она работает даже лучше, чем для крупных концернов — спрогнозировать поведение рынка получается точнее. 

    К примеру, небольшой кейс компании, которая занимается продажей кухонных блендеров в США. Путём машинного анализа специалисты нашли 34 категории товаров, которые клиенты охотно приобретали вместе с блендерами, тем самым увеличивая средний чек покупки в среднем на 15–25 %. Такой кейс можно повторить на фрилансе для разных интернет-магазинов, число которых в пандемию только выросло.

    Улучшение опыта покупателя

    Каждый из клиентов интернет-магазина ищет что-то своё. И у каждого из них — индивидуальный путь от интереса до покупки. Грамотно проанализировать их могут только алгоритмы машинного обучения. Ведь даже полноценный путь одного покупателя вручную построить крайне сложно, а что, если их десятки тысяч? 

    Очень крутой кейс на эту тему есть у Spotify, известного музыкального сервиса. В 2017 году компания приобрела два проекта по машинному обучению и стала тестировать их наработки в создании подборок музыки для пользователей.

    Сервис анализировал музыку, которую сохраняют пользователи в собственные подборки, и предлагал рекомендации, основанные на этих предпочтениях. 30 песен каждую неделю. И оказалось, что сервис выдаёт рекомендации, которые лайкают абсолютное большинство слушателей. 

    Дата-инженеры создали довольно сложную модель анализа контекста и стилей песен и сопоставления их с предпочтениями каждого слушателя. 

    Она выглядит следующим образом:

    И этот шаг стал просто двойным выигрышем для компании. Лояльность слушателей ещё больше увеличилась, сервис привлёк большое количество новых пользователей. При этом значительно увеличилось количество прослушиваний песен малоизвестных музыкальных групп и исполнителей без лейблов, что очень сильно мотивирует музыкантов загружать свою музыку на Spotify. Так один алгоритм, созданный специалистами по машинному обучению, решил сразу две задачи. 

    Да, чтобы довести его до ума, потребовались месяцы работы двух команд по машинному обучению, но дивидендов от него сервис получил гораздо больше. 

    Но есть и более простые примеры — обычные чат-боты или голосовые помощники на основе машинного обучения. Bank of America — это одна из первых крупных финансовых организаций, которая запустила бота, чтобы разгрузить собственный колл-центр. 

    В результате уже в первые 3 месяца бот Эрика успешно обработал миллион заявок от пользователей. Сегодня бот стал полноценным финансовым помощником и на данный момент обработал уже 100 миллионов запросов, тем самым сэкономив компании более 8 миллионов человеко-часов. А это десятки миллионов долларов в денежном эквиваленте.

    Открытые платформы аналитики и статистики

    Большие данные сегодня называют «новой нефтью». Информации сегодня настолько много, что даже в открытых источниках можно найти невообразимое количество. Даже на основе публичных данных Интернета вещей или социальных медиа можно делать качественные анализы и прогнозы.

    При этом структурированные данные и статистика пользуются большим спросом у компаний, которые занимаются торговлей товарами и услугами. Особенно у представителей малого и среднего бизнеса, которым бюджет не позволяет нанять собственных специалистов по анализу данных, но которые понимают ценность аналитики для своего бизнеса.

    Самым крупным открытым порталом структурированных данных в мире можно считать сайт Statista. На нём есть свыше 60 000 пулов данных, уже готовых для применения в статистике и аналитике. 

    Переплюнуть Статисту вряд ли удастся, но никто не мешает создавать обработанные пулы информации в более узконаправленных сферах. Особенно активно такие данные используют маркетологи.

    Защита от мошенничества

    В 2020 и 2021 годах произошёл просто бум популярности антифрод-инструментов, основанных на базе машинного обучения и нейросетей. Особенно это актуально для банков и крупных финансовых организаций, которые работают с большими активами. 

    К примеру, в 2020 году Сбербанк отчитался, что антифрод-система на базе машинного обучения способна предотвращать практически все попытки мошенничества и кражи средств в системе быстрых платежей. А это почти за год сохранило клиентам банка свыше 38 млрд. рублей. 

    Алгоритмы антифрод-систем непрерывно анализируют действия пользователей и выискивают подозрительные паттерны и совпадения, которые выбиваются из общей практики. И при обнаружении подобных подозрительных совпадений автоматически блокируют транзакции и сообщают об этом операторам.

    Модели машинного обучения, которые выискивают мошеннические схемы, очень сложны, но они экономят просто кучу денег крупным компаниям. Поэтому спрос на них стабильно повышается. Если в 2019 году машинное обучение против мошенников использовали только 13 % крупных компаний в мире, то в 2021 году — уже 40 %.

    Компания Feedzai отчитывается, что в 2020 году в разы выросли попытки фрода в сферах финтех и е-коммерс. Попытки похищения данных платежных карт увеличились на 650 %, а взлома онлайн-банкинга — на 250 %. Но при этом грамотная антифрод-система на базе машинного обучения способна в точности определять до 95 % случаев мошенничества и ложных отклонений оплаты и при этом сократить общие затраты на противодействие подобным схемам на 75 %.

    Машинное обучение растёт такими огромными темпами в наши дни, потому что оно помогает зарабатывать деньги как компаниям, так и самим специалистам по ML. Компании активно нанимают спецов, а иногда покупают целые стартапы в области ML — тогда они входят в состав крупных компаний в качестве отдельных подразделений. Сейчас, пока рынок ещё не перегрет и компании более склонны уступать в переговорах о зарплате — самое время влиться в эту среду и стать специалистом по машинному обучению, используя кейсы представленные выше в качестве своих пилотных проектов, которые покажут уровень ваших навыков.

    По ML у нас есть две программы — для тех кто только постигает Machine Learning и расширенная Machine Learning и Deep Learning, для тех кто хочет уйти в это направление всерьез и надолго. По ссылкам можно ознакомиться с программами, сравнить их с другими и сделать оптимальный для себя выбор.

    Узнайте, как прокачаться и в других специальностях или освоить их с нуля:

    Другие профессии и курсы
    SkillFactory
    Школа Computer Science. Скидка 10% по коду HABR

    Комментарии 11

      0
      Воу, 2 просмотра и 3 плюса спустя несколько секунд после публикации у поста борца за чистоту Хабра. Администрация Хабра не против таких махинаций, товарищ борец?

      image
        –4
        Любезный, вы меня преследуете теперь? Обновите страницу то.
          –1
          Ну сейчас-то просмотров поболе. Но 3 плюса появилось сразу же после публикации, обновления здесь ни при чем.

          Не преследую, просто интересно, насколько корректно ведут себя борцуны подобного рода. Похоже, не очень корректно.

          P.S. Понаставили еще чуток плюсов, отлично )
            0
            Ну почему же не преследуете, вы отметились именно под этим постом. Причем сразу же, как в засаде сидели. :-)
              –1
              Не переводите тему. Вы публикуете копипаст и мошенничаете с плюсами. Топите Хабр, одним словом, против чего якобы боретесь. Отвратительно.
                0
                По поводу «копипаста» я вам уже отвечал что это был перевод, вы остались глухи к аргументам, упрямо настаивая на своем. Даже другие люди вам говорили, что вы не правы, вам было все равно. Теперь вот еще. Причем прицепились именно ко мне. Устроили «охоту на ведьм» тоже мне.
                  +1
                  А в чем собственно проблема, если вам нечего скрывать, то подтвердите, что к плюсам не имеете абсолютно никакого отношения.
              0

              Я поставил плюс. Один мой плюс равен трем. Успокойтесь

                –1
                О, вы и в прошлом посте, с копипастом, объявлялись, защищая этого «борца». Совпадение? Риторический вопрос. Уже два борца, связанных друг с другом. Палитесь, ребят.
            +3
            Чистота Хабра появится тогда, когда здесь полностью уберут систему ранжирования толпой. И посадят модераторов чистить откровенное г, оскорбления, ругань и рекламу.
            +1

            Спасибо за статью о монетизации с конкретными прототипами.

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

            Самое читаемое