Что я узнал о машинном обучении, поработав в 12 стартапах

Автор оригинала: Daniel Shenfeld
  • Перевод
Всем привет.

Поработав в 12 стартапах в сфере машинного обучения, я сделал восемь полезных выводов о продуктах, данных и людях.

Все стартапы были из разных сфер (финтех, биотехнологии, здравоохранение, технологии обучения) и на разных этапах: и на этапе pre-seed, и на этапе приобретения крупной компанией. Менялась и моя роль. Я был стратегическим консультантом, главой отдела анализа данных, заваленный делами штатным сотрудником. Все эти компании старались создать хороший продукт, и многим это удалось.

За время работы я пришел к таким выводам:

Продукт важнее ИИ


Эти стартапы разрабатывают продукты, а не изучают искусственный интеллект. Меня, как убежденного математика, сначала больше интересовало машинное обучение и создание новых методов и алгоритмов.

Вскоре я понял, что даже точные модели машинного обучения не ценны сами по себе. Ценность ИИ и машинного обучения напрямую зависит от ценности продукта, в котором они используются. Цель стартапа – научиться создавать продукты, основанные на машинном обучении.

При таком подходе иногда выясняется, что машинное обучение – не самый эффективный инструмент. Иногда дело не в поставленной задаче, а в процессе решения. Даже в таких ситуациях полезно обратиться к ученым: они используют научный, основанный на данных подход. Тем не менее, не тратьте время на ИИ там, где нужно исправить процесс.

Стремитесь к синергии между данными и продуктом


Нельзя создать что-то ценное, добавив к уже существующему продукту прогнозы, основанные на модели машинного обучения. Сильный ИИ – это не дополнение продукта, это основа. В таких случаях именно ИИ создает ценность. Такие продукты разрабатываются с учетом этого факта: в них и продукт, и данные работают в синергии.

При хорошем исполнении получается взаимодействие, которое я называю «сочетанием продукта и данных». Продукт полностью реализует потенциал данных и одновременно с этим генерирует новые данные, необходимые для улучшения.

При работе над ИИ нужны не только инженеры и работающие с данными ученые. Работа над ценностью продукта идет быстрее, если в обсуждении участвуют и остальные члены команды, от продуктовых менеджеров до руководителей. Это требует такого уровня знаний и вовлеченности, к которому даже работающие в стартапах инженеры еще не привыкли.

Сначала данные, потом ИИ


Для ИИ и машинного обучения нужно много высококачественных данных. Создавая продукт с нуля, с первого дня думайте о сборе данных. Перед внедрением технологии искусственного интеллекта в уже существующий продукт, готовьтесь много инвестировать в инженерию данных и изменение архитектуры.

Сначала узнайте ценность продукта, и только потом приступайте к работе. Чем лучше обработка данных, тем информативнее аналитика – это критически важно для развития компании. Так вы продемонстрируете ценность продукта и привлечете инвесторов. Приступайте к размышлениям о машинном интеллекте, когда аналитика будет надежной.

Инвестируйте в коммуникацию


Чтобы создать продукт, нужны квалифицированные продуктовые менеджеры и поддержка руководства. Сильный ИИ и глубинное обучение интересуют многих, но люди, далекие от IT-индустрии, не разбираются в этих технологиях. Чтобы обсуждать машинное обучение и ИИ, нужно разбираться в статистике: неэффективная коммуникация ведет к нереалистичным ожиданиям.

Менеджер по продукту и работающие с данными инженеры должны постоянно обсуждать бизнес-метрики и их преобразование в продукт. Особенно это важно для инженеров: для эффективной работы им нужно углублять знания и в своей области, и в сфере бизнеса.

«Простые и очевидные решения» не так очевидны


Как я упоминал выше, часто поставленную задачу проще решить с помощью простых и очевидных способов. Так происходит отчасти потому, что сегодняшние «простые и очевидные» решения еще вчера были сложными и оригинальными. Сейчас использовать word2vec так же просто, как регрессию. С каждым днем появляется больше новых инструментов, и понимание этих инструментов важно для специалиста по анализу данных.

Появление новых инструментов с открытым исходным кодом привело к тому, что теперь проприетарные платформы в машинном обучении – не эффективное решение. Конечно, стоит использовать проприетарные алгоритмы, если они эффективны в вашей отрасли и для решения вашей проблемы. Но давайте оставим исследования глубинного обучения сотрудникам Google – сосредоточимся на бизнес-задачах.

Если сомневаетесь, покажите данные пользователям


На раннем этапе важно наладить обратную связь с рынком. Однако машинное обучение требует данных, на сбор которых уходит много времени. В этом и состоит проблема: как проанализировать картину без больших объемов данных?

Чаще всего, лучшее решение – это показать накопленные данные пользователям. Не важно, что у вас мало данных: люди обрабатывают только небольшие объемы данных за раз. Посмотрите, как пользователи взаимодействуют с данными: что они игнорируют, а в чем хотят разобраться подробнее? Так вы поймете, насколько потенциально ценны ваши данные для бизнеса.

Выстраивайте доверие


Доверие – основа успеха большинства технологий: люди хотят доверять технологиям, которые используют. Одни люди беспокоятся, что автоматизация лишит их работы, другие полагаются на технологии, принимая важные решения. В обоих случаях важно доверие к приложениям и алгоритмам машинного обучения.

Если искусственный интеллект не помогает человеку принимать решения, а решает вместо него, пользователи быстро теряют доверие к приложению.

Доверие легко потерять и крайне сложно вернуть. Создавайте продукты, которым люди будут доверять.

Делитесь статьёй с коллегами, делайте выводы и работайте продуктивно. Если у вас есть, чем вы можете поделиться — пишите в комментариях. Больше информации о машинном обучении в телеграм-канале Нейрон (@neurondata).

Всем знаний!
  • +17
  • 13,7k
  • 5
Поддержать автора
Поделиться публикацией

Комментарии 5

    +1
    Ммм… два вопроса:
    я сделал восемь полезных выводов
    1) Где восьмой?

    2) «Стремитесь… Инвестируйте… покажите… Выстраивайте...» — это выводы или лозунги?
      +1
      ИИ-Стартап ии-стартапу рознь. Есть более продукториентированные, есть расчитанные больше на технологию. Я проработал несколько лет в продуктовом стартапе — ничего хорошего. Больше никогда не пойду в стартап, где продукт это главная ценность.
        +1
        Тем не менее, это не отменяет того факта, что стартап должен решать какую-то конкретно сформулированную проблему. Попробуйте сформулировать проблему так, чтобы в формулировке не содержалось даже намека на решение, а потом посмотрите является ли ваше решение наилучшим вариантом — если нет, то, возможно, стоит поискать опции получше.
        0
        А у меня с Data Science первое знакомство очень печальным было. Первые живые дата-саентисты оказались мягко говоря какими-то злыми и гадкими. Я тогда работал в одной фирме, и там был целый отдел Data Science. Так они почему-то были на очень хорошем счету у руководства, хотя в реальности с ними даже поговорить было невозможно. Люди были настолько токсичны, что постоянно оскорбляли по поводу и без. При этом бухали прямо в офисе. А от осознания факта, что они Data Science вообще остальных за людей не считали. Я, конечно, понимаю, что все люди разные, и я очень надеюсь, что мне просто не повезло, но осадок до сих пор остался. С людьми было невозможно вообще ни о чём поговорить, ни о математике, ни о статистике, ни о движках, ни о программировании, ни об истории, ни об экономике, ни о литературе, ни о фильмах, ни об алгоритмах. К ним даже подходить было страшно… Как вспомню, так аж сейчас передёргивает.
          0
          «Нельзя создать что-то ценное, добавив к уже существующему продукту прогнозы, основанные на модели машинного обучения» — можно.
          Скоринг в банках, антифрод, предсказание потребления товаров а-ля «у нас 1000 киосков-автоматов с соками и едой, нам нужно знать, что и где покупают, чтоб увеличить прибыли и снизить издержки по еде» занимаются именно этим.

          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

          Самое читаемое