Data Scienсe на стероидах: знакомство с Decision Intelligence

Автор оригинала: Cassie Kozyrkov
  • Перевод
Что общего между защитным поведением при встрече со львами в саванне, ответственным подходом к управлению ИИ и проблемами проектирования хранилищ данных.

image

Decision intelligence — новая научная дисциплина, рассматривающая все аспекты теории принятия решения. Она объединяет лучшее из прикладного направления data science, социальных наук и науки управления в единую область, призванную помочь людям повысить качество жизни, усовершенствовать бизнес и улучшить окружающий мир, используя данные. Это важнейшая наука эры искусственного интеллекта, включающая в себя навыки грамотного управления проектами, стратегического планирования целей, определение оптимальной метрики и систем безопасности для широкомасштабной автоматизации.

Decision intelligence — дисциплина, позволяющая превратить информацию в лучшее практическое действие любого масштаба.

Давайте немного разберемся с основной терминологией и концепциями. Следующие абзацы можно просмотреть бегло (или совсем пропустить, если информация покажется вам чересчур занудной).

Что значит «decision» (решение)


Данные прекрасны, но важны именно решения. Именно наши решения — наши действия — влияют на мир, окружающий нас.

Под «decision» мы понимаем любой выбор между вариантами любого субъекта, так что разговор куда обширнее, нежели типичная дилемма в духе MBA (вроде: открывать филиал своего бизнеса в Лондоне или пока не стоит).

Именно наши решения — наши действия — влияют на мир, окружающий нас.

Исходя из этой формулировки, присвоение фотографии пользователя ярлыка со значением, к примеру, кошка или не-кошка, — это решение, которое выполняет компьютерная система. Но решение запускать ли эту систему, обдумывает и принимает руководитель-человек (я надеюсь!), ответственный за проект.

Кто такой decision-maker (лицо, принимающее решение)


В нашем понимании, «decision-maker» — это не заинтересованное лицо или инвестор, который вмешивается в процесс, чтобы наложить вето на деятельность проектной команды, а человек, ответственный за архитектуру решений и формирование контекста. Другими словами, это создатель тщательно сформулированных целей, а не их разрушитель.

Что значит decision-making (принятие решений)


Decision-making — словосочетание, которое разные дисциплины используют по-разному. И означать оно может:

  • принятие мер при наличии альтернативных вариантов (в этом смысле принимать решение может как компьютер, так и ящерица);
  • выполнение обязанности (человека) по принятию решений, и несение за них ответственности. Даже если компьютерная система может принимать решение, она не может быть названа «лицом, принимающим решения». Система не несет ответственности за полученные результаты — эта ответственность всецело ложится на плечи людей, которые ее создали.


Делать расчеты vs. принимать решения


Не все мероприятия/предложения являются решениями. Согласно терминологии анализа решений, решение принимается лишь раз, и полученные изменения нельзя откатить назад. Если можно вернуть изменения без лишних затрат, значит решение еще не было принято.

Систематика decision intelligence


Один из способов приблизиться к изучению decision intelligence — разбить её по традиционным направлениям на количественные аспекты (в основном пересекающиеся с прикладной data science) и качественные (разрабатываемые преимущественно исследователями в области социальных и управленческих наук).

Качественная сторона: наука о принятии решений


Дисциплины, попадающие в группу качественных аспектов, традиционно называются науками о принятии решений — хотела бы я, чтобы все целиком так и называлось (увы, мы не всегда имеем, что хотим).

Наука о принятии решений занимается такими вопросами, как:

  • «Как правильно настроить критерии принятия решений и рассчитать метрики?» (Все дисциплины)
  • «Является ли выбранный вами параметр мотивационно совместимым? (Экономика)
  • »Решения какого качества вы должны принимать, и сколько вы должны отдать за точную информацию?" (Анализ решений)
  • «Как эмоции, эвристика и предубеждения влияют на принятие решений?» (Психология)
  • «Как биологические факторы, к примеру, уровень кортизола, могут сказаться на принятии решений?» (Нейроэкономика)
  • «Как изменения в представлении информации влияют на принимаемые решения?» (Поведенческая экономика)
  • «Как вы осуществляете оптимизацию своих результатов при принятии решений в контексте группы?» (Экспериментальная теория игр)
  • «Как сбалансировать многочисленные ограничения и многоступенчатые цели при разработке контекста решения?» (Проектирование)
  • «Кого коснутся последствия решения, и как различные группы воспримут этот опыт?» (Исследования опыта взаимодействия)
  • «Является ли это решение объективным и этичным?» (Философия)


Это лишь малая часть…говорить еще можно о многом! И конечно это еще не полный список задействованных дисциплин. Рассмотрите науку о принятии решений с точки зрения того, что настройка параметров решений и обработка информации протекают в не совсем четкой форме хранения (в человеческом мозгу), а не исходя из того, что нечто, называемое данными, аккуратно занесено в почти постоянное хранилище (записано на бумагу или в электронном виде).

Ошибки вашего мозга


В прошлом столетии было модно восхвалять любого, кто сумел сунуть огромный клубок математики в какое-нибудь невинное человеческое предприятие. Количественный подход, конечно, лучше бездумного хаоса, но есть способ сделать все гораздо лучше.

Стратегии, основанные на чисто математической рациональности, относительно наивны и, как правило, недостаточно эффективны.

Стратегии, основанные на чистой математической рациональности без качественного понимания процесса принятия решений и человеческого поведения, выглядят довольно наивно. Более того, как правило, они менее эффективны в сравнении со стратегиями, основанными на объединении количественной и качественной сторон. (Следите за новостями в блогах по истории рациональности в социальных науках, а также за примерами из теории поведенческих игр, где психология превосходит математику.)

Люди — не оптимизаторы, мы — ублажатели. Звучит особенно причудливо для людей, которые ищут легкий путь.


Люди — не оптимизаторы, мы — ублажатели (Satisficing), что звучит причудливо для людей, которые предпочитают легкий путь и довольствуются «хорошим», а не «совершенным». (Это концепция настолько шокировала высокомерие нашего вида — нанесла удар по лицу человека разумного, богоподобного и безупречного — что удостоилась Нобелевской премии.)

На самом деле мы, люди, обращаемся к когнитивной эвристики, чтобы сэкономить время и усилия. Часто это бывает полезным; пока мы будем думать над идеальным планом побега от льва в саванне, нас съедят прежде, чем мы вообще успеем приступить к расчетам. Удовлетворенность снижает калорийность жизни, что также хорошо, ведь наш мозг до смешного крайне энергоемкий девайс. Пятая часть энергетических затрат организма уходит именно на него, хоть он и весит всего-то около 1,4 кг. (Спорим, в общей сложности вы точно весите больше 7 кг?)

Некоторые решения срезать углы ведут к предсказуемо не оптимальным результатам.

Теперь мы уже не проводим свои дни, спасаясь бегством ото львов, и часто с удовольствием срезаем углы, что приводит нас к дрянным результатам. Наш мозг еще не до конца, эм, ну что ли оптимизирован для современной среды. Понимание того, как наш вид превращает информацию в действие, позволяет использовать процессы принятия решений для защиты себя от несовершенств собственного мозга (а также от тех, кто намеренно играет на наших инстинктах). Это также помогает создавать инструменты, которые увеличивают производительность и адаптируют вашу среду к вашему же мозгу.

Если думаете, что ИИ выводит человека из уравнения, подумайте еще раз!

К слову, если вы вдруг подумали, что искусственный интеллект выводит человека из уравнения, подумайте еще раз! Все технологии являются отражением своих создателей, а все полномасштабные системы могут усиливать человеческие недостатки, что является одной из причин, почему развитие навыков принятия решений так необходимо для ответственного управления ИИ.

Возможно, вы не принимаете решение


Иногда тщательное обдумывание критериев принятия решения приводит к осознанию того, что нет такого факта в мире, который смог бы изменить ваше мнение — вы уже решили, как будете действовать и теперь просто ищете оправдание. Это полезное осознание — оно предотвращает потерю времени и помогает справиться с эмоциональным дискомфортом, пока вы делаете то, что и собирались, невзирая на проклятые данные.

«Он использует статистику, как пьяный человек использует фонарные столбы… для поддержки собственного равновесия, а не для освещения дороги.»
— Эндрю Лэнг


Не получится добиться решения, если не реагировать и не предпринимать ответные действия на различные, временно неизвестные факторы… хотя иногда обучение анализу решений помогает вам увидеть ситуацию более ясно.

Принимать решения на основе точной информации


Теперь представьте, что вы очень тщательно подходите к настройке параметров решения, которые чутко реагируют на факты. Вы просто щелкаете пальцами и получаете фактическую информацию, необходимую для выполнения вашего решения. Зачем вам тогда data science? Не зачем.

Сперва нужно выяснить, как мы хотим реагировать на факты.


Нет лучше состояния, чем уверенность, что вы что-то знаете наверняка (да, я понимаю, что здесь зияет огромная релятивистская кроличья нора, опустим этот момент) — поэтому мы всегда предпочтем принимать решения на основе имеющихся фактов. Вот почему первым делом мы должны решить, как мы будем работать с фактами. Какой из ниже перечисленных вариантов вы бы выбрали для работы с информацией?

image

Что можно сделать с фактами


  • Можно использовать факты для принятия единственно важного предварительного решения. Если перед вами стоит серьезный выбор, скорее всего вам придется опираться на качественную сторону вещей, чтобы мудро сформулировать решение. Психологи знают, что если попасть в засаду из-за неожиданно открывшейся информации, то придется так вертеться, как совсем того не хотелось бы. Поэтому психологи (и не только) многое могут рассказать о том, как подойти к выбору информации, которой вы собираетесь оперировать заранее.
  • Используя факты, можно прийти к особому типу заранее сформированных решений — действенным или, по-другому, причинно-обусловленным. Если ваше решение должно быть обусловлено тем, что «надо что-то сделать, чтобы что-то произошло», то, соответственно, вы работаете с фактами, отражающими причинно-следственные связи, и принимаете решение. В данном случае факты о последствиях бесполезны (например, «люди выздоравливают»), если нет фактов о причине (например, «благодаря антибиотикам»). Чтобы получить информацию о причинах и следствиях, можно провести контролируемый эксперимент. С другой стороны, эксперимент не нужен, если вы принимаете решение об исполнении чего-либо как ответную реакцию на некий не-причинный факт («когда на счету у меня будет хотя бы x сумма, то я побалую себя новыми туфлями»).
  • Можно использовать факты, чтобы укрепиться во мнении («Я думаю, что погода солнечная» превращается в «Я знаю, что погода солнечная»).
  • Можно использовать факты, чтобы принять единственно важное решение, обусловленное реальным существованием. Решение на основе реально существующих факторов («Я сейчас узнал, что рядом зафиксирован случай заражения вирусом Эбола, поэтому я немедленно сваливаю отсюда...») — это решения, принятые в условиях возникновения ранее неизвестных переменных, которые так сильно подрывают фундамент ваших суждений, что задним числом вы понимаете: контекст для обдумывания решения был сформулирован некорректно.
  • Можно использовать факты, чтобы автоматизировать процесс принятия большого количества решений. В традиционном программировании человек прописывает серию команд для преобразования вводимых данных в соответствующие действия, возможно, используя что-то вроде поисковой таблицы.
  • Можно использовать факты, чтобы определить, какими будут решения по автоматизации. Зная факты о системе, можно написать код на их основе. Так подходить к традиционному программированию гораздо лучше, нежели сидеть и напряженно придумывать структуру решения, не имея какой-либо информации. Например, если вы не знаете, как перевести градус Цельсия в градус Фаренгейта, вы можете, используя набор данных, выполнить поиск по записям градусов Фаренгейта, которые идут вместе с градусами Цельсия… но если проанализировать саму таблицу поиска, вы обнаружите формулу, которая их связывает. Тогда вы сможете просто закодировать эту формулу («модель»), чтобы избавиться от нежелательной работы и забыть про дурацкую таблицу.
  • Можно использовать факты, чтобы сгенерировать оптимальное решение проблемы автоматизации, которая может быть полностью разрешена. Это традиционная оптимизация. Вы найдете много примеров в области исследования операций, которая кроме всего прочего занимается вопросом: как устранять препятствия, чтобы добиться идеального результата, например, наилучшего порядка выполнения ряда задач.
  • Можно использовать факты, чтобы обдумать возможный подход к принятию будущих важных решений. Это часть аналитики, которая также относится к разделу частичной информации. Запомните эту мысль! (еще пригодится)
  • Вы можете использовать факты, чтобы подвести итоги того, с чем имеете дело. Это поможет вам понять, какие виды входных данных вы можете использовать для принятия решений в будущем и разработать способы более эффективной работы с информацией. Если вы только что унаследовали большое, темное хранилище (данных), наполненное непонятными компонентами, вы не будете знать, что внутри, пока кто-то туда не заглянет. К счастью, у вашего аналитика есть фонарик и ролики.
  • Можно небрежно использовать факты, чтобы принимать решения вне контекста. Это эффективно, когда нет высоких ставок и не требуется излишних усилий или осторожности, например: «что я буду сегодня на обед?» Стремление все время строго подходить к планированию решений дает неоптимальные долгосрочные / пожизненные результаты и попадает в категорию бессмысленного перфекционизма. Приберегите усилия для действительно ответственных ситуаций, но, пожалуйста, помните, что даже если эффективно использовать некачественный подход с малой затратой усилий, оптимальный подход к принятию решений все равно получится низкого качества. Вы не должны бить себя в грудь или быть слишком самоуверенными, если это ваш метод… Если вы срезаете углы, то вы скорее всего идете по тонкому льду. Бывают ситуации, когда и шаткие доказательства вдруг прокатывают, но это не значит, что ваше умозаключение надежно. Не надейтесь на него. Если хотите принимать качественные решения, вам нужно придерживаться более строгого подхода.


Обучаясь науке принятия решений, вы научитесь экономить усилия, необходимые для принятия строгих решений, основанных на фактах. Это позволит в течение того же объема работы принимать более качественные решения по любому предмету. Ценный навык, но чтобы его отшлифовать, придется проявить усердие. Например, у студентов, изучающих поведенческую экономику, формируется привычка устанавливать критерии принятия решений заранее, до получения информации. Те из нас, кому пришлось несладко из-за достаточно требовательных программ обучения науке принятия решений, не могут не задаться вопросом, к примеру, сколько максимально мы заплатим за билет, ДО того, как узнаем его подлинную стоимость.

Сбор данных и инженерия данных


Будь у нас факты, мы бы уже все сделали. Увы, но мы живем в реальном мире и зачастую вынуждены работать, чтобы заполучить заветную информацию. Инженерия данных — это сложная дисциплина, ориентированная на обеспечение надежного доступа к информации в широких масштабах. Подобно тому, как легко выйти в магазин за мороженным, легко и обработать данные, если вся доступная релевантная информация есть в электронной таблице.

Ситуация осложняется, когда вам нужно доставить 2 миллиона тонн мороженого… в такое место, где оно точно не растает! Все становится еще сложнее, если вам требуется спроектировать и построить огромный склад, а затем еще заняться его обслуживаем. И вы даже не знаете, что в будущем вас попросят в нем хранить — может пару тонн рыбы, а может и плутоний… ну, удачи вам!

Сложно соорудить склад, когда вы знать не знаете, о чем вас попросят на следующей неделе — может, передержать несколько тонн рыбы, а может и плутония… ну, удачи вам!


Хотя инженерия данных и является родственной наукой и основным компонентом decision intelligence, наука о принятии решений охватывает опыт и специальные знания, связанные с консультированием при разработке проекта и сборе фактов.

Количественная сторона: Data science


Когда вы сформулировали свое решение и занялись поиском необходимых фактов, заручившись поддержкой поисковой системы или аналитика (исполняющего для вас роль человеческой системы поиска), все, что от вас теперь требуется — привести свое решение в действие. И готово! Никакой мудреной data science и не нужно.

Что, если, после всей этой работы, беготни и технического джиу-джитсу полученные факты в итоге оказались не теми идеальными фактами, которые так необходимы для решения? Что, если это неполноценные факты? Что, если вам нужны завтрашние факты, но имеете вы только вчерашние. (Так бесит, когда не можешь вспомнить будущее.) Возможно вы хотите знать, что потенциальные клиенты думают о вашем продукте, но опросить вы можете лишь сто человек. Вы столкнулись с неопределенностью! То, что вы знаете — совсем не то, что хотелось бы знать. Пустите в дело data science!

Data science приобретает интерес, когда вы совершаете скачки и выходите за пределы data… но будьте осторожны, чтобы не упасть подобно Икару!

Разумеется, ваш подход меняется, раз вы располагаете не теми фактами, что надо. Может быть, в ваших руках кусочек пазла от большой мозаики (как в примере с выборкой из большого числа потребителей). А может, ваш пазл неправилен, но, во всяком случае, лучший из имеющихся (как с использованием прошлого для предсказание будущего). Data science приобретает интерес, когда вы совершаете скачки и выходите за пределы data… но будьте осторожны, чтобы не шлепнуться подобно Икару!

  • Можно брать неполные факты и, делая некоторые допущения, принимать единственно важное предварительное решение со статистическим выводом, чтобы понимать, потребуется ли менять алгоритм действий или нет. Это частотная (классическая) статистика. Если вы принимаете действенное решение (сформулированное с точки зрения того, чтобы что-то произошло, например, «вам бы хотелось изменить цвет логотипа на оранжевый, но только если это изменение привлечет больше посетителей на сайт»), то лучше использовать данные рандомизированного контролируемого эксперимента. Если вы принимаете решение об исполнении (например, «вы бы хотели изменить цвет логотипа на оранжевый, но только в том случае, если по крайней мере 25% пользователей сайта считают оранжевый своим любимым цветом»), то достаточно будет провести опрос или исследование методом наблюдения.
  • Можно использовать неполные факты как обоснование, чтобы поменять мнение ввиду новых обстоятельств (но все равно ваши суждения будут неполноценными и субъективными). Это байесовская статистика. Если мнение основывается на причинно-следственных связях, то лучше тогда брать данные контролируемого рандомизированного эксперимента.
  • Может так оказаться, что ваши неполные факты содержат информацию о реально происходящих событиях, что означает, что вы можете использовать их задним числом для принятия решений на основе реально существующих факторов (см. выше)
  • Можно использовать факты, чтобы автоматизировать процесс принятия большого количества решений. Это традиционное программирование, использующее что-то вроде поисковой таблицы, где вы конвертируете что-то, чего раньше не знали, в самое близкое, что у вас есть, а затем продолжаете как обычно. (Это то, что алгоритм k-NN делает в двух словах… но обычно все работает лучше, когда за двумя словами стоит куда более сложный механизм.)
  • Можно использовать неполные факты, чтобы обдумать, в каком направлении принимать решения по автоматизации. Зная неполные факты о системе и основываясь на них, вы все еще можете кодить. Здесь работает аналитика.
  • Можно использовать неполные факты, чтобы сгенерировать решение проблемы автоматизации, которая не имеет полного решения. Так что вам не придется придумывать решатель самостоятельно. Этим займется машинное обучение и ИИ.
  • Вы можете использовать факты, чтобы проанализировать, с чем вы имеете дело (см. выше) и ускорить работу над решением проблемы автоматизации, используя углубленный анализ данных, например, путем поиска новых способов объединения информации для создания полезных входных данных для модели (если использовать терминологию, то имеется в виду «конструирование признаков»), или путем поиска новых методов для использования в проекте ИИ.
  • Можно небрежно использовать неполные факты, чтобы принимать решения вне контекста, но имейте ввиду, что качество будет еще ниже, чем при некорректном использовании фактов, потому что то, что вы действительно знаете, находится в шаге от того, что вы хотели бы знать.

Для всех перечисленных вариантов есть способы интегрировать полезные элементы из множества ранее разрозненных дисциплин, чтобы сформировать более эффективный подход к принятию решений. Вот о чем decision intelligence! Она объединяет различные точки зрения на принятие решений, которые вместе приносят на большую пользу, дает им новый голос, свободный от традиционных ограничений в их родных областях изучения.

image

Вспомним аналогию между кухней и ИИ. Если исследовательский ИИ создает микроволны, а прикладной ИИ их использует, то decision intelligence использует микроволны безопасно, чтобы выполнить вашу задачу, а в случае, когда вам не требуется микроволновая печь, воспользуется чем-нибудь другим. Цель (задача) всегда будет отправной точкой для decision intelligence.

image

Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя платные онлайн-курсы SkillFactory:



Читать еще


SkillFactory
Онлайн-школа по программированию

Комментарии 0

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое