Оптимальное распределение ресурсов - это не идеология, а экономическая эффективность: как достичь максимума ценности при ограниченных ресурсах.
И рынок, и плановая система сталкиваются с этой задачей. Капитализм не отменяет вопрос «куда направить ресурсы?» - он просто пытается решить его через цены, спрос и конкуренцию.
Но наличие прибыли ≠ оптимальность. Прибыль может быть от монополии, субсидий или временного ажиотажа - при этом ресурсы расходуются неэффективно.
Продажи - это сигнал, а не самоцель. Если продукт не продаётся - значит, распределение (в том числе в производстве, ценообразовании, логистике, маркетинге) было неоптимальным.
Вопрос «как лучше распределить?» стоит перед любой экономической системой и в конечном счете, тот кто будет отвечать на этот вопрос откроет книгу по математическому моделированию и математическому программированию.
Вы наверное решили, что моя цель состоит в том что бы переубедить вас, но своей цели я достиг написав два предыдущих ответа :)
В Байесовском выводе есть хороший пример про оракула и мнение. Допустим к вам в руки попал предмет, который может выдавать верные ответы в форме да/нет на любой ваш вопрос. Сколько таких ответов вам потребуется, что бы вы поверили в то, что перед вами действительно магический предмет? 3? 5? 10? 100?
Если априорные убеждения другой стороны слишком сильны, то все доводы и аргументы будут работать против того, кто пытается повлиять на мнение этой стороны. Байесовская статистика прямым текстом говорит, что в этом случае надо перестать метать бисер и переходить к... а вот к чему надо переходить я искренне надеюсь вы сможете сами узнать :)
Решение задачи трех тел есть - просто оно численное. Можно ли полагаться на это решение в долгосроке - нет. Но даже в этом случае для тел можно вывести вероятностные распределения для их местоположений. Стохастическое программирование применяется в астродинамике как раз по той причине, которую вы обозначили - тел сотни.
Математика часто неприменима не потому, что есть какая-то недосягаемая магия, которую невозможно формализовать. Просто иногда для получения решений недостаточно ресурсов (времени, денег, железа, мозгов). В крупных компаниях проблема оптимизации стоит не так остро, как в среднем и малом бизнесе.
Зачем так много слов? Поймите, то что вы можете принимать решения без математики вовсе не значит, что она ненужна. В определенных ситуациях, например когда речь идет о человеческом благополучии и безопасности или о миллиардах у.е., такой подход опасен. Я просто пытаюсь обозначить свою точку зрения - если есть возможность заморочиться, то лучше заморочиться. Хуже от этого точно не станет.
В конце концов, математика - это еще и культура. Например, вы являетесь байесовистом, но вы вряд ли это хорошо осознаете и скорее всего только поверхностно понимаете потенциал этой парадигмы, которой постоянно пользуетесь. Иначе ваше мнение не было бы таким категоричным.
В моем понимании - математическая оптимизация это синоним "здравого смысла". Это необязательно формулы. Например, переговоры, во многом они построены на теории игр, которую сложно применить в реальных условиях. Но на реальных переговорах, чаще всего видно, знакома ли другая сторона с математической подоплекой этого процесса или нет.
Ошибки, - если из них сделаны должные выводы, то да, это опыт. Но проблема в том, что иногда эти выводы находятся за пределами наших компетенций. Ситуация, когда мы не знаем чего не знаем (или думаем, что думаем), апеллирует к праву на сомнение. А имеет ли руководитель право сомневаться? Ответ зависит от того как вы воспринимаете сам архетип руководителя. Но научный подход к решению проблем существует независимо от этого восприятия - если мы оказались за пределами компетенций, то это значит что мы уже находимся в условиях неполной информации, что в свою очередь является неопределенностью. В условиях неопределенности все, что мы можем - это выдвигать гипотезы и на их основе подсчитывать шансы на успех от разных решений. Можно ли их подсчитать?
Мнение о том, что математика бесполезна при решении задач управления очень распространено, но оно во многом основано на непонимании того, как происходит математическая формализация (перевод словесной задачи в формулы). Но тут практически нечего изобретать, особенно в IT. Например:
формирование команд - это многокритериальная задача ILP;
назначение команд на проекты (фичи) - это задача о назначениях;
выбор проектов (фич для реализации) - это задача о формировании оптимального портфеля проектов;
планирование работ - это графы и Байесовские сети (PERT, CPM и т.д.).
Еще одна причина мнения о бесполезности математики заключается в уверенности в том, что даже при наличии формальных моделей получить адекватные оценки для их параметров невозможно - это тоже заблуждение. Существует масса способов формирования и обработки экспертных оценок:
интервальные оценки от нескольких экспертов и их объединение;
метод фишек;
метод Дельфи;
метод сценариев;
Байесовское обновление.
Все это способы сформировать те самые распределения вероятностей, на которые можно полагаться.
Повторюсь еще раз - решение есть всегда. Проблема в его стоимости.
Ну, скажем так, у читателей Хабра не только айтишный бизнес, тут кого (чего) только нет. Если руководитель бизнеса окружает себя людьми, которые не имеют своего мнения и экспертизы, то да Монте-Карло срабатывает за наносекунды.
Проблема не в том, что нет решения - оно есть всегда. Проблема в его стоимости. Яндекс, Гугл, NASA, CERN - думаете они распределяют ресурсы гоняя Монте-Карло в голове?
Смысл в том, что если руководитель может умножить сроки на 3 и поделить количество хотелок на столько же, то это значит, что есть какое-то представление, как минимум о робастном программировании. И это это круто.
Распределения берутся из данных - их называют эмпирическими. Но даже если нет никаких данных, а "чуйка" что-то подсказывает, то это тоже распределение вероятностей - априорное. В реальном бизнесе, как правило есть либо данные, либо люди с хорошей "чуйкой", на которую можно положиться.
Вопрос хороший. Когда дело касается денег, то глупых вопросов не бывает.
Хотя лично мне больше нравится, что статьи выскакивают в поиске, то есть это не только приятное времяпрепровождение, но еще и польза. А уж если попал из поиска и статья оказалась не только полезной, но еще и интересной, то от этого вдвойне приятнее.
Не хотелось раздувать текст. Сделал ставку на то, что если слова "эвристика" и "муравьи" будут рядом, то в целом должно быть понятно о чем речь. Ну и на ваше любопытство я тоже ставил :)
Что касается эл-эл-эмок, то уже больше года не могу понять какой контент теперь нужен как мне, так и читателям. После долгих раздумий пришел к выводу, что надо что-то вроде контента-путеводителя по темам. Теперь нет никакого смысла в доскональных и академически-строгих разъяснениях чего бы то ни было. Как считаете?
Мне кажется вы не понимаете фундаментальной проблемы в вашем методе ценообразования - у вас нет модели данных. Вы можете что-то оптимизировать только если можете смоделировать данные. То что данных (событий) мало - это не оправдание. Например, космические запуски происходят в десятки тысяч раз реже чем продаются квартиры, но при этом стоимость страховки для каждого запуска является оптимальной. Вам не кажется это странным?
Но на самом деле, для ваших аргументов все еще хуже, просто потому что есть RMS которые определяют лучшую цену для всего лишь 2-3 клиентов в год. Моделирование редких событий - это вовсе не магия, а давно известный и хорошо себя зарекомендовавший метод.
Есть у вашей статьи еще один большой недостаток - она не воспроизводима. Нет данных, нет модели данных, а значит нет способа убедиться в вашей правоте насчет валидности линейной модели (да и вообще в том, что у вас хоть что-то получается). Отсутствие воспроизводимости - это самый красный из всех красных флагов для ресерчей, аудиторов и консультантов.
Аналогия со стрельбой по движущимся мишеням хорошая, но в реальности все немного не так. Представьте, что вам по прежнему нужно попасть по летящей тарелочке, но вы выпили пол литра чего покрепче, дует сильный ветер, идет ливень с градом, ну и землетрясение замечательно дополнит картину. Когда нужно попасть случайным значением в случайную область, то это называется стохастическое программирование (SP) - вы оптимизируете не просто значение целевой функции, а среднее значение целевой функции. А это очень разные вещи.
Так же интересен момент с выбором линейной функции в качестве аппроксимации кривой эластичности спроса по цене. Предиктивный анализ строится на каких-то базовых (фундаментальных) предположениях. Например, что будет если продолжить "кривую" спроса до +-бесконечности? Очевидно, что перед нами что-то экспоненциальное (особенно если рынок более-менее эффективен), линейная функция подходит для описания какой-то "части" таких явлений. А вот размер этой "части" - большой вопрос. К тому же раз речь идет о темпе (интенсивности?) продаж, то перед нами Пуассоновский процесс (нестационарный, хитровыдуманный, но Пуассоновский). Простота и понятность для CEO - это не гарантия... успешного успеха что ли.
Учитывая, что вы продаете не мороженное, а квартиры, то на мой взгляд лучше всего использовать вероятностное программирование. А в качестве бонуса вы получите распределения вероятностей, которые как раз и нужны для SP.
Так же надо отметить, что задача динамического ценообразования - это лишь частный случай задачи планирования продаж. Например, вы говорите, что нужно поддерживать темп продаж. Но на самом деле это задача оптимизации как цены, так и объема предложения - сколько и по какой цене продавать. Это "посчитать" сложнее, однако, куда сложнее найти оптимальную стратегию продаж - стохастическое программирование, это своего рода страхование рисков за счет неопределенности, но и это страхование может быть оптимальным и продуманным (двухэтапное SP, построенное на некотором множестве оптимальных логических ограничений (условий)).
Формулы, код, пруфы - вот чего не хватает вашей статье, - без всего этого, это просто маркетинг. А тут на такое аллергия.
Вообще, тема интересная, но практика и правда очень странная. Очень часто ценности создаются с таким большим трудом, а продаются с помощью цен, которые основаны ни на чем.
Лично я уверен, что проблема динамического ценообразования существует из-за массовой уверенности в том, что ML по дефолту способен решать проблемы оптимизации. Но на самом деле, оптимальное ценообразование, это сугубо OR-задача.
Например, проблема которую вы описываете, связана с недостатком информации - явление вроде бы как массовое, но для построения надежных кривых эластичности данных мало. В этом случае переходят от модели спроса к модели клиента (модель дискретного выбора на основе логита). Тут конечно без ML для построения модели не обойтись, но вот расчет оптимальной цены, это все равно - OR.
Статья классная, но вот с игрой вы прям супер придумали! Во всех смыслах. Хотя вы наверняка и сами об этом знаете.
Когда-то давным-давно, когда виндовс была 98, а трава зеленее сам начинал с экселя, теперь вообще не понимаю, как в нем можно работать.
Спасибо за ностальжи :)
А вообще есть распределения которые, как мне кажется сгенерить в экселе не получится, например устойчивое распределение Леви. Хотя, учитывая что в нем как-то DooM запускают, то наверняка это возможно. Но это точно будет очень медленная генерация.
import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt
import seaborn as sns
samples = []
mu, sigma = 0, 1
for i in range(100):
samples.append(norm.rvs(mu, sigma, size=100))
mu += 1
sigma += .5
sns.kdeplot(np.hstack(samples));
Если проследить за вибрациями например какого-нибудь подшипника, то они будут выглядеть именно так. Но если их смотреть в каждый отдельный день, то их поведение будет нормальным.
Меня в последнее время все больше интересует почему некоторые статьи плохие, а некоторые хорошие, почему одни ""заплюсовываются", а другие нет. Это я вовсе не к тому, что плюсы накручены, а к тому, что есть какая-то проблема рефлексии во всей этой научной деятельности. Какое-то странное стремление все упрощать.
Смотрите, устойчивые распределения известны давно. Если мне не изменяет память, то открыл их Леви еще в начале XX-го. Кстати в scipy.stats по моему даже есть распределение Леви. Есть куча книг и работ по их приложениям в разных науках. Включая биржи.
Если сделать в нормальном распределении матожидание и дисперсию зависимыми от времени, и сэмплировать из такого генератора значения, то мы тоже получим длинные хвосты. Техники давно заметили, что именно так и происходит износ механизмов.
Чуваки, которые занимаются теорией самоорганизации, говорят что наличие длинных хвостов свидетельствует о наличии внутренней динамики систем, подчиняющейся определенным правилам. Марковские и байесовские сети, к примеру, могут восстановить такие правила.
В управлении рисками - степень игнорирования длинных хвостов (выбросов), определяет степень склонности к риску.
Все это давно известно. Но почему статья так "залайкана"? Откуда такой интерес к длинным хвостам? В последнее время, мне лично стало как-то прикольно выдвигать гипотезы о причинах. Дело может быть в банальной подаче материала. В репутации компании и автора (в конце концов материал ведь переводной и не совсем исчерпывающий). А может быть это так себя проявляет метамодерн :)
Но как бы там ни было, это хороший интерес. Спасибо за статью (предыдущие статьи тоже). Плюсую обеими руками!
Забавное совпадение. Вникаю в моделирование дискретного выбора, загуглил (надеюсь, слово "загуглил" в Яндексе не считается матерным) распределение Гумбеля. Вижу ссылку на статью на Хабре. "Ну какое-нибудь старье" - подумал я. А тут на тебе - 1 час с момента публикации.
Оптимальное распределение ресурсов - это не идеология, а экономическая эффективность: как достичь максимума ценности при ограниченных ресурсах.
И рынок, и плановая система сталкиваются с этой задачей. Капитализм не отменяет вопрос «куда направить ресурсы?» - он просто пытается решить его через цены, спрос и конкуренцию.
Но наличие прибыли ≠ оптимальность. Прибыль может быть от монополии, субсидий или временного ажиотажа - при этом ресурсы расходуются неэффективно.
Продажи - это сигнал, а не самоцель. Если продукт не продаётся - значит, распределение (в том числе в производстве, ценообразовании, логистике, маркетинге) было неоптимальным.
Вопрос «как лучше распределить?» стоит перед любой экономической системой и в конечном счете, тот кто будет отвечать на этот вопрос откроет книгу по математическому моделированию и математическому программированию.
Вы наверное решили, что моя цель состоит в том что бы переубедить вас, но своей цели я достиг написав два предыдущих ответа :)
В Байесовском выводе есть хороший пример про оракула и мнение. Допустим к вам в руки попал предмет, который может выдавать верные ответы в форме да/нет на любой ваш вопрос. Сколько таких ответов вам потребуется, что бы вы поверили в то, что перед вами действительно магический предмет? 3? 5? 10? 100?
Если априорные убеждения другой стороны слишком сильны, то все доводы и аргументы будут работать против того, кто пытается повлиять на мнение этой стороны. Байесовская статистика прямым текстом говорит, что в этом случае надо перестать метать бисер и переходить к... а вот к чему надо переходить я искренне надеюсь вы сможете сами узнать :)
Решение задачи трех тел есть - просто оно численное. Можно ли полагаться на это решение в долгосроке - нет. Но даже в этом случае для тел можно вывести вероятностные распределения для их местоположений. Стохастическое программирование применяется в астродинамике как раз по той причине, которую вы обозначили - тел сотни.
Математика часто неприменима не потому, что есть какая-то недосягаемая магия, которую невозможно формализовать. Просто иногда для получения решений недостаточно ресурсов (времени, денег, железа, мозгов). В крупных компаниях проблема оптимизации стоит не так остро, как в среднем и малом бизнесе.
Зачем так много слов? Поймите, то что вы можете принимать решения без математики вовсе не значит, что она ненужна. В определенных ситуациях, например когда речь идет о человеческом благополучии и безопасности или о миллиардах у.е., такой подход опасен. Я просто пытаюсь обозначить свою точку зрения - если есть возможность заморочиться, то лучше заморочиться. Хуже от этого точно не станет.
В конце концов, математика - это еще и культура. Например, вы являетесь байесовистом, но вы вряд ли это хорошо осознаете и скорее всего только поверхностно понимаете потенциал этой парадигмы, которой постоянно пользуетесь. Иначе ваше мнение не было бы таким категоричным.
В моем понимании - математическая оптимизация это синоним "здравого смысла". Это необязательно формулы. Например, переговоры, во многом они построены на теории игр, которую сложно применить в реальных условиях. Но на реальных переговорах, чаще всего видно, знакома ли другая сторона с математической подоплекой этого процесса или нет.
Красивое уточнение. Случайность сложный концепт, особенно в плане закономерностей. Иногда в моделировании выделяют два вида случайностей:
1) случайность в чистом виде, которую наша модель не учитывает, например, черные лебеди и прочая радикальная неопределенность;
2) стохастичность - это та случайность которая учитывается моделью.
Из-за первого пункта в Байесовском выводе рекомендуют быть очень осторожными при выборе априорных распределений.
Банальный опыт - это тоже проблема.
Ошибки, - если из них сделаны должные выводы, то да, это опыт. Но проблема в том, что иногда эти выводы находятся за пределами наших компетенций. Ситуация, когда мы не знаем чего не знаем (или думаем, что думаем), апеллирует к праву на сомнение. А имеет ли руководитель право сомневаться? Ответ зависит от того как вы воспринимаете сам архетип руководителя. Но научный подход к решению проблем существует независимо от этого восприятия - если мы оказались за пределами компетенций, то это значит что мы уже находимся в условиях неполной информации, что в свою очередь является неопределенностью. В условиях неопределенности все, что мы можем - это выдвигать гипотезы и на их основе подсчитывать шансы на успех от разных решений. Можно ли их подсчитать?
Мнение о том, что математика бесполезна при решении задач управления очень распространено, но оно во многом основано на непонимании того, как происходит математическая формализация (перевод словесной задачи в формулы). Но тут практически нечего изобретать, особенно в IT. Например:
формирование команд - это многокритериальная задача ILP;
назначение команд на проекты (фичи) - это задача о назначениях;
выбор проектов (фич для реализации) - это задача о формировании оптимального портфеля проектов;
планирование работ - это графы и Байесовские сети (PERT, CPM и т.д.).
Еще одна причина мнения о бесполезности математики заключается в уверенности в том, что даже при наличии формальных моделей получить адекватные оценки для их параметров невозможно - это тоже заблуждение. Существует масса способов формирования и обработки экспертных оценок:
интервальные оценки от нескольких экспертов и их объединение;
метод фишек;
метод Дельфи;
метод сценариев;
Байесовское обновление.
Все это способы сформировать те самые распределения вероятностей, на которые можно полагаться.
Повторюсь еще раз - решение есть всегда. Проблема в его стоимости.
Ну, скажем так, у читателей Хабра не только айтишный бизнес, тут кого (чего) только нет. Если руководитель бизнеса окружает себя людьми, которые не имеют своего мнения и экспертизы, то да Монте-Карло срабатывает за наносекунды.
Проблема не в том, что нет решения - оно есть всегда. Проблема в его стоимости. Яндекс, Гугл, NASA, CERN - думаете они распределяют ресурсы гоняя Монте-Карло в голове?
Смысл в том, что если руководитель может умножить сроки на 3 и поделить количество хотелок на столько же, то это значит, что есть какое-то представление, как минимум о робастном программировании. И это это круто.
Распределения берутся из данных - их называют эмпирическими. Но даже если нет никаких данных, а "чуйка" что-то подсказывает, то это тоже распределение вероятностей - априорное. В реальном бизнесе, как правило есть либо данные, либо люди с хорошей "чуйкой", на которую можно положиться.
Вопрос хороший. Когда дело касается денег, то глупых вопросов не бывает.
Огромное спасибо за спойлер! Пойду быстрее повторю всю теорию по нейронкам, а то боюсь ничего не понять в следующей статье.
Хороший науч-поп на Хабре всегда заходит.
Хотя лично мне больше нравится, что статьи выскакивают в поиске, то есть это не только приятное времяпрепровождение, но еще и польза. А уж если попал из поиска и статья оказалась не только полезной, но еще и интересной, то от этого вдвойне приятнее.
Но ведь нормальный улучшотрон получился :)
Не хотелось раздувать текст. Сделал ставку на то, что если слова "эвристика" и "муравьи" будут рядом, то в целом должно быть понятно о чем речь. Ну и на ваше любопытство я тоже ставил :)
Что касается эл-эл-эмок, то уже больше года не могу понять какой контент теперь нужен как мне, так и читателям. После долгих раздумий пришел к выводу, что надо что-то вроде контента-путеводителя по темам. Теперь нет никакого смысла в доскональных и академически-строгих разъяснениях чего бы то ни было. Как считаете?
Мне кажется вы не понимаете фундаментальной проблемы в вашем методе ценообразования - у вас нет модели данных. Вы можете что-то оптимизировать только если можете смоделировать данные. То что данных (событий) мало - это не оправдание. Например, космические запуски происходят в десятки тысяч раз реже чем продаются квартиры, но при этом стоимость страховки для каждого запуска является оптимальной. Вам не кажется это странным?
Но на самом деле, для ваших аргументов все еще хуже, просто потому что есть RMS которые определяют лучшую цену для всего лишь 2-3 клиентов в год. Моделирование редких событий - это вовсе не магия, а давно известный и хорошо себя зарекомендовавший метод.
Есть у вашей статьи еще один большой недостаток - она не воспроизводима. Нет данных, нет модели данных, а значит нет способа убедиться в вашей правоте насчет валидности линейной модели (да и вообще в том, что у вас хоть что-то получается). Отсутствие воспроизводимости - это самый красный из всех красных флагов для ресерчей, аудиторов и консультантов.
Аналогия со стрельбой по движущимся мишеням хорошая, но в реальности все немного не так. Представьте, что вам по прежнему нужно попасть по летящей тарелочке, но вы выпили пол литра чего покрепче, дует сильный ветер, идет ливень с градом, ну и землетрясение замечательно дополнит картину. Когда нужно попасть случайным значением в случайную область, то это называется стохастическое программирование (SP) - вы оптимизируете не просто значение целевой функции, а среднее значение целевой функции. А это очень разные вещи.
Так же интересен момент с выбором линейной функции в качестве аппроксимации кривой эластичности спроса по цене. Предиктивный анализ строится на каких-то базовых (фундаментальных) предположениях. Например, что будет если продолжить "кривую" спроса до +-бесконечности? Очевидно, что перед нами что-то экспоненциальное (особенно если рынок более-менее эффективен), линейная функция подходит для описания какой-то "части" таких явлений. А вот размер этой "части" - большой вопрос. К тому же раз речь идет о темпе (интенсивности?) продаж, то перед нами Пуассоновский процесс (нестационарный, хитровыдуманный, но Пуассоновский). Простота и понятность для CEO - это не гарантия... успешного успеха что ли.
Учитывая, что вы продаете не мороженное, а квартиры, то на мой взгляд лучше всего использовать вероятностное программирование. А в качестве бонуса вы получите распределения вероятностей, которые как раз и нужны для SP.
Так же надо отметить, что задача динамического ценообразования - это лишь частный случай задачи планирования продаж. Например, вы говорите, что нужно поддерживать темп продаж. Но на самом деле это задача оптимизации как цены, так и объема предложения - сколько и по какой цене продавать. Это "посчитать" сложнее, однако, куда сложнее найти оптимальную стратегию продаж - стохастическое программирование, это своего рода страхование рисков за счет неопределенности, но и это страхование может быть оптимальным и продуманным (двухэтапное SP, построенное на некотором множестве оптимальных логических ограничений (условий)).
Формулы, код, пруфы - вот чего не хватает вашей статье, - без всего этого, это просто маркетинг. А тут на такое аллергия.
WOW!
Вспомнилось как в какой-то из книг про pymc автор называет аб-тестеров-фреквентистов чуть ли не грязекопателями. В чем-то я с ним согласен.
Спасибо за статью.
Вообще, тема интересная, но практика и правда очень странная. Очень часто ценности создаются с таким большим трудом, а продаются с помощью цен, которые основаны ни на чем.
Лично я уверен, что проблема динамического ценообразования существует из-за массовой уверенности в том, что ML по дефолту способен решать проблемы оптимизации. Но на самом деле, оптимальное ценообразование, это сугубо OR-задача.
Например, проблема которую вы описываете, связана с недостатком информации - явление вроде бы как массовое, но для построения надежных кривых эластичности данных мало. В этом случае переходят от модели спроса к модели клиента (модель дискретного выбора на основе логита). Тут конечно без ML для построения модели не обойтись, но вот расчет оптимальной цены, это все равно - OR.
Статья классная, но вот с игрой вы прям супер придумали! Во всех смыслах. Хотя вы наверняка и сами об этом знаете.
Спасибо за статью.
Когда-то давным-давно, когда виндовс была 98, а трава зеленее сам начинал с экселя, теперь вообще не понимаю, как в нем можно работать.
Спасибо за ностальжи :)
А вообще есть распределения которые, как мне кажется сгенерить в экселе не получится, например устойчивое распределение Леви. Хотя, учитывая что в нем как-то DooM запускают, то наверняка это возможно. Но это точно будет очень медленная генерация.
Ровно по той же, по которой там нет последовательного анализа и Байеса. Уже не первый год этому удивляюсь. Ответа кстати не дождетесь :)
Если проследить за вибрациями например какого-нибудь подшипника, то они будут выглядеть именно так. Но если их смотреть в каждый отдельный день, то их поведение будет нормальным.
Меня в последнее время все больше интересует почему некоторые статьи плохие, а некоторые хорошие, почему одни ""заплюсовываются", а другие нет. Это я вовсе не к тому, что плюсы накручены, а к тому, что есть какая-то проблема рефлексии во всей этой научной деятельности. Какое-то странное стремление все упрощать.
Смотрите, устойчивые распределения известны давно. Если мне не изменяет память, то открыл их Леви еще в начале XX-го. Кстати в scipy.stats по моему даже есть распределение Леви. Есть куча книг и работ по их приложениям в разных науках. Включая биржи.
Если сделать в нормальном распределении матожидание и дисперсию зависимыми от времени, и сэмплировать из такого генератора значения, то мы тоже получим длинные хвосты. Техники давно заметили, что именно так и происходит износ механизмов.
Чуваки, которые занимаются теорией самоорганизации, говорят что наличие длинных хвостов свидетельствует о наличии внутренней динамики систем, подчиняющейся определенным правилам. Марковские и байесовские сети, к примеру, могут восстановить такие правила.
В управлении рисками - степень игнорирования длинных хвостов (выбросов), определяет степень склонности к риску.
Все это давно известно. Но почему статья так "залайкана"? Откуда такой интерес к длинным хвостам? В последнее время, мне лично стало как-то прикольно выдвигать гипотезы о причинах. Дело может быть в банальной подаче материала. В репутации компании и автора (в конце концов материал ведь переводной и не совсем исчерпывающий). А может быть это так себя проявляет метамодерн :)
Но как бы там ни было, это хороший интерес. Спасибо за статью (предыдущие статьи тоже). Плюсую обеими руками!
Забавное совпадение. Вникаю в моделирование дискретного выбора, загуглил (надеюсь, слово "загуглил" в Яндексе не считается матерным) распределение Гумбеля. Вижу ссылку на статью на Хабре. "Ну какое-нибудь старье" - подумал я. А тут на тебе - 1 час с момента публикации.
Совпадение?.. Не думаю :)