Что касается таможни — наверное, тут Вы правы, но опять-таки, если вы ввозите легально, ну не будете же Вы платить штрафов больше, чем стоимость товара.
Про установку разных цен для разных рынков соглашусь, но это как раз и делается для того, чтобы не было большой разницы в цене.
Что касается требований, то я не думаю, что тут безумные косты и требования по пожаробезопасности так безумно отличаются от европейских.
А про выкупать коллекции — ну, если вы зайдете в магазин одной и той же марки, например, в Германии и в Италии, то вы увидите, что размеры там разные в принципе. То есть размеры и коллекции обычно адаптированы под страну и население.
Я не говорю, что это легко или сложно, я лишь говорю, что не очень понимаю, что происходит и почему.
Я с удовольствием хотел бы тратить деньги в России, но не тогда, когда цены выше в два-три раза.
Однажды мы разговаривали с одним из друзей-итальянцев о покупках (дело было во Франции), и он заметил, что не будет покупать здесь (во Франции) вещи, потому что хочет покупать все в Италии (и специально ездит в Италию делать покупки) для того, чтобы помогать экономике.
И я бы хотел, чтобы мои (и не только мои) деньги оставались в России, но, видимо, это не слишком возможно.
Нет-нет, их я учитываю неявно по европейскому аналогу, потому что 400 евро — это розничная цена магазина, а значит туда включена и аренда, и зарплаты (а затраты на работника, в нашем случае продавца, в Европе выше российских), и электричество (которое, кстати сказать, намного дороже в Европе), и прочие расходы магазина.
Да, я еще замечу, что по сути в рассчете я завысил все операционные расходы на 30%, потому что я подразумеваю, что они включены в розничную стоимость 400 евро, на на нее я накладываю еще таможенную пошлину.
А расскажите, пожалуйста, какие именно существуют издержки. Я в комментарии ниже привел конкретный пример:
«Вот недавно искали девушки платье, я видел его в Милане в центре города в известном магазине за 400 евро, в Москве в официальном магазине той же марки оно стоит 1500 евро. Если считать, что разница состоит только в таможне и доставке (потому что арендная ставка примерно одинаковая, операционные затраты плюс-минус тоже), то, извините, но я не понимаю, откуда берется почти 300% разницы. И почему, скажем, в случае автомобилей такой огромной разницы не наблюдается, так же, как и в случае официальной техники (если сравнить какой-нибудь iPhone в штатах без контракта и в России, то там не будет разницы даже в 100%)»
Просто мне искренне хочется понять разницу. И мой здравый смысл не позволяет мне согласиться с мыслью, что, если я как частно лицо покупаю билеты на самолет (около 300 евро) и платье за 400 евро в Милане, то это в два раза дешевле, цены, которую устанавливает юрлицо в России. Насколько я знаю, для физлиц разтаможка товара свыше 1000 евро стоит 30%. То есть если я как физлицо заказываю 100 платьев в Милане, то плачу 400*100*1.3 = 52000 (надо, конечно, сделать поправку на НДС, но опустим ее), доставка такой партии по тарифам DHL стоит 428 евро (посчитал на сайте исходя из того, что платье весит 200 грамм), итого для меня одно платье будет стоить (52000+428)/100=524,28 евро. То есть на 31% дороже, но никак не на 300%.
Ну молоко это совсем другое дело. Тут замешана куча посредников, упаковка, стерилизация и пр. Это-то как раз я понимаю. Да и в Европе розничная цена молока на том же уровне находится, что и в России
А что касается 200% накрутки, то, разумеется, я не считаю, что все дураки. Но между тем, я все равно считаю, что 200% это нереально много. Вот недавно искали девушки платье, я видел его в Милане в центре города в известном магазине за 400 евро, в Москве в официальном магазине той же марки оно стоит 1500 евро. Если считать, что разница составляет только в таможне и доставке (потому что арендная ставка примерно одинаковая, операционные затраты тоже), то, извините, но я не понимаю, откуда берется почти 300% разницы. И почему, скажем, в случае автомобилей такой огромной разницы не наблюдается, так же, как и в случае официальное техники (если сравнить какой-нибудь iPhone в штатах без контракта и в России, то там не будет разницы даже в 100%)
Молоко молоком, но люди не молоко из Европы и Штатов заказывают, а одежду и технику. Для меня всегда было загадкой, почему я могу в Англии купить рубашки с доставкой в Россию за 100 евро / 3 штуки (в лондонском магазине они стоят ровно столько же), когда в России они перепродаются в интернет-магазине по 50 евро за штуку, а в обычном магазине они стоят более 100 евро за штуку. То есть в 3 раза дороже! Для того, чтобы купить хороший костюм, дешевле купить билеты на самолет, слетать на день в Европу и купить костюм, чем покупать его в России. Я искренне хочу покупать все в России, но когда я вижу в магазинах цены и качество того, что продают, то желание пропадает сразу. В обычных магазинах накрутка в 100-200% это совершенно обычная вещь, а в интернет магазинах — минимум 50%. Это еще и при том, что ни обычные магазины, ни интернет-магазины никакой дополнительной стоимости не создают, а тупо перепродают то, что сами закупают в Европе и Штатах.
В целом, да. Однако же я встречал вещи, которые есть в R, но которых нет (или они очень криво имплементированы) в питоне… Например, многое, что связано с анализом временных рядов
Откровенно говоря, я не знаю, что происходит на ТЭС, я специализировался исключительно на АЭС. И по АЭС проблема в том, что это ядерный объект, который требует специального разрешения государственной комиссии, с которой должны согласовываться все изменения. Это во-первых. Во-вторых, примерно половина стоимости станции — это финансовые затраты (то есть это затраты, связанные с обслуживанием долгов, выданных на строительство). Если на стадии строительства (а так часто бывает) надо заменить какой-то агрегат или систему на более совершенную, то весь проект надо согласовывать заново (что является очень небыстрым процессом). Это приводит к задержкам и к еще большему увеличению финансовых затрат. К слову сказать, АЭС в Финляндии в два раза выросла в стоимости именно из-за задержек согласования и финансовых затрат. Плюс ко всему, каждый проект станции индивидуальный и потому требует огромного количества согласований. Сейчас разрабатывают типовые проекты, которые подразумевают существенную экономию именно благодаря сокращенному сроку согласования, но это уже отдельная история.
Стоимость топлива для АЭС никак не влият на то, какие величины сравнивать. Она, безусловно, влияет на цену энергии и относится к операционным затратам, как впрочем и зарплаты персонала, и затраты на амортизацию основных средств и пр. Именно поэтому правильней оценивать стоимость энергоносителей исходя из модели дисконтированных денежных потоков, но ее построение требует определенных затрат времени. Понятно, что газ и уголь в России стоят не столько, сколько они стоят, например, в Европе. Но конкретно для России ТЭС являются самыми дешевыми.
Я не могу с Вами спорить, потому что не знаю, какая информация лежит в Ваших данных. К тому же, я не уверен, что сравнение на примере Украины корректно, потому что, если мне не изменяет память, там не было построено ни одной АЭС после 90го года (а 30 лет назад АЭС стоили дешевле, чем сейчас). Это, кстати, одна из проблем АЭС — там нет «кривой обучаемости», то есть когда при развитиии технологий стоимость производства уменьшается. В случае с АЭС постоянно возрастают требования по безопасности, что влечет за собой постоянное усовершенствование систем безопасности, что в свою очередь приводит к увеличению стоимости самой АЭС.
Стоимость строительства очевидно влияет на тарифы, потому что вам надо станцию как минимум окупить, вы потратились на то, чтобы ее построить, а доход вы можете получать только от продажи энергии. При этом, конечно, стоимость энергии не зависит линейно от стоимости строительства (там есть такая штука, как дисконтированные денежные потоки).
Как я помню из школьного курса физики, мощность это энергия на единицу времени. В нашем сравнении время в обоих случаях одинаковое, и тут все равно, какие величины сравнивать.
А где вы прочитали, что атомная энергия дешевле? Стоимость строительства АЭС порядка 3000 $/кВт, но учитывая все задержки с проектом стоимость обычно возрастает в два раза. Насколько я помню, одна из последних оценок строящейся в настоящее время АЭС в Финляндии была как раз около 6000 $/кВт. Для ТЭС, если мне не изменяет память, стоимость строительства порядка 1000 $/кВт. Для ГЭС — порядка 2000-3000 $/кВт
Вероятность получить какое-либо значение зависит от распределения.
Если у нас равномерное распределение (как в случае с a), то у нас одинаковая вероятность получить любое значение из отрезка, на котором определено это распределение. То есть в случае a = pymc.Uniform('a', 0., 20.) вероятность получить любое значение a (в том числе 5) одинакова и равна 1/(20-0), то есть 1/(верхняя_граница — нижняя_граница).
В случае с Data, мы говорим, что данные распределены нормально вокруг прямой y=a*x+b, поэтому вероятность получить любое значение рассчитывается по формуле для нормального распределение со средним, равным a*x+b, и дисперсией, равной \sigma. Эта вероятность пропорциональна величине ( (y_i — a*x_i — b) / (\sigma) )^2
Вы правильно понимаете задачу и правильно написали конечную формулу, далее начинается небольшая путаница.
θ — это параметр. В нашем случае, у нас есть два параметры, которые не зависят друг от друга: a и b (шум — это не параметр, это просто отклонение a и b от своих средних значений), поэтому для нашего случая мы можем переписать формулу в следующем виде:
p(a,b|Data) = p(Data|a,b)*p(a)*p(b) / p(Data)
p(θ) = p(a)*p(b) — это наше априорное распределение, которое мы задаем. То есть мы задает p(a) и p(b).
Data — это наши экспериментальные данные (набор точек {x_i,y_i}). Они нам даны изначально и не зависят от параметров, и не изменяются с изменением параметров. То есть для нашей задачи они являются константой, поэтому p(Data) тоже является константой (это более интуитивное объяснение постоянности p(Data)).
Если объяснять «на пальцах», то наша задача заключается в следующем:
У нас есть прямая y = a*x + b. Если мы возьмем отдельную точку этой прямой (x=0.2, например), то из-за присутствия шума y может принимать для этой точки любые значения вокруг нашей прямой, то есть они распределены нормально со средним a*0.2 + b и дисперсией \sigma (которую мы предполагаем известной — дисперсия шума). И так случилось, что наш эксперимент дал нам в этой точке значение y, например, равное 0.5. Это значит, что при данных a и b (которые определяют среднее распределения) мы можем посчитать вероятность получить то значение y, которое мы получили экспериментально. Как вы видите, из формы нормального распределения следует, что наибольшая вероятность будет у значений, равных среднему, то есть равных a*0.2 + b (т.е. лежащих на прямой y=a*x+b). Чем дальше значение y от среднего (от прямой), тем меньше у него вероятность. Так происходит во всех точках. Наша задача в том, чтобы найти такие коэффициенты a и b, чтобы все экспериментальные точки лежали наиболее близко к прямой (то есть, чтобы их совокупная вероятность была наибольшей).
Честно говоря, я не очень понимаю вопрос «где там Байес».
Если говорить только о логике программы, то на последнем рисунке вы видите архитектуру модели.
В файле model.py имплементируется эта архитектура, то есть описываются все узлы и связи между ними, задаются все распределения.
В файле run_model.py самыми выжными являются две строчки:
D = pymc.MCMC(model, db = 'pickle')
D.sample(iter = 10000, burn = 1000)
Первая определяет, что надо использовать алгоритм MCMC для нашей модели, а вторая делает выборку в соостветствии с этим алгоритмом.
Обрабатывая выборку, мы получается наиболее вероятные значения, погрешности, среднии и пр.
Математика сидит в архитектуре модели. То есть у вас есть формула Байеса, в которой есть функция правдоподобия, зависящая от параметров, и априорные распределения параметров. Эта структура формулы Байеса и есть архитектура модели.
В общем случае формула Байеса может быть усложнена, то есть у вас может быть функция правдоподобия, зависящая от параметров, априорные распределения параметров, зависящие от других параметров, а потом априорные распределения этих самых других параметров. Все это описывается архитектурой модели.
Честно говоря, я не очень уверен, что подобная статья будет интересна англоязычной аудитории, потому что там довольно много подобных материалов. Вот, например, на указанном вами сайте я сразу же нашел туториал по байесовким методам. С одной стороны, он менее подробно описан, но с другой стороны, конкретно этот пример я видел в нескольких англоязычных книжках, где описание достаточно полное. Я пишу англоязычные научные статьи, и этого мне вполне достаточно. А писать подобные посты о байесовских методах на русском — это просто хобби. Да и к тому же это хорошее развитие собственных педагогических способностей.
Мой ответ: в вероятностном характере байесовских методов. Здесь есть два аспекта. Во-первых, невозможно сгенерировать две одинаковые выборки, и, соответственно, их среднее будет каждый раз отличаться. Во-вторых, есть погрешность в вычислении наиболее вероятного значения. Потому что его расчет зависит от того, какая сетка для гистограммы выбрана (если сетка слишком мелкая, то за наиболее вероятное можно по ошибке принять случайный выброс, а если слишком грубая, то тогда усреднение будет проводиться по слишком большому количеству значений.
Про установку разных цен для разных рынков соглашусь, но это как раз и делается для того, чтобы не было большой разницы в цене.
Что касается требований, то я не думаю, что тут безумные косты и требования по пожаробезопасности так безумно отличаются от европейских.
А про выкупать коллекции — ну, если вы зайдете в магазин одной и той же марки, например, в Германии и в Италии, то вы увидите, что размеры там разные в принципе. То есть размеры и коллекции обычно адаптированы под страну и население.
Я не говорю, что это легко или сложно, я лишь говорю, что не очень понимаю, что происходит и почему.
Я с удовольствием хотел бы тратить деньги в России, но не тогда, когда цены выше в два-три раза.
Однажды мы разговаривали с одним из друзей-итальянцев о покупках (дело было во Франции), и он заметил, что не будет покупать здесь (во Франции) вещи, потому что хочет покупать все в Италии (и специально ездит в Италию делать покупки) для того, чтобы помогать экономике.
И я бы хотел, чтобы мои (и не только мои) деньги оставались в России, но, видимо, это не слишком возможно.
«Вот недавно искали девушки платье, я видел его в Милане в центре города в известном магазине за 400 евро, в Москве в официальном магазине той же марки оно стоит 1500 евро. Если считать, что разница состоит только в таможне и доставке (потому что арендная ставка примерно одинаковая, операционные затраты плюс-минус тоже), то, извините, но я не понимаю, откуда берется почти 300% разницы. И почему, скажем, в случае автомобилей такой огромной разницы не наблюдается, так же, как и в случае официальной техники (если сравнить какой-нибудь iPhone в штатах без контракта и в России, то там не будет разницы даже в 100%)»
Просто мне искренне хочется понять разницу. И мой здравый смысл не позволяет мне согласиться с мыслью, что, если я как частно лицо покупаю билеты на самолет (около 300 евро) и платье за 400 евро в Милане, то это в два раза дешевле, цены, которую устанавливает юрлицо в России. Насколько я знаю, для физлиц разтаможка товара свыше 1000 евро стоит 30%. То есть если я как физлицо заказываю 100 платьев в Милане, то плачу 400*100*1.3 = 52000 (надо, конечно, сделать поправку на НДС, но опустим ее), доставка такой партии по тарифам DHL стоит 428 евро (посчитал на сайте исходя из того, что платье весит 200 грамм), итого для меня одно платье будет стоить (52000+428)/100=524,28 евро. То есть на 31% дороже, но никак не на 300%.
А что касается 200% накрутки, то, разумеется, я не считаю, что все дураки. Но между тем, я все равно считаю, что 200% это нереально много. Вот недавно искали девушки платье, я видел его в Милане в центре города в известном магазине за 400 евро, в Москве в официальном магазине той же марки оно стоит 1500 евро. Если считать, что разница составляет только в таможне и доставке (потому что арендная ставка примерно одинаковая, операционные затраты тоже), то, извините, но я не понимаю, откуда берется почти 300% разницы. И почему, скажем, в случае автомобилей такой огромной разницы не наблюдается, так же, как и в случае официальное техники (если сравнить какой-нибудь iPhone в штатах без контракта и в России, то там не будет разницы даже в 100%)
Стоимость строительства очевидно влияет на тарифы, потому что вам надо станцию как минимум окупить, вы потратились на то, чтобы ее построить, а доход вы можете получать только от продажи энергии. При этом, конечно, стоимость энергии не зависит линейно от стоимости строительства (там есть такая штука, как дисконтированные денежные потоки).
Если у нас равномерное распределение (как в случае с a), то у нас одинаковая вероятность получить любое значение из отрезка, на котором определено это распределение. То есть в случае a = pymc.Uniform('a', 0., 20.) вероятность получить любое значение a (в том числе 5) одинакова и равна 1/(20-0), то есть 1/(верхняя_граница — нижняя_граница).
В случае с Data, мы говорим, что данные распределены нормально вокруг прямой y=a*x+b, поэтому вероятность получить любое значение рассчитывается по формуле для нормального распределение со средним, равным a*x+b, и дисперсией, равной \sigma. Эта вероятность пропорциональна величине ( (y_i — a*x_i — b) / (\sigma) )^2
θ — это параметр. В нашем случае, у нас есть два параметры, которые не зависят друг от друга: a и b (шум — это не параметр, это просто отклонение a и b от своих средних значений), поэтому для нашего случая мы можем переписать формулу в следующем виде:
p(a,b|Data) = p(Data|a,b)*p(a)*p(b) / p(Data)
p(θ) = p(a)*p(b) — это наше априорное распределение, которое мы задаем. То есть мы задает p(a) и p(b).
Data — это наши экспериментальные данные (набор точек {x_i,y_i}). Они нам даны изначально и не зависят от параметров, и не изменяются с изменением параметров. То есть для нашей задачи они являются константой, поэтому p(Data) тоже является константой (это более интуитивное объяснение постоянности p(Data)).
Если объяснять «на пальцах», то наша задача заключается в следующем:
У нас есть прямая y = a*x + b. Если мы возьмем отдельную точку этой прямой (x=0.2, например), то из-за присутствия шума y может принимать для этой точки любые значения вокруг нашей прямой, то есть они распределены нормально со средним a*0.2 + b и дисперсией \sigma (которую мы предполагаем известной — дисперсия шума). И так случилось, что наш эксперимент дал нам в этой точке значение y, например, равное 0.5. Это значит, что при данных a и b (которые определяют среднее распределения) мы можем посчитать вероятность получить то значение y, которое мы получили экспериментально. Как вы видите, из формы нормального распределения следует, что наибольшая вероятность будет у значений, равных среднему, то есть равных a*0.2 + b (т.е. лежащих на прямой y=a*x+b). Чем дальше значение y от среднего (от прямой), тем меньше у него вероятность. Так происходит во всех точках. Наша задача в том, чтобы найти такие коэффициенты a и b, чтобы все экспериментальные точки лежали наиболее близко к прямой (то есть, чтобы их совокупная вероятность была наибольшей).
Если говорить только о логике программы, то на последнем рисунке вы видите архитектуру модели.
В файле model.py имплементируется эта архитектура, то есть описываются все узлы и связи между ними, задаются все распределения.
В файле run_model.py самыми выжными являются две строчки:
Первая определяет, что надо использовать алгоритм MCMC для нашей модели, а вторая делает выборку в соостветствии с этим алгоритмом.
Обрабатывая выборку, мы получается наиболее вероятные значения, погрешности, среднии и пр.
Математика сидит в архитектуре модели. То есть у вас есть формула Байеса, в которой есть функция правдоподобия, зависящая от параметров, и априорные распределения параметров. Эта структура формулы Байеса и есть архитектура модели.
В общем случае формула Байеса может быть усложнена, то есть у вас может быть функция правдоподобия, зависящая от параметров, априорные распределения параметров, зависящие от других параметров, а потом априорные распределения этих самых других параметров. Все это описывается архитектурой модели.
А какие именно картинки? Или все?