В статью действительно закралась одна серьёзная неточность. Неочевидная. Её заметили несколько человек. Но благодарен я больше всего пользователю didkovskyi.
Он не стал размахивать совой на глобусе, обвинять меня в намеренной подгонке данных, и пытаться перечислить все шершавости текста (а куда же без них?). Он сфокусировался на главном, задав один-единственный простой вопрос:
Не совсем понял, почему массу топлива в ракете отнесли к полезной нагрузке.
И вот тут я, попытавшись сформулировать ответ, разглядел, наконец, эту неоднозначность в незамутнённом виде.
Есть два разных Q. И они очень похожи.
Первое, Q1, характеризует экономическую эффективность системы. Оно равно массе груза к сухой массе ТС. Без топлива. Почему без? Потому что именно в таком рассмотрении вырисовывается сильная закономерность Q = 1. Со страшной силой. Вероятность случайного совпадения — на уровне 10-300. Можно выкинуть конвейерную ленту, подозрительные электрокары, ракеты и ещё половину точек — всё равно p-value остаётся астрономически ничтожным. Спрашивать, почему мы смотрим именно без топлива — это все равно что требовать у Ома, чтобы он не ток от напряжения мерял, а что-то другое. Именно там возникает закономерность. Видимо, «так устроена природа». Впрочем, очень хорошее, на мой взгляд, объяснение феномену предложилsanta324.
И есть другое Q, назовем его Q2. Оно характеризует способность системы выдерживать механическую нагрузку. Равно весу груза плюс топлива, деленным на mg, где m — маса сухой конструкции.
Для подавляющего большинства транспортных средств Q1 ≈ Q2 ≈ 1. Именно это сходство не позволило ни мне, ни десятку человек, которых я просил вычитать и «разбомбить» статью перед публикацией, заметить неоднозначность. И потребовались тысячи читателей Хабра, чтобы обратить на неё внимание.
Существенная разница возникает именно у ракет. Из-за массы топлива. Так, у первой ступени Протона Q1 — это масса всех заправленных вышестоящих ступеней плюс ПН, к сухой массе ступени. Где-то 7.7. А вот Q2 действительно зашкаливает за 34.
И здесь встаёт вопрос: так к какому же Q применимы полученные формулы стоимости?
Я утверждаю, что к Q2. Именно им определяется способность системы держать нагрузки, а значит, и инженерная сложность.
Простой мысленный эксперимент. Вот Вы — конструктор первой ступени Протона. Есть два варианта нагрузки, на которую её нужно рассчитывать:
а) Q1, нагрузка 240 тонн (только верхние ступени).
б) Q2, нагрузка 1068 тонн (вес верхних ступеней и топлива, да с учётом перегрузки)
Очевидно, что если выбрать Q1, то ракета не то что никуда не улетит, а просто порвётся на этапе заправки топливом. Значит, конструировать её надо под значительно большую нагрузку Q2. С соответствующими инженерными трудностями и более высокой стоимостью.
Сумируем:
1. Q1 характеризует экономическую эффективность транспортного средства, Q2 — инженерную стоимость.
2. Для большинства человеческих ТС Q1 ≈ Q2 ≈ 1.
3. Однако у ракет Q1 ≈ 1, Q2 — несколько десятков.
3. У первых ступеней ракет Q1 ≈ 3-10, Q2 — несколько десятков. Последним и определяется (в значительной степени) их высокая стоимость.
Это, надеюсь, разрешает противоречие по ракетам, на которое с разной степенью отчётливости пытались указать умные люди.
Впрочем… я тут подумал. Вот более простой способ проиллюстрировать идею.
15 точек (столько же, сколько у нас классов). У точек логарифм грузоподъёмности линейно зависит от логарифма массы. Но — добавлен разный уровень шума s. От s = ±0.5 порядка и выше. Это в точности эквивалентно разбросу Q в 10s раз.
Проведём через каждую группу линию и посчитаем, какова же вероятность того, что данные точки сложились в эту линию (или, возможно, лучшую) при разных уровнях разброса Q.
±0.5 порядка (т.е. полуширина отклонения от единицы до 3-х раз::
Вероятность, что это случайность — 1.9*10-11
±2 порядка (т.е. полуширина отклонения от единицы до 100 раз):
Вероятность, что это случайность — 1.3*10-5. Уже можно задуматься.
±7 порядков:
Полный шум (p = 0.47)
Т.е. видно, что отклонения Q от единицы раз эдак до тридцати даже выводов не ломают.
Эх… «привези мне, батюшка, чудо-юдище для утех сексуальных» (анекдот про аленький цветочек). Пойдём сложным путём.
Вот распределение F = dN/dLog10(m) логарифмов масс ТС в данной работе:
(Логарифм десятичный, масса в килограммах)
Вот, аналогично, распределение G = dN/dLog10(Load) логарифмов нагрузок:
Их характерная полуширина — 3-4 порядка. Характерная, т.е. не зависящая от наличия единичных машин для перевозки атомов, и даже от включения/исключения класса электрокаров, на котором часть народа выше так сфокусировалась ))
Логарифм Q есть логарифм отношения L/m, то есть разница логарифмов масс и грузоподъёмностей. Характерная полуширина этой разницы — вообще порядков 10.
Вопрос. Дано два независимых распределения F(x) и G(y). Какова будет функция распределения величины x — y? Ответ: это свёртка функций F(x) и G(-y).
Т.е., распределение логарифма Q — это свёртка распределений логарифма масс F и
минус-логарифма грузоподъёмности G. Если, конечно, между первым и вторым нет связи.
Какова характерная полуширина этой свёртки? Можно, конечно, посчитать точно, но для не слишком экзотических распределений она — примерно половина ширины распределения F(m) — G(m). Т.е., примерно 5 порядков. Опять же, характерная, т.е. не зависящая от единичных примеров/выпадов. Важно также помнить, что операция свёртки вообще имеет тенденцию «замыливать и обезличивать» входные функции, устраняя особенности вроде сильных пиков или далёких выбросов.
Итак, если m и L(oad) никак не связаны, следует ожидать, что распределение величины Log(Q) будет чем-то колоколоподобным с полушириной около 5 порядков.
Мы наблюдаем нечто колоколоподобное, но с полушириной в 0.5 порядка.
Какова вероятность, что подобная «узкая» выборка образовалась случайно в то время как мы ожидаем «широкую»? Считаем хи-статистику, смотрим по таблицам вероятность, что результат — случайность. Я этого не делал, но поверьте, в данном случае она астрономически мала.
И будет мала, пока наблюдаемая характерная полуширина логарифма Q не достигнет хотя бы половины полуширины каждого из распределений, т.е. эдак 1.5-2 порядков. Можно посчитать точно, при необходимости. Но при такой колоссальной разнице ожидаемого «независимого» и реально наблюдаемого распределения в этом нет нужды, статистика заменяется здравым смыслом.
У танкера нефть давит изнутри на корпус. Этому давлению противостоит давление внешней воды. Оно снимает значительную часть нагрузки, которую иначе пришлось бы выдерживать прочному корпусу и, таким образом, позволяет сделать его легче.
У дирижабля груз размещён снаружи. Покажите мне, как воздух облегчает структурную нагрузку на корпус в этом случае (и делает его легче)?
Автор их сознательно исключил ибо они не попадают в теорию
Трудности с делением 24 на 15? Q = 1.6 получится. Где непопадание?
Сравните это с диапазоном 10-5....105, который бы наблюдался, если бы массы и грузоподъёмности действительно абсолютно не зависели друг от друга (диапазон и тех, и других — от 102 до 107 килограмм).
Вот у нас есть транспортные средства с массами от 100 до 107 килограмм. И есть грузоподъёмности примерно в том же диапазоне. Предположим, что эти величины полностью друг от друга независимы. Тогда, если мы начнём вычислять величину Q, то где-то 300 кг поделятся на 900 тонн, а где-то 2000 тонн на 5 тонн (поскольку связи нет, пары значений для каждого средства случайны). В итоге значения Q будут разбросаны от 10-5 до 105. Это и есть ожидаемый диапазон разброса для «нулевой гипотезы» об отсутствии связи между массой и грузоподъёмностью. С ним надо сравнивать, когда мы выясняем, тяготеет ли Q к чему-то.
Реальный разброс — от 0.3 до 3.5. То есть, в 100 тысяч раз меньше теоретически возможного. На этом фоне отклонение от единицы в 2-3 раза, очевидно, настолько ничтожно, что «нулевую гипотезу» приходится с треском отбросить.
Вот мне тоже на первый взгляд кажется, что не должно быть корректно. А Q всё равно у всех более-менее одинаковый. Что и удивительно. Видимо, есть какие-то общие причины, несмотря на настолько разную природу транспорта. (Кстати, тут вот подумалось: какая-нибудь канатная дорога, что тащит груз в гору, тоже вряд ли же имеет Q = 0.03 или 30. Надо бы поискать цифры).
Про танкеры я написал в разделе о данных, Вы, видимо, не обратили внимание. Значительная часть нагрузки танкера воспринимается окружающим морем. Сухопутным аналогом этого был бы грузовик с внешними подпорками, чтобы борта не разваливались. Но таких нет.
В целом же — было бы интересно взглянуть на данные.
Мы считаем Q не совсем для Протона, а только для его первой ступени. Это имеет смысл, т.к. первые ступени являются практически самостоятельными транспортными средствами (а Titan II, например, теоретически вообще мог выйти на орбиту одной первой ступенью).
При вычислении Q нас в первую очередь интересует инжереная сложность противостоящей нагрузке конструкции (топливо ей не противостоит и ничего почти не стоит). Какой нагрузке противостоит первая ступень? Свой стартовый вес, вес топлива, и вес всего, что сверху, всё это с учётом перегрузки. Делим это на сухую массу ступени (именно она всё это держит). И делим на g (исключительно чтобы оперировать безразмерным параметром).
Ох, вопрос «вес или масса» меня чуть не съел при написании этой статьи. Потому что, на самом деле, нужно ни то, ни другое. Мы же хотим измерить выдерживаемую конструкцией нагрузку по отношении к её массе. Но так, чтобы было безразмерно. Так что более-менее точным определением будет Q = «вес груза, делённый на сухую массу конструкции, и делённый на g». В тексте решил не усложнять, но, похоже, зря: многих эта неоднозначность сбила с толку.
Я подходил к вопросу просто. В справочнике написано «4 тонны»? Значит, люди, которые грузовик делали (и которые лучше меня в нём разбираются), уже учли особенности коробки передач и составили картину типичных условий эксплуатации. Для которых получается 4 тонны и такое-то Q.
Разумеется, опытный водитель (равно как, кстати, и правильное распределение груза) этот справочный предел превысить может. Но… опытный водитель дополнительных денег стоит ))
В статью действительно закралась одна серьёзная неточность. Неочевидная. Её заметили несколько человек. Но благодарен я больше всего пользователю didkovskyi.
Он не стал размахивать совой на глобусе, обвинять меня в намеренной подгонке данных, и пытаться перечислить все шершавости текста (а куда же без них?). Он сфокусировался на главном, задав один-единственный простой вопрос:
И вот тут я, попытавшись сформулировать ответ, разглядел, наконец, эту неоднозначность в незамутнённом виде.
Есть два разных Q. И они очень похожи.
Первое, Q1, характеризует экономическую эффективность системы. Оно равно массе груза к сухой массе ТС. Без топлива. Почему без? Потому что именно в таком рассмотрении вырисовывается сильная закономерность Q = 1. Со страшной силой. Вероятность случайного совпадения — на уровне 10-300. Можно выкинуть конвейерную ленту, подозрительные электрокары, ракеты и ещё половину точек — всё равно p-value остаётся астрономически ничтожным. Спрашивать, почему мы смотрим именно без топлива — это все равно что требовать у Ома, чтобы он не ток от напряжения мерял, а что-то другое. Именно там возникает закономерность. Видимо, «так устроена природа». Впрочем, очень хорошее, на мой взгляд, объяснение феномену предложил santa324.
И есть другое Q, назовем его Q2. Оно характеризует способность системы выдерживать механическую нагрузку. Равно весу груза плюс топлива, деленным на mg, где m — маса сухой конструкции.
Для подавляющего большинства транспортных средств Q1 ≈ Q2 ≈ 1. Именно это сходство не позволило ни мне, ни десятку человек, которых я просил вычитать и «разбомбить» статью перед публикацией, заметить неоднозначность. И потребовались тысячи читателей Хабра, чтобы обратить на неё внимание.
Существенная разница возникает именно у ракет. Из-за массы топлива. Так, у первой ступени Протона Q1 — это масса всех заправленных вышестоящих ступеней плюс ПН, к сухой массе ступени. Где-то 7.7. А вот Q2 действительно зашкаливает за 34.
И здесь встаёт вопрос: так к какому же Q применимы полученные формулы стоимости?
Я утверждаю, что к Q2. Именно им определяется способность системы держать нагрузки, а значит, и инженерная сложность.
Простой мысленный эксперимент. Вот Вы — конструктор первой ступени Протона. Есть два варианта нагрузки, на которую её нужно рассчитывать:
а) Q1, нагрузка 240 тонн (только верхние ступени).
б) Q2, нагрузка 1068 тонн (вес верхних ступеней и топлива, да с учётом перегрузки)
Очевидно, что если выбрать Q1, то ракета не то что никуда не улетит, а просто порвётся на этапе заправки топливом. Значит, конструировать её надо под значительно большую нагрузку Q2. С соответствующими инженерными трудностями и более высокой стоимостью.
Сумируем:
1. Q1 характеризует экономическую эффективность транспортного средства, Q2 — инженерную стоимость.
2. Для большинства человеческих ТС Q1 ≈ Q2 ≈ 1.
3. Однако у ракет Q1 ≈ 1, Q2 — несколько десятков.
3. У первых ступеней ракет Q1 ≈ 3-10, Q2 — несколько десятков. Последним и определяется (в значительной степени) их высокая стоимость.
Это, надеюсь, разрешает противоречие по ракетам, на которое с разной степенью отчётливости пытались указать умные люди.
15 точек (столько же, сколько у нас классов). У точек логарифм грузоподъёмности линейно зависит от логарифма массы. Но — добавлен разный уровень шума s. От s = ±0.5 порядка и выше. Это в точности эквивалентно разбросу Q в 10s раз.
Проведём через каждую группу линию и посчитаем, какова же вероятность того, что данные точки сложились в эту линию (или, возможно, лучшую) при разных уровнях разброса Q.
±0.5 порядка (т.е. полуширина отклонения от единицы до 3-х раз::
Вероятность, что это случайность — 1.9*10-11
±2 порядка (т.е. полуширина отклонения от единицы до 100 раз):
Вероятность, что это случайность — 1.3*10-5. Уже можно задуматься.
±7 порядков:
Полный шум (p = 0.47)
Т.е. видно, что отклонения Q от единицы раз эдак до тридцати даже выводов не ломают.
Вот распределение F = dN/dLog10(m) логарифмов масс ТС в данной работе:
(Логарифм десятичный, масса в килограммах)
Вот, аналогично, распределение G = dN/dLog10(Load) логарифмов нагрузок:
Их характерная полуширина — 3-4 порядка. Характерная, т.е. не зависящая от наличия единичных машин для перевозки атомов, и даже от включения/исключения класса электрокаров, на котором часть народа выше так сфокусировалась ))
Логарифм Q есть логарифм отношения L/m, то есть разница логарифмов масс и грузоподъёмностей. Характерная полуширина этой разницы — вообще порядков 10.
Вопрос. Дано два независимых распределения F(x) и G(y). Какова будет функция распределения величины x — y? Ответ: это свёртка функций F(x) и G(-y).
Т.е., распределение логарифма Q — это свёртка распределений логарифма масс F и
минус-логарифма грузоподъёмности G. Если, конечно, между первым и вторым нет связи.
Какова характерная полуширина этой свёртки? Можно, конечно, посчитать точно, но для не слишком экзотических распределений она — примерно половина ширины распределения F(m) — G(m). Т.е., примерно 5 порядков. Опять же, характерная, т.е. не зависящая от единичных примеров/выпадов. Важно также помнить, что операция свёртки вообще имеет тенденцию «замыливать и обезличивать» входные функции, устраняя особенности вроде сильных пиков или далёких выбросов.
Итак, если m и L(oad) никак не связаны, следует ожидать, что распределение величины Log(Q) будет чем-то колоколоподобным с полушириной около 5 порядков.
Мы наблюдаем нечто колоколоподобное, но с полушириной в 0.5 порядка.
Какова вероятность, что подобная «узкая» выборка образовалась случайно в то время как мы ожидаем «широкую»? Считаем хи-статистику, смотрим по таблицам вероятность, что результат — случайность. Я этого не делал, но поверьте, в данном случае она астрономически мала.
И будет мала, пока наблюдаемая характерная полуширина логарифма Q не достигнет хотя бы половины полуширины каждого из распределений, т.е. эдак 1.5-2 порядков. Можно посчитать точно, при необходимости. Но при такой колоссальной разнице ожидаемого «независимого» и реально наблюдаемого распределения в этом нет нужды, статистика заменяется здравым смыслом.
У дирижабля груз размещён снаружи. Покажите мне, как воздух облегчает структурную нагрузку на корпус в этом случае (и делает его легче)?
Трудности с делением 24 на 15? Q = 1.6 получится. Где непопадание?
Сравните это с диапазоном 10-5....105, который бы наблюдался, если бы массы и грузоподъёмности действительно абсолютно не зависели друг от друга (диапазон и тех, и других — от 102 до 107 килограмм).
Вот у нас есть транспортные средства с массами от 100 до 107 килограмм. И есть грузоподъёмности примерно в том же диапазоне. Предположим, что эти величины полностью друг от друга независимы. Тогда, если мы начнём вычислять величину Q, то где-то 300 кг поделятся на 900 тонн, а где-то 2000 тонн на 5 тонн (поскольку связи нет, пары значений для каждого средства случайны). В итоге значения Q будут разбросаны от 10-5 до 105. Это и есть ожидаемый диапазон разброса для «нулевой гипотезы» об отсутствии связи между массой и грузоподъёмностью. С ним надо сравнивать, когда мы выясняем, тяготеет ли Q к чему-то.
Реальный разброс — от 0.3 до 3.5. То есть, в 100 тысяч раз меньше теоретически возможного. На этом фоне отклонение от единицы в 2-3 раза, очевидно, настолько ничтожно, что «нулевую гипотезу» приходится с треском отбросить.
В целом же — было бы интересно взглянуть на данные.
При вычислении Q нас в первую очередь интересует инжереная сложность противостоящей нагрузке конструкции (топливо ей не противостоит и ничего почти не стоит). Какой нагрузке противостоит первая ступень? Свой стартовый вес, вес топлива, и вес всего, что сверху, всё это с учётом перегрузки. Делим это на сухую массу ступени (именно она всё это держит). И делим на g (исключительно чтобы оперировать безразмерным параметром).
А плот — интересный вопрос. Плоты в природе ведь естественным путём иногда образуются. Это транспортное средство не совсем сделано человеком )
Разумеется, опытный водитель (равно как, кстати, и правильное распределение груза) этот справочный предел превысить может. Но… опытный водитель дополнительных денег стоит ))