Как стать автором
Обновить

Обработка результатов статистических наблюдений с помощью толерантных интервалов

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров3.4K
Всего голосов 13: ↑13 и ↓0+13
Комментарии10

Комментарии 10

>>буду рад вашему мнению и замечаниям

О себе

Подписан на статьи по словам "Forth, Демосцена, Математика, Ненормальное программирование".

О содержании

Вижу, Ваша статья хорошая, проработанная. Однако, её не читал, хотя и пробовал: форма отбивает желание. Отсюда и не ставил оценок.

О форме

"Толерантных интервалов", "доверительными интервалами", "квантиль" - на людей, понимающих математику эти т.н. "термины" действуют как стоп-лист. Ведь, как Вы сами расшифровываете, т.н. "квантиль" - "представляет собой границу". Для чего забивать голову некими "новыми" терминами, коль есть устоявшиеся, общеизвестные? К примеру, чем Вам не угодили термины "верхняя/нижняя граница", либо "асимпотота"? (А открыть т.н. "Википедию" - "источник знаний" "обо всём" "ото всех" - так для этого большого ума не нужно. Полагаю, она для того и создана.)

И т.н. "определение" т.н. "толерантных интервалов" там есть.

Вопрос: следует ли "строгать" новый термин под частный случай?! Где обоснование, такого решения? ("кто-то где-то в какой-то книге написал" - слабый аргумент). Отсюда для аудитории знающей и любящей математику - Ваша статья проходит мимо.

Что до любителей "модных словечек" - так содержание статьи им до "одного места". И, поверьте, это место - не голова. Их интересы: "бабло", "тачки" и "власть". Поэтому статья опять проходит мимо (не "заметят" и не "оценят").

Отсюда вывод: для данной статьи аудитории нет. Либо, что то же самое, её прочтут единицы, а поймут - ещё менее. Статью ждёт забвение.

О времени

Есть время, когда можно и "вашим и нашим". Есть время, - когда это просто необходимо. Но сейчас время не то. Просто определитесь с кем Вы и для кого пишете. И идите этим путём. Поверьте, любителей "толерантных интервалов" - предостаточно. Но для них математика - лишь фетиш: сегодня одно модное словцо, а завтра - другое. :)

ММ

Здравствуйте. Отвечу по порядку:

  1. По поводу новых терминов, таких как «квантиль», «доверительный интервал» - термины общеизвестны и являются устоявшимися в академической среде, упоминаются в ГОСТах, например, в [1]. Квантиль и процентиль упоминается [2] в работе Карла Пирсона, что датируется 1916 годом, может быть есть и более ранние упоминания - искать не стал.

  2. По поводу модных слов. Понятия «толерантный интервал», «доля накрытия» - также в соответствии с ГОСТ [3] из каталога национальных стандартов Российской Федерации, видимо все из-за того, что там много любителей "модных словечек".

  3. По поводу Википедии. Информацией Википедию наполняют пользователи - люди, которые, возможно, тоже прочитали "какие-то" книги "каких-то" авторов. По поводу того, что считать авторитетным источником - выбор каждого.

  4. Про аудиторию, любящую и знающую математику. В каждой научной области есть устоявшаяся терминология, которая служит для более удобного и лаконичного изъяснения между соответствующими специалистами, придерживаться ее или нет - также личное дело каждого. Мое мнение - для любителей математики (или науки в целом) незнакомая терминология не помеха.

На этом, пожалуй, все. В любом случае, спасибо за обратную связь!

Источники:

[1] Правила определения и методы расчета статистических характеристик по выборочным данным. Часть 1. Нормальное распределение.

[2] Tables for statisticians and biometricians : Pearson, Karl, Cambridge University Press, 1916, page 28.

[3] Статистические методы. Статистическое представление данных. Часть 6 Определение статистических толерантных интервалов.

А я вот прочитал с большим интересом, особенно последний пример (я закончил физтех, у нас был семестр статистики, но весьма рудиментарный). Я работаю в области неразрушающего контроля и есть сценарии, кода детали проверяются лишь частично, исходя из статистической вероятости появления дефектов литья, пример в статье во многом с этим перекликается. В чём-то предыдущий оратор прав — статья довольно быстро уйдёт с главной хабра и её таки ждёт определённое "забвение", но совсем она не исчезнет, и найдутся люди, которые её найдут, и которым она будет полезна, как мне. Ссылки также весьма ценные, я с удовольствием полистал вчера вечером Кендалла и Стюарта, так что "автор, пиши ещё".

Здравствуйте! Спасибо большое за проявленный интерес. Рад, что статья оказалась полезной.

По поводу забвения - на мой взгляд, ничего страшного в этом и нет, что-то приходит, что-то уходит. Как говорил де Тревиль в романе Александра Дюма - се ля ви = )

фр. c'est la vie - такова жизнь.

Появится время - постараюсь поделиться чем-нибудь еще. Желаю творческих успехов и всего доброго)

"Не читал, но не нравится", - круче некуда.

Немного не так. "Пробовал прочесть, но отказался от дальнейшего чтения с обоснованием почему". Так вернее. :)

Не совсем понял, чем "толерантный доверительный интервал" отличается от обычного доверительного интервала?

Здравствуйте. Коротко говоря: доверительный интервал - интервал для оценки параметра распределения, в таком случае уровень доверия - доля всех возможных значений параметра внутри интервала; толерантный интервал - интервал для самого распределения, содержит в себе его определенную часть.

По поводу границ. Как мне кажется, если мы строим доверительный интервал, то мы ищем границы функции плотности распределения оценки (назовем ее f_{1}) истинного параметра некоторого распределения f_{2}. Когда мы говорим о толерантном интервале - мы ищем границы функции плотности распределения исходных случайных чисел (то есть, самого распределения f_{2}, а не распределения его оценки).

Таким образом, просто оба этих интервала находятся в разных пространствах. Поскольку доверительный интервал - для конкретного значения, то обходятся одним параметром - уровнем доверия; в случае интервала не для числа, а для одномерного распределения (то есть в случае толерантного интервала) размерность пространства становится больше - к уровню доверия добавляется второй параметр - доля распределения, о которой делается наш вывод.

Надеюсь, что ничего особо не напутал и что-то смог объяснить)

Толерантный интервал интервал определяется "достаточной статистикой". А достаточной статистики может не существовать в принципе.

Здравствуйте. Да, та формулировка, которая из Википедии, - про толерантные интервалы для параметризованных распределений. Для их построения, действительно, необходимо наличие достаточных статистик.

Еще есть понятие «свободных от распределений толерантных интервалов», подробнее можно почитать у Кендалла [4] . Про них ничего не могу сказать, сам еще не применял.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории