Как стать автором
Обновить

Комментарии 5

Я так понимаю вся проблема в том, что мат. ожидание и дисперсия однозначно характеризуют набор данных только при условии что распределение этих данных моделируется нормальным распределением, в остальных случаях этих метрик недостаточно, но про это часто забывают.
Даже нельзя сказать, что они (метрики) однозначно характеризуют набор данных. То есть эти метрики дают свернутую оценку, которая в некоторых случаях может, а иногда и должна трактоваться по разному, как в квартете Энскомба. Я тут специально, допустил предположение, что все четыре распределения находятся в разных подпространствах пятимерного массива. Как вариант различия мат.ожиданий и дисперсий, потому что это физически разные показатели, но по паспорту они однофамильцы.
Не могу сказать, что люди об этом забывают.
Вот если взять, по рисунку 8, точку с вектором (8;8;8;8), то ее отклик должен быть у(8;8;8;8) =(3+0,5*8)+ 0,5*((1^2+1^2+1^2+1^2)^0,5)=8.
И этот отклик определяется свойствами пространства, а не функции.
В принципе, самому это взорвало мозг, но это геометрия.
Тут возникает другой еще аспект. Очень часто при анализе, несколько БД из различных источников, объединяют в одну и потом анализируют этот ряд. И это очень похоже на следующую ситуацию: Ведут информационный канал в 100 мбит/с из А в Б, и монтажникам не хватило кабеля. Тогда они нехватку метража, заменили кабелем в 50 мбит/с.
Так и при слиянии БД, если не проверить и согласовать их размерности у потребителя будет возникать шум.
Вот и нашли новый вид деятельности дата-сайнсам. Теперь, только они, должны объединять БД. Нужно еще сюда какое нибудь преобразование, типа преобразование Фурье, интегрировать. И тогда з/п, меньше чем 300k, даже не рассматривать :)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории