Как стать автором
Обновить

Комментарии 16

Терминологическая поправка: буржуйское population в смысле статистики на русском называется не популяцией, а генеральной совокупностью.

Честно говоря меня тоже одолевали сомнения, хотелось в одно слово перевести.

Популяция, Выборка, Ошибка первого рода, Ошибка второго рода, Синхрофазотрон… Не статья, а конспект едва ли не целого семестра по математической статистике. Никому, кроме (бывших) слушателей этих лекций, она понятна не будет.

Как, впрочем, и многим бывшим слушателям.
както все скомканно.

Это преувеличение. Те, кто занимаются случайными выборками имеют представление о предмете. Те же, кто первый раз в этим сталкивается, могут не понять о чем идет речь. Готов подсказать, если есть интерес, но непонятно кое-что.

Я не понаслышке знаком с обработкой случайных выборок и разработке математических моделей на основании результатов анализа. Дисперсия, критерий Стьюдента, СКО для меня не пустой звук. Но Ваше определение доверительного интервала вынудило меня приостановить чтение в этом месте и перечитать его ещё раз. Нет, я понял, что Вы имели ввиду, но определение написано очень, простите, заумно, и никогда Вы таким определением не объясните простому обывателю, что такое «доверительный интервал».

Думаю, что простому обывателю в самом деле будет непонятно. Я написал это по следам практической задачи, которую мне пришлось решать, и это скорее для тех, у кого подобная задача имеется.

Было бы неплохо разобрать и сделать несколько вводных лекций по следам этой лекции
Я чего-то не понимаю или как среднее арифметическое из выборки: 10, 9, 5, 5, 1, 2, 1 может быть 1.636364? Ведь (10+9+5+5+1+2+1) / 7 = 4.714

Таблица означает следующее:


  • 10 ловушек с 0 насекомыми:
  • 9 ловушек с 1 насекомым
  • 5 — с 2,
  • 5 — с 3
  • 1 — с 4
  • 2 — с 5
  • 1 — с 6

получается 54 экземпляра делить на 33 ловушки.

А, теперь понятно. Хорошо бы описание колонок таблицы указать, так как я подумал, что заголовок колонки — это номер ловушки, а значение — количество насекомых внутри.

Спасибо, добавил описание полей.

А что за переменная b в четвертой строчке первого блока кода:


> x <- read.table("/tmp/tcounts.txt")
> y = unlist(x, use.names="false")
> 
> z <- c(b)
> mean(z)
[1] 1.636364
> mean(z);sd(z)
[1] 1.636364
[1] 1.654883

Получается переменная z никак не связана с x и y?

Да, это опечатка, спасибо что заметили. На самом деле z даже не нужно.


> x <- read.table("/tmp/tcounts.txt")
> y = unlist(x, use.names="false")
> mean(y);sd(y)
[1] 1.636364
[1] 1.654883
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации