Comments 2
>where round_div<5 order by round_div desc limit 1
Вы не смотрели в сторону карт Шухарта, чтобы не на глаз определять границы шума?
Спасибо, нужно посмотреть!
Я долго думал как найти механизм, который будет думать за меня - к сожалению, не нашел - в любом случае нужны вводные.
Вопрос : а чем карты Шухарта качественно лучше stddev?
В данном случае - вводные - допустимая граница шума.
Зарпос из статьи на самом деле выдает больше показателей по результатам теста, если добавить к нему еще уровень аналитики, то можно выбирать приемлемый уровень шума по соотношению : кол-во отсева/кол-во шума.
Когда начали применять это на практике - нашли еще один интересный вывод : данные слишком разнятся. Где-то 5% - это нормально, а где-то 5% - это слишком дорого, т.к. дисперсия очень большая.
Например, средний джиттер по больнице - считается с 5% шума на 34 игровых сессиях, а вот средний раундтрип с 5% шума - не менее чем на 1500 сессиях :)
Поиск стат. значимости в BigQuery или удаление шума