Comments 6
Спасибо.
ЗЫ. Вот интересно, плюс статье поставил самым первым, а в закладки поместил шестым.
С точки зрения статистики, это чрезвычайно невероятное событие)
Аннотация значимости - это, конечно, полезно. Но без легенды она понятна только посвященным. Я вот всю жизнь занимаюсь статистикой, но без легенды мне тут не все очевидно. Одна звездочка - это сколько? Почему "ящики" смещены относительно точек? Почему "усы" не симметричны ящикам? Если переменные визуализированы в логарифмической шкале, и она более естественная для этих данных, то, возможно, и статистические критерии тоже надо считать по логарифмам значений, а не по номинальным величинам,
как это, по-видимому, сделано сейчас?
и результатом чего как раз и объясняется та асимметрия, про которую я спросил?
На самом деле этот вопрос совсем не такой простой - какую шкалу, линейную или логарифмическую, правильнее брать за основу. В биологии очень многие величины более естественно считаются именно в логарифмах. Хотя лично моя позиция - что в подобных случаях надо посчитать и эдак, и так, а потом "сравнить разницу" ;-)
В общем: идея с визуализацией на рисунках статистических показателей, безусловно, правильная и полезная (мы в своей программе это делаем с 1990 года, но только вместо условных звездочек пишем цифровые значения). Но сама по себе (в отрыве от более глубокого понимания) она имеет ограниченную полезность. Если вы рисуете графики "для себя" (т.е. для профильного специалиста), то я бы все-таки предпочел хорошо отформатированные цифры, а не условные знаки. Если же картинка предназначена для "начальника-дурака", который "вцифры" не понимает (но финансированием распоряжается), тогда да, увы. Гораздо лучше показать (вручить) ему презентацию с такими значками. Чтобы он мог "сойти за умного" перед еще более "фбиговым" боссом...
Вдогонку: речь про последний рисунок в статье, если что
Добрый день!
Спасибо за развернутый комментарий)
Итак, давайте по порядку.
Во-первых, легенда с расшифровкой звезд представлена чуть выше рисунка. В самом коде график печатается вместе с легендой, человек несведущий точно её не пропустит. Там же выводятся и p-значения.
Во-вторых, обращая внимание на боксплоты, видим, что данные крайне рассредоточены, как раз-таки для их удобного визуального представления использовалась логарифмическая шкала. Из-за рассредоточенности и несбалансированности значений внутри групп присутствует асимметрия. И это достаточно распространенное явление при получении экспериментальных данных при изучении живых объектов. В любом случае описание данных и «ящиков» - это не тема поста, но вопрос Вы задали хороший.
И наконец, что касается показателей: подобного рода
графики необходимы не столько для статистиков, сколько для исследователей,
поэтому чаще всего важна быстрая оценка методов и результата эксперимента. Чем
проще и быстрее его интерпретировать на рисунке, тем лучше, поэтому излишняя
информация здесь ни к чему. Естественно, если у Вас другие цели при
представлении данных, Вы можете выбрать другие параметры в рамках пакета Statannotations.
Простое внедрение аннотаций статистической значимости