Pull to refresh

Comments 7

(здесь будет формула F1-меры)

Мне кажется, Вы забыли формулу вставить.

Во всех этих мерах часто есть асимметрия. Если Вам нужно найти на картинке животное, то понятно, что есть positive - животное обнаружено. А если Вам нужно "разграничить" больных и здоровых, что будет positive?

Если нужно разграничить, то согласно общепринятой практики в машинном обучении за 1 или positive ([хотя по мне , корректнее называть целевое значение) принимается наиболее редкое явление, а более частое за 0. Если же обсуждать как выбор порог бинаризации (когда мы здорового считаем здоровым), то это уже тема отдельной статьи, вне данной публикации.Да, и вы верно заметили, что есть всегда ассиметрия, она вообще всегда есть в реальной жизни. Цель именно данной статьи заключается в том, чтобы читатель через визуализацию наиболее легко понял, что "под капотом" в метриках происходит при дисбалансе классов

В формуле F1-меры опечатка, но это не так страшно.
Вопрос: Правильно ли я понимаю, что коэффициент betta в знаменателе означает, что если бы у алгоритма был выбор между увеличением precision в 2 раза и recall в 2 раза, для алгоритма было бы выгоднее выбрать recall (чтобы значение F-меры увеличилось больше)? И чем больше betta, тем более явной будет разница. Получается, в случае дисбаланса классов recall будет важнее?

Sign up to leave a comment.

Articles