Pull to refresh

Comments 1

Мне одному кажется, что с применением Баеса у них что-то не так?

Начинаем с формулы:

?(connect to ML Developer|Web Developer) = percentage_cross_edge / percent_web

У них эта вероятность могла бы просто напросто оказаться больше единицы, если (в теоретическом эксперименте) все связи между ML и Web, то есть percentage_cross_edge = 1.

Ну и кроме того, они считают всё по одной цифре percentage_cross_edge, которая не полностью описывает ситуацию - может быть ассимметрия. Скажем (в другом теоретическом эксперименте) ML девелоперы связаны и друг с другом, и с Web, а Web друг-друга игнорируют. Тогда рассчитываемая ими "если человек является веб-разработчиком, вероятность, что связанные с ним люди тоже веб-разработчики" была бы ровно нулём, несмотря на то что percentage_cross_edge могла быть такой же.

Sign up to leave a comment.