Как стать автором
Обновить

Комментарии 4

-- Я проверю бас-фактор этого опенсорсного проекта

-- Теоретический бас-фактор?

-- ...

-- Теоретический, правда?

Извините

Не очень понял метрику: проект становится невыполним, если в отсутствие разработчика/исполнителя нет рабочих материалов ИЛИ документации. Без материалов надо начинать разработку заново, а без документации материалы превращаются в таинственный артефакт, который страшно трогать как напрямую, так опосредованно.

|следующей формуле:
И далее куча непонятных никак не описанных символов.

В вузе нам за такое сразу вкатывали 2 бала и посылали переделывать работу (просто отчтет по лабе или курсовк - не важно), в дипломы такое не пролезало - получали дюлей от руководителя/рецензентов.

Тут либо без формулы объясняйте либо каждый символ в приведенной формуле расшифруйте.

С одной стороны, да. С другой же — ценность всей статьи состоит в ссылке на https://arxiv.org/pdf/1604.06766 и в графиках для известных проектов.

Отвечаю вместо автора цитатой:

Different alternatives could be used as a means for determining authorship <ссылки>. Among those, we chose the degree-of-authorship (DOA) metric <ссылки>, which we normalize after calculation. Given a file f with path fp, the degree-of-authorship of a developer d whose Git user has been mapped to md is given by
DOA(md, fp) = 3.293 + 1.098 × FA(md, fp) + 0.164× DL(md, fp) − 0.321 × ln(1 + AC (md, fp))
From the equation, DOA depends on three factors:
(i) first authorship (FA): if md originally created f, FA is 1; otherwise it is 0;
(ii) number of deliveries (DL): number of changes in f made by md;
(iii) number of acceptances (AC): number of changes in f made by any developer, except md.

The model assumes FA as the strongest predictor of authorship. Recency information (DL) positively contributes to authorship, but with less importance. In contrast, other developers’ changes (AC) decrease one’s DOA, although at a slower pace. The weights we use in the DOA model stem from empirical experiments performed elsewhere.

Заявленные (вполне очевидные, прямолинейно следующие из построения) преимущества модели:

(i) assuming the weights of the model to be general, DOA does not require a training set;
(ii) DOA does not require monitoring editing activities as developers maintain different files;
(iii) instead of considering all developers changing a file as its authors, DOA weights contributions differently, accounting for both changes of a developer in a file (increases DOA), as well as the changes performed by others (decreases DOA).

P.S. Впрочем, я так и не понял, откуда циферки взялись аж с тремя знаками после запятой. Возможно, это обосновывается в одной из ссылок, но в работе выглядит, конечно, странно.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации