Комментарии / Профиль mmx003 / Хабр

Макс@mmx003

CTO DEX

ПрофильСтатьиПостыНовостиКомментарии5

Грейд по коду, а не по трудовой: гибридный анализ репозиториев с помощью GraphCodeBERT и метрик

mmx003 15 фев в 11:40

да, спасибо за ваш труд. будем на связи)

Грейд по коду, а не по трудовой: гибридный анализ репозиториев с помощью GraphCodeBERT и метрик

mmx003 15 фев в 11:33

с блоками тоже не все просто.. блоки постепенно размываются другими людьми, иногда это происходит довольно быстро

Грейд по коду, а не по трудовой: гибридный анализ репозиториев с помощью GraphCodeBERT и метрик

mmx003 15 фев в 10:51

скажи а вот эти репы, которые вы отобрали, написаны одним человеком, одним уровнем ? я вижу 2 проблемы: отбор экспертной выборки, а вторая как выделить код целевого разработчика..
мы разрабатываем продукт по схожей тематике, у нас есть проблема что обычно в проекте работает несколько людей, не всегда сеньер может писать как ему нравится, есть тех долг, другие ограничения.. т.е. в обычном репозитории сидит много людей разного уровня в условиях ограничений проекта..думали над такой задачкой ?

Грейд по коду, а не по трудовой: гибридный анализ репозиториев с помощью GraphCodeBERT и метрик

mmx003 13 фев в 15:37

ясно, немного смутило что GraphCodeBERT не обучался на c# коде и если вы не дообучали модели, результаты могут быть зашумлены. второе, проекты которые вы собирали, должны быть типичными и семантически "равными" что ли. иначе это также может шуметь. например, небольшой проект с простым доменом, никогда не дотянет по уровню наследования к проекту со сложной доменной моделью.

Грейд по коду, а не по трудовой: гибридный анализ репозиториев с помощью GraphCodeBERT и метрик

mmx003 13 фев в 14:56

ваш подход показался интересным, чем вызвано ограничение ? GraphCodeBERT с тренировочным датасетом ?

Информация

Специализация