ShyDamn5 июн в 09:00

Можно ли поймать вайб-кодера без нейросети? Сделал расширение для GitHub — рассказываю

Простой

14 мин

10K

GitHub * Open source * Программирование * JavaScript * Расширения для браузеров

Кейс

Комментарии 26

Void-Cowboy 5 июн в 09:32

мда

просто мда

я вот лично нарадоваться не могу нейросетям как раз за то, что они быстро и адекватно (!!) напишут тебе документацию по проекту. Буквально 2-3 итерации что бы обсудить черновик и получить удабриваемый результат. А до этого вечно проблема была потому как реадмишку писать это тоже труд, особенно если в процессе меняется и добавляется.

да и коммиты - давно уже привык "не мусорить" в репозитории и изменения ветками что при мерже сплушатся в один коммит, удаляя первоисточник. Из за чего сама репа может иметь 2-3 коммита всего до релиза с огромным количеством изменений и это не вайбкодинг.

Было бы интересно почитать как реально можно отличать слоп (потому как я лично не знаю как можно), статья к сожалению не отвечает на этот вопрос никак. Проверка по верхам, но сейчас даже "дефолтные" кодовые агенты так не делают, если только не попросить специально, а значит детектор погоду покажет

SerafimArts 5 июн в 11:37

Поставил. Мой полностью написанный руками код получил 10/100 (похоже на human). А соседний проект, который пишется (не мной) в основном через ИИ получил 20/100 (похоже на human).

Проверил ещё на нескольких разных репозиториях и везде цифра прыгает от 10 до 20 (похоже на human), причём не взирая на то, пишется ли код через ИИ или руками.

Кажется даже подобная эвристика тоже не очень хорошо работает, если надо вычленять не очевидный ИИ-слоп, а просто детектить использование инструментов.

P.S. Ну и непонятен критерий “Преждевременный devops/tooling-обвес у молодого репо”, который детектит исключительно .editorconfig (который обычно копипастится ctrl+c -> ctrl+v) полностью игнорируя все остальные инструменты.

ShyDamn 5 июн в 13:32

Можете пожалуйста репо прислать? Я проанализирую. В ЛС или сюда, если не секрет

fUS1ONd 12 июн в 07:26

На моем репо вообще 9 баллов набралось, а у него клод в контрибьюторах))

ShyDamn 14 июн в 21:02

Добрый вечер, проверьте пожалуйста обновлённый пакет v0.5.0

SerafimArts 14 июн в 23:50

Теперь полностью ручной код выдаёт 90 из 100 (похоже на человека), а ИИ 64 из 100 (скорее человек)

DamirMur 5 июн в 11:55

Копал экскаватором, а потом написал что лопатой.

ilya_chch 5 июн в 13:04

https://github.com/ilyachch/django-rest-framework-rusdoc. 19/100 похоже на human (хотя 98-99% вручную)

“Преждевременный devops/tooling-обвес у молодого репо”. а что тогда не молодой репозиторий, если это сообщение для 9 летнего репозитория?
“AI-коммиттеры: github-actions[bot]” - тоже под вопросом. у меня автоматика создает PR-ы, которые я разруливаю руками.

https://github.com/ilyachch/github-actions-version-check. 21/100 похоже на human (около 80% через AI)

поинт про Отсутствует: topics, homepage мне не очень понятен.

в целом, затея интересная, метрики имеют смысл, но надо тюнить

ShyDamn 5 июн в 13:32

Спасибо, учту это при релизе v 0.4

ilya_chch 5 июн в 14:34

Я думаю, конкретно github-actions[bot] стоит убрать из признаков AI. Все-таки AI это Copilot.

По поводу Отсутствует: topics, homepage - кажется, homepage, если мы говорим об одном и том же, у маленького репозитория - это скорее очко в пользу AI.

topics я вообще очень редко вижу, независимо от того, что это за репа (у того же cpython, например)

Про структуру README - сомнительно. Ведь есть шаблоны. А вот emoji и тире - это прям да.

ShyDamn 5 июн в 19:40

Спасибо :)

ShyDamn 14 июн в 21:02

Добрый вечер, проверьте пожалуйста обновлённый пакет v0.5.0

danilovmy 5 июн в 13:26

Ещё до запуска понял. Я ai:

Микро Readmi с оглавлением и переходами. Потому, как шаблон репозитория.
Полный Набор организационных файлов, потому, как шаблон.
Объем реадми больше кода, потому как это демо... С шаблоном разумеется.
Обьемный initial commit. Пачкой прям.
Несколько правочных коммитов сразу после initial.
Иногда сиротское репо... Потому, как шаблон забыл.

Я не попал в человеки по 70% замечаний.

И только даты создания в 2017-2021 подсказали бы, что, скорее всего, это был человек. Но нет...

P. S. Я это к тому, что в статье много субъективной оценки. Как сказали выше - надо "тюнить"

ShyDamn 5 июн в 13:33

Спасибо, учту это

ShyDamn 14 июн в 21:01

Пришлите пожалуйста ссылку на репозиторий и проверьте обновлённый пакет v0.5.0

danilovmy 15 июн в 09:04

https://github.com/danilovmy, новый пакет не проверял.

Мне кажется, что срабатываний будет много, поскольку среднестатистический человеческий (skinbag) пакет из 201xх, на чем учились модели, как раз включает все те замечания, что выдает AI репозиторий.

ale007xd 6 июн в 04:20

Забавно, репо топикстартера даёт 39/100, мой репо написанный практически полностью АИ: 14/100. Я не понимаю цель таких исследований, кроме самоутверждения. Вроде как доказано, что АИ умеет писать код и даже недавно был отчёт антропик вроде про это. В общем, снёс расширение. Но за опыт спасибо

ShyDamn 14 июн в 21:01

Пришлите пожалуйста ссылку на репозиторий и проверьте обновлённый пакет v0.5.0

kochetkov-ma 6 июн в 06:20

Программные правила не будут работать потому что они собраны по принципу : мне кажется, что это признак АИ репы. Единственный вариант - это собирать реально размеченный корпус данных по написанному руками коду и через АИ и обучить нейронку. А если меня будут зват Claude C и я буду соавтором, то мой репозиторий автоматом превратится в сгенерированный? Я в рабочей почте неделю думал, что мне приходит спам он Атропик, пока не выяснил что Claude C это просто один из коллег.

ShyDamn 6 июн в 11:00

Не думал об этом, спасибо

dire_foxy 7 июн в 20:22

Так даже если будет четко по метрикам отрабатывать, какой смысл от проекта? Readme сильно удобнее писать с ии'шкой, так как та со структурой проекта напишет вполне внятно, а там ручками дорабатывай, да и в целом получается этакий выстрел себе в колено.

ShyDamn 14 июн в 21:01

Проект отделяет чисто AI-README от остального проекта. Если только README написан ИИ, то проект и выдаст "ИИ README, остальное - человек"

alexvitorossi 8 июн в 07:02

Я частенько сам пишу ридми в рабочих репозиториях, а потом говорю аишке: проверь правописание, пунктуацию и оформи текст. Она исправляет опечатки, расставляет знаки препинания, которые мне было просто лень поставить (в том числе пресловутые длинные тире). Получается, мои ридми теперь «аишные»? А «идеальная» структура или стандартизированные подписи коммитов - это тоже обязательно признак ии, а не перфекционизма разработчика или привычка, выработанная за годы работы в компании со строгими правилами оформления?

То же самое с большим инит коммитом. Получается странная история: если я что-то разрабатывал, допустим, в своём селфхостед гитлабе, а потом решил, что довёл проект до состояния, когда его уже не стыдно показать людям, и выложил на гитхаб одним коммитом - я тоже ии?

Задумка интересная, но люди слишком разные, чтобы некоторые подходы можно было считать однозначными маркерами использования ии.

SerafimArts 9 июн в 09:43

То же самое с большим инит коммитом. Получается странная история: если я что-то разрабатывал, допустим, в своём селфхостед гитлабе, а потом решил, что довёл проект до состояния, когда его уже не стыдно показать людям, и выложил на гитхаб одним коммитом - я тоже ии?

Вот тут странно, зачем выкладывать 1им коммитом, если проще просто git push сделать и залить всю историю? Я бы ещё понял если бы с mercurial на git переезжали или с тьфу-тьфу-тьфу SVN…

TokSeven 9 июн в 17:39

Идеальные conventional commits. Сто процентов сообщений вида feat:, fix:, chore:, docs:. Подозрительно — потому что реальные люди забывают, ленятся, делают опечатки.

Плотность длинного тире (—). Сами по себе тире — не сигнал, но AI ставит их в десять раз чаще среднего разработчика. Высокая плотность — индикатор.

Кхъ

Получается, я — не человек

ShyDamn 14 июн в 21:00

Пришлите пожалуйста ссылку на репозиторий и проверьте обновлённый пакет v0.5.0

Зарегистрируйтесь на Хабре, чтобы оставить комментарий