Как стать автором
Обновить

ML алгоритм нашел баг в моем коде…

Время на прочтение1 мин
Количество просмотров6.5K
Автор оригинала: Joel Einbinder

Я играл с языковой моделью SalesForce CodeGen. Она генерирует новый код по подсказкам. Но я хотел посмотреть, как она будет анализировать уже написанный код.

Я попросил модель посмотреть на существующий код и оценить вероятность появления каждого слова с учетом предыдущих слов. Далее я сравнил вероятность появления моего слова с вероятностью слова предсказанного моделью

Я взял один из файлов моего проекта. Яркость отражает маловероятность каждого слова. Красный цвет показывает, насколько более вероятен токен модели.

Зеленый - Алгоритм не уверен, но не может предложить другого более вероятного варианта,

Красный - Алгоритм может предложить другой вариант, которое ему больше нравится.
Серый - Алгоритм ничего не изменил

Хотя сами комментарии являются сюрпризом для алгоритма, краснота вокруг них уменьшилась. За исключением оператора return, который очень сильно выделяется на фоне остальных токенов.

Как оказалось, в моем коде была ошибка. Когда listener события удаляется во время dispatch, я возвращаюсь из функции. Алгоритм же правильно предлагает continue, вместо return.

Теперь этот алгоритм можно использовать для регулярной проверки моего кода.

Еще больше примеров использования ML в современных сервисах можно посмотреть в моем телеграм канале. Я пишу про ML, стартапы и релокацию в UK для IT специалистов.

Теги:
Хабы:
Всего голосов 17: ↑4 и ↓13-9
Комментарии2

Публикации

Истории

Работа

Python разработчик
196 вакансий
Data Scientist
92 вакансии

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн
10 – 11 октября
HR IT & Team Lead конференция «Битва за IT-таланты»
МоскваОнлайн
25 октября
Конференция по росту продуктов EGC’24
МоскваОнлайн
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн