Как стать автором
Обновить

ML алгоритм нашел баг в моем коде…

Время на прочтение1 мин
Количество просмотров6.4K
Автор оригинала: Joel Einbinder

Я играл с языковой моделью SalesForce CodeGen. Она генерирует новый код по подсказкам. Но я хотел посмотреть, как она будет анализировать уже написанный код.

Я попросил модель посмотреть на существующий код и оценить вероятность появления каждого слова с учетом предыдущих слов. Далее я сравнил вероятность появления моего слова с вероятностью слова предсказанного моделью

Я взял один из файлов моего проекта. Яркость отражает маловероятность каждого слова. Красный цвет показывает, насколько более вероятен токен модели.

Зеленый - Алгоритм не уверен, но не может предложить другого более вероятного варианта,

Красный - Алгоритм может предложить другой вариант, которое ему больше нравится.
Серый - Алгоритм ничего не изменил

Хотя сами комментарии являются сюрпризом для алгоритма, краснота вокруг них уменьшилась. За исключением оператора return, который очень сильно выделяется на фоне остальных токенов.

Как оказалось, в моем коде была ошибка. Когда listener события удаляется во время dispatch, я возвращаюсь из функции. Алгоритм же правильно предлагает continue, вместо return.

Теперь этот алгоритм можно использовать для регулярной проверки моего кода.

Еще больше примеров использования ML в современных сервисах можно посмотреть в моем телеграм канале. Я пишу про ML, стартапы и релокацию в UK для IT специалистов.

Теги:
Хабы:
Всего голосов 17: ↑4 и ↓13-9
Комментарии2

Публикации

Истории

Работа

Python разработчик
119 вакансий
Data Scientist
54 вакансии

Ближайшие события

One day offer от ВСК
Дата16 – 17 мая
Время09:00 – 18:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн
Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область