Как стать автором
Обновить

Как мы обучали LLM для поиска уязвимостей в смарт-контрактах Solidity

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.6K
Всего голосов 19: ↑19 и ↓0+22
Комментарии3
1

Комментарии 3

Наша команда в Positive Technologies 

и

приемлемый вариант, который мы могли позволить себе для обучения на ноутбуке

Извини, может я чего не понимаю, но !!!ИЗВЕСТНАЯ ИБ КОМПАНИЯ!!! для своих рабочих задач дообучает модель LLM на своих данных, используя !!!НОУТБУК!!! ???
Я бы понял, если бы это была твоя личная инициатива, ты тип такой: "Йо-хо-хо, я тут решил использовать LLM для поиска уязвимостей в смарт-контрактах, поэтому дообучил модель на своем рабочем ноуте! Свистать всех наверх!"
Почему нельзя было у компании выделить облачные ресурсы для обучения? Это ведь для рабочих задач... Компания развивает новое направление, и для этого выделяет ресурсы. Логично? - Да.
Стандартная практикав компаниях? - Да.
Данные приватные? - Так какая разница, занимаешься ты этим на своем рабочем пк от компании, или на таких же серверах, от той же компании?
Почему нельзя было пойти и попросить выделить сервак с 64 гб памяти, какой-нибудь мощной видюхой и пойти свободно обучать там?

На этом моменте дочитал дальше и...
> Если код приватный, обратиться к ChatGPT для аудита не получится.

> но затем перешли на Google Colab с видеокартой Tesla 16 ГБ

Ты, ****, серьёзно? То есть закидывать приватный код в чат - это ты делишься с компанией этим кодом, и такой подход не рекомендуется. А закидывать те же приватные данные в колаб - это: "Да кому они там нужны будут? Всё нормально!"

Я бы понял, если бы это была твоя личная инициатива, ты тип такой: "Йо-хо-хо, я тут решил использовать LLM для поиска уязвимостей в смарт-контрактах, поэтому дообучил модель на своем рабочем ноуте! Свистать всех наверх!"

Почти так и было :D

Это экспериментальный, побочный проект, посмотреть получится или нет, у нас очень много экспериментальных направлений. Ресурсы компании естественно можно расходовать, когда есть какие-то результаты. Изначально была только идея.

Ты, ****, серьёзно? То есть закидывать приватный код в чат - это ты делишься с компанией этим кодом, и такой подход не рекомендуется. А закидывать те же приватные данные в колаб - это: "Да кому они там нужны будут? Всё нормально!"

Так данные для дообучения и инференса использовались публичные, даже ссылка в статье есть, пожалуйста, скачивайте и делитесь с кем хотите. Единственное что их нужно отфильтровать и распарсить.

Почти личная инициатива - Ну, окей.

Данные публичные - Так ты в самом начале вроде писал, что отказался от ChatGPT, так как:
> Но было одно большое но: ChatGPT подходит только для публичных данных. Если код приватный, обратиться к ChatGPT для аудита не получится.

Вот я и подумал что вы там какой-то пока ещё приватный код тестите.
Ну, а вообще задумка норм. Просто вот эти моменты как-то глаза мне порезали.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий