@Andrey2008 Dec 21 2024 at 08:23

PVS-Studio соответствует требованиям ГОСТ Р 71207—2024 (статический анализ программного обеспечения)

Hard

71 min

2.5K

PVS-Studio corporate blogC# * C++ * Java * Information Security *

Review

+18

Comments 59

@MaxAkaAltmer Dec 21 2024 at 15:24

ГОСТ... соответствие... хм... паразитировать на госбюджете задумали?

@GidraVydra Dec 21 2024 at 19:40

А что на нем ещë делать? Госбюджет паразитирует на людях, люди паразитируют на госбюджете, смыть, повторить.

@Andrey2008 Dec 21 2024 at 20:13

Странные мысли. Мы 15 лет успешно разрабатываем и продаём PVS-Studio без всяких ГОСТ. Однако, раз уж стандарт появился, странно не обратить на это внимание и не доработать напильником PVS-Studio, чтобы ему соответствовать. Благо хоть это и потребовало несколько месяцев доработок, ничего сверх особенного не пришлось делать. Анализатор уже был мощен, просто нужно было например, классифицировать предупреждения по типу перечисленным там критических ошибок. Естественно такой классификации в инструменте до ГОСТ не существовало и не могло существовать.

@MaxAkaAltmer Dec 22 2024 at 00:57

Какие ГОСТы, такие и мысли, просто так ГОСТы не делают, значит это кому-то нужно. Да и в поиске данный ГОСТ коррелирует только с PVS-Studio, ГОСТируют только вещи планируемые к регулировке со стороны государства - зачем регулировать разработку подобной штуки? Затем чтобы применять ее в госсекторе. Как применять ее в госсекторе? Наверное навязывать всем разработчикам задействованным в госсекторе и выполняющим госзаказы.

@EvgeniyRyzhkov Dec 22 2024 at 04:46

ИМХО

Имею мнение - хрен оспоришь.

@MaxAkaAltmer Dec 22 2024 at 05:23

Cui bono?

@EvgeniyRyzhkov Dec 22 2024 at 05:26

Да ты как дед ворчишь и ворчишь. Остановись уже, если не в теме.

@MaxAkaAltmer Dec 22 2024 at 05:32

Наверное я прав, раз так нервничаешь?
Лучше быть дедом, чем быть в вашей "теме" с радужными единорожками ))

@SIISII Dec 22 2024 at 18:54

А ещё -- хрен откажусь :)

@Andrey2008 Dec 22 2024 at 07:15

ГОСТ на болты

... ГОСТируют только вещи планируемые к регулировке со стороны государства - зачем регулировать разработку подобной штуки? Затем чтобы применять ее в госсекторе. Как применять ее в госсекторе? Наверное навязывать всем разработчикам задействованным в госсекторе и выполняющим госзаказы...

А я думал, чтобы болты с гайками сходились :)

Прочитай ГОСТ :) Там совершенно адекватные вещи про улучшение процессор разработки ПО. Если не понятна актуальность, что могло быть не так со статическим анализом, то некоторые моменты я здесь разбирал.

@WASD1 Dec 21 2024 at 21:57

Хороший статический анализатор (насколько видел их статьи). Увеличивает качество ПО, от внедрения в разработку.

Теперь госуха связанная ГОСТ-ами может его использовать. Это хорошо.

К чему язвительные комментарии - с технической точки зрения мне совсем не понятно.

@MaxAkaAltmer Dec 22 2024 at 01:30

Один из лучших, хотя большие языковые модели уже на пятки наступают.
И без ГОСТов могли использовать.
Да, так - смотрю во что данный подход от 1С вылилися и сколько ресурсов и сил впустую тратится людьми, печально все это... Потом дойдет до того, что будут обновлять и гонять по кругу варнинги в двояких ситуациях и будут заставлять их править, и штрафы, штрафы, штрафы... )

@EvgeniyRyzhkov Dec 22 2024 at 04:46

Так и вижу: "ЧатГПТ, проверь этот код на соответствие ГОСТ..."

@MaxAkaAltmer Dec 22 2024 at 05:13

Что-то подобное, я уже слышал, когда говорил вам, что поддерживать нужно не только MSVS и плюсы. Еще через десять лет никуда не денетесь - прикрутите нейронки )

@EvgeniyRyzhkov Dec 22 2024 at 05:15

Так все есть давно. И другие системы, и другие языки. Не понимаю коммент.

@MaxAkaAltmer Dec 22 2024 at 05:28

Когда я предложил, не было и тоже посмеялись, а потом все равно сделали. Чего не понятного?

@EvgeniyRyzhkov Dec 22 2024 at 05:29

Не посмеялись, а было "не время". Потом время настало и сделали. Так и тут. Все сделаем.

@EvgeniyRyzhkov Dec 22 2024 at 05:30

В следующем году кстати ещё несколько языков планируем поддержать. Приходи к нам на работу может опять? Как в старые добрые?

@MaxAkaAltmer Dec 22 2024 at 05:33

Ну уж нет уж.

@alan008 Dec 22 2024 at 14:25

А какие языки, если не секрет? Древние и склонные к наличию багов в коде (типа PHP или Python) или набирающие популярность современные (типа Dart, Rust, Kotlin или что-то в этом духе)?

@EvgeniyRyzhkov Dec 22 2024 at 14:27

Да вот решаем пока. Есть варианты. Какие хочется?

@AnthonyMikh Dec 22 2024 at 19:08

Для Rust было бы неплохо. Есть Clippy, но там, ЕМНИП, нет никаких кросс-функциональных вариантов анализа, только в пределах одной функции. Ну и некоторые ошибки, которые PVS-studio детектирует, от языка слабо зависят (вроде V6004)

@Protos Dec 23 2024 at 08:17

Delphi 7 есть несколько лямов строк, а SAST нет

@alan008 Dec 23 2024 at 10:17

Мне? Это будет нерепрезентативно. Ну, допустим, Pascal/Delphi.

А если смотреть по популярности и потенциально "бажности" экосистемы, то наверно Python, PHP или Ruby, но вторые два уже "устаревающие".

Если по современным, то наверно Go или Rust, но у меня нет совершенно никакой статистики, что там со статическим анализом и багами в целом.

О, решение на 100% - 1С :-D

@AnthonyMikh Dec 22 2024 at 19:05

хотя большие языковые модели уже на пятки наступают

Они никогда не заменят статические анализаторы, потому что:
а) никакая модель, какой бы навороченной она бы не была, не может диагностировать паттерны ошибок, которых не было в обучающих данных, и добавить новое правило в анализатор проще, чем дообучать модель на многих примерах.
б) LLM склонны к галлюцинациям, причём довольно убедительно выглядящим, а от качественного статанализатора ждут низкого false positive rate.

Ну да, опыт показывает, что они ещё и просто криво работают.

@MaxAkaAltmer Dec 22 2024 at 20:49

Никогда не говори никогда. Добавить правило можно и через контекст уже сейчас.

Опыт показывает, что они развиваются гораздо быстрее, чем вы описываете свой опыт - GPT3 - модель слабая, уже есть гораздо более продвинутые.

@EvgeniyRyzhkov Dec 22 2024 at 01:59

Максим, привет! Рад тебя видеть! И приятно осознавать, что бывшие сотрудники даже через 10 лет следят за делами компании. Значит мы не зря работаем.

Не пойму только зачем занудствуешь? Ты вроде бодрый парень был всегда. А комментарий как будто мимо подъезда прошел.

@MaxAkaAltmer Dec 22 2024 at 02:28

Привет, как ту мимо пройдешь, если на каждом углу нудите про поддержку ГОСТа ?

@EvgeniyRyzhkov Dec 22 2024 at 02:32

Клиенты просят - как отказать?

А ты давай выключай нудеж. Не дед же.

@AndronNSK Dec 21 2024 at 15:43

Какая ужасно длинная статья...

Прогонял я свои проекты, пока была лицензия в конторе. Думал, щас натравлю, и все проблемы сразу решатся.

Натравил, а в результатах... Ничего. Ни одного значимого предупреждения.

Зато если запустить санитайзер gcc, вот он вдоволь срабатывает.

@andnotor Dec 21 2024 at 18:38

Может тут другой бизнес? выпустить ГОСТ, впихнуть требование выполнения этого ГОСТ везде где сможешь и дальше фактически за лицензионный сбор снимать это требование 🤣🤣 В общем это не про анализ и ошибки 🤷 Встречался с таким подходом в иных сферах 🤷 Хороший бизнес ;) но тоже надо уметь 🤣🤣

@Andrey2008 Dec 21 2024 at 20:21

Это не так работает. Сейчас в целом идёт тренд на стандартизацию и регулирование процессов безопасной разработки ПО. ГОСТ про статический анализ – это небольшая часть этого процесса. Будут вводиться новые требования и стандарты. Например, буквально вчера 20.12.2024 введён в действие обновлённая версия ГОСТ Р 56939-2024 – Защита информации. Разработка безопасного программного обеспечения. Общие требования.

@MihailP86 Dec 22 2024 at 03:54

Вы просто хотите принудительных денег с клиентов, которых обяжут покупать ПО соответствующего этому ГОСТу. Вы рады ибо вам теперь не надо напрягатся и искать клиентов самим, государство само вам их приведет и принудит купить у вас анализатор.

@EvgeniyRyzhkov Dec 22 2024 at 03:57

Когда под статьёй на 70 минут чтения, прочитал коммент, что теперь не надо напрягаться....

Картинку сами найдёте в мемах.

@Andrey2008 Dec 21 2024 at 20:15

Гм.. Раз была лицензия в конторе, так быть может основные ошибки уже были исправлены? :) Ну или вариант, код уже был качественным, что тоже бывает.

@AndronNSK Dec 22 2024 at 06:23

В моем проекте, в котором я лид, который я начинал с пустого репозитория, без моего ведома этого произойти не могло.

Насчёт качественного. Ну вот после этого я и задумался, что есть качественный код, видимо для исполнения этого критерия достаточно отсутствия ошибок копипасты, перепутывания = с == и подобного.

@AnthonyMikh Dec 22 2024 at 19:11

Зато если запустить санитайзер gcc, вот он вдоволь срабатывает.

Если вы именно санитайзер имели в виду, то тут как раз нет ничего удивительного: статические анализаторы и динамические детектируют разные баги, с довольно небольшим пересечением.

@AndronNSK Dec 22 2024 at 19:22

Спасибо, Кэп.

@mimicria Dec 22 2024 at 04:02

Привет. А планируете участвовать в анонсированных ФСТЭК испытаниях средств статического анализа?

@EvgeniyRyzhkov Dec 22 2024 at 04:07

А на этот вопрос коллеги ответят в понедельник с фактурой уже. Знаю, что весь год работаем в этом направлении. Но не хочу ляпнуть мимо чего-то.

@Andrey2008 Dec 22 2024 at 07:57

Над этим начинанием пока не работаем, так как собственно как я понимаю совсем недавно прозвучало в анонсах задач ФСТЭК на 2025-2030 год. Я думаю, имеется в виду доклад от ФСТЭК про совершенствование безопасности системного ПО, где говорилось про "развитие набора квалифицированных тестов для инструментов жизненного цикла безопасного ПО". Примем мы какое-то участие во всём этом пока не понятно. Мы просто не знаем, как и что будет.

Другое дело, что мы уже поработали и продолжим работу над лучшим соответствием критерием, изложенным в ГОСТ. Добавим новые детекторы для выявления критических ошибок, можно поработать над анализом косвенных вызовов и так далее.

@mimicria Dec 25 2024 at 06:39

Добрый день. Речь идёт о вот этом выступлении на конференции ИСП РАН

https://vkvideo.ru/video-214485707_456239018?t=3h39m50s&ref_domain=isprasopen.ru

@Andrey2008 Dec 25 2024 at 07:25

Да. Я про него и подумал :)

@EvgeniyRyzhkov Dec 22 2024 at 04:06

Люблю комментарии на Хабре. Сто лет не общался здесь, а все как раньше. Если ты не уверен в том, что делаешь, то тебе напихают полную панамку комментариев. И ты можешь дать слабину и засомневаться в себе.

Хорошо что мы знаем, что делаем. И готовы спокойно делать то, что нужно нашим клиентам. А не слушать людей из интернета.

@alan008 Dec 22 2024 at 14:32

Тут народ просто слишком хорошо умеет в технологии, но не всегда умеет в бизнес. ГОСТ это больше про бизнес, и лишь отчасти про технологии. Это начинает задевать самолюбие тех, кто ещё не всё понял про бизнес в РФ, насколько сильно он захвачен крупными компаниями, иногда в связке с гос структурами (см Ланит и тп). А в целом, если у отличного инструмента PVS Studio появятся новые заказчики, пусть и гос, это же отлично, так что всем, кто выше написал "какие вы нехорошие, раз у вас такие методы продвижения", останется только утереться (или учиться на вашем примере, как надо правильно продвигаться).

@EvgeniyRyzhkov Dec 22 2024 at 14:45

Спасибо за поддержку!

@PrinceKorwin Dec 23 2024 at 07:31

если у отличного инструмента PVS Studio появятся новые заказчики, пусть и гос, это же отлично

Знаю минимум три компании которые умерли после того как связались с гос заказчиками.

Но надеюсь, что PVS Studio эта участь не коснётся.

@winwood Dec 23 2024 at 20:32

К сожалению, PVS-Studio спотыкается на простых примерах. Передача неинициализированной переменной по ссылке или указателю приводит к ложноотрицательному результату.

#include <iostream>
void foo(int& value)
{
    value *= value;
}
int main()
{
    int a;
    foo(a);
    std::cout << a;
    return 0;
}

@Andrey2008 Dec 23 2024 at 20:45

Видел аналогичный вопрос на stackoverflow про Cppcheck (название топика: Why are pointers difficult for static analysis even in simple cases). И пример там схожий был и Cppcheck аналогично баг не находил. Сейчас топик удалён. Не Вы случаем были? :)

А ответ, это не совсем простой пример, как может казаться со стороны. Знаем про такое, будем со временем дорабатывать.

@winwood Dec 23 2024 at 21:12

Cppcheck именно с этим примером справляется. И нет, раньше я этим вопросом не задавался. Только сегодня решил сделать простые примеры для студентов на п.6.5 ГОСТ 71207 и столкнулся с тем, что в моих примерах из десятка строк анализаторы ничего не находят.

@Andrey2008 Dec 23 2024 at 21:30

Кстати, с синтетическими тестами надо быть аккуратными :) Помню была у меня одна старая заметка: Почему я не люблю синтетические тесты. :)

@MaxAkaAltmer Dec 23 2024 at 21:40

Подозреваю, что до полной аналитической интерпретации синтаксического дерева дело не дошло и вряд ли дойдет, поскольку это накладно, а эвристики спотыкаются.
Зато нейросеть без проблем справляется (взял llama-3.3-70b-instruct, хотя запустить ее дома пока еще тоже довольно накладно =):

Привет, проведи пожалуйста статический анализ кода ниже и дай список предупреждений:

....код выше....

Ответ:

Вот список предупреждений, полученных после статического анализа кода:

Неинициализированная переменная: Переменная a не инициализирована перед передачей в функцию foo(). Это может привести к неопределённому поведению, поскольку функция foo() использует значение a в вычислениях.
Неопределённое поведение: Поскольку a не инициализирована, результат операции value *= value также неопределён. Это может привести к непредсказуемым результатам при выводе значения a в main().
Отсутствие проверки ошибок: Функция foo() не проверяет, является ли входной аргумент допустимым (например, не является ли он NaN или бесконечным). Хотя в данном случае это не критично, в более сложных сценариях отсутствие проверок может привести к ошибкам.
Нет проверки на переполнение: Если a инициализирована большим значением, операция value *= value может привести к переполнению, что приведёт к неопределённому поведению.

@KanuTaH Dec 23 2024 at 21:53

Ну так-то тот же clang analyzer, даже довольно древний, вполне справляется с этим примером:

$ scan-build make
scan-build: Using '/usr/bin/clang-8.exe' for static analysis
/usr/bin/../libexec/c++-analyzer -o tst tst.cpp
tst.cpp:4:11: warning: The left expression of the compound assignment is an uninitialized value. The computed value will also be garbage
    value *= value;
    ~~~~~ ^
1 warning generated.
scan-build: 1 bug found.
scan-build: Run 'scan-view /tmp/scan-build-2024-12-24-005215-1797-1' to examine bug reports.

Отсутствие проверки ошибок: Функция foo() не проверяет, является ли входной аргумент допустимым (например, не является ли он NaN или бесконечным). Хотя в данном случае это не критично, в более сложных сценариях отсутствие проверок может привести к ошибкам.

Типичный пример галлюцинаций LLM, ну какой к черту NaN или бесконечность у int, что он несет вообще.

@MaxAkaAltmer Dec 23 2024 at 21:59

Да, ляпнула она лишнего, но не все сразу, к тому же она далеко не из самых продвинутых, просто взял из тех, что полностью открыты.

chatgpt-4o-latest-20241120 уже лучше выдал, но он закрытый:

Ключевые предупреждения:

Использование неинициализированной переменной (int a).
Отсутствие проверки на переполнение в операции value *= value.
Отсутствие поясняющих комментариев.
Возможное улучшение читаемости кода (добавление проверок и переименование функции).

gemini-2.0-flash-thinking-exp-1219 совсем краток:

Предупреждения:

Использование неинициализированной переменной ...

@Andrey2008 Dec 23 2024 at 21:59

Многословно слишком, NaN какой-то приплетён... Кстати, ради интереса напиши, что если попробовать как-то так сделать:

#define INT static int
#include <iostream>
void foo(int& value)
{
    value *= value;
}
int main()
{
    INT a;
    foo(a);
    std::cout << a;
    return 0;
}

@MaxAkaAltmer Dec 23 2024 at 22:17

Вывод предупреждений

Переменная a не инициализирована явно — рекомендуется инициализировать её значением 0.
Использование макроса #define INT — плохая практика, лучше использовать typedef или using.
Передача потенциально неинициализированного значения по ссылке — хотя здесь UB нет из-за статического контекста, рекомендуется явная инициализация.

@KanuTaH Dec 23 2024 at 22:48

Использование макроса #define INT — плохая практика, лучше использовать typedef или using.

Плохая практика - это конечно все здорово, но только ни typedef ни using в данном случае не годятся.

Передача потенциально неинициализированного значения по ссылке — хотя здесь UB нет из-за статического контекста, рекомендуется явная инициализация.

Забавная формулировка - "потенциально неинициализированного". Здесь никаких "потенциально" нет, а переменная однозначно инициализирована. Итого одна более-менее полезная диагностика из трех, я бы сказал, да и та по большому счету вкусовщина, относящаяся скорее к coding conventions, чем непосредственно к корректности кода.

@Andrey2008 Aug 8 at 21:09

Продолжение истории про жизнь ГОСТ Р 71207—2024:

@Andrey2008 Aug 8 at 21:16

Некоторые уточнения про список критических ошибок, а заодно, как их фильтровать: Фильтрация предупреждений PVS-Studio, выявляющих критические ошибки (согласно классификации ГОСТ Р 71207-2024)