Andrey2008 6 фев 2017 в 11:36

Почему я не люблю синтетические тесты

5 мин

20K

Блог компании PVS-StudioИнформационная безопасность*C++*C*

+87

194

Комментарии 194

meduzik 6 фев 2017 в 12:03

Два приведенных примера с разыменованием NULL и rand — неопределенное поведение в стандарте. То есть компилятор в полном праве выкинуть их из кода (или заменить на еще какую-нибудь ерунду). Соответственно, на мой взгляд, статический анализатор должен предупреждать об этом, даже если пользователь что-то там имел в виду и написал *NULL сознательно. Просто потому, что пользователь в данном случае не прав.

Ситуация, когда анализатор может быть "немного прав", не выдавая предупреждение — если он точно знает, что в конкретном компиляторе, который используется для сборки кода, данная ситуация является определенной и документированной. И даже в этом случае, у анализатора должна быть уверенность, что это проект не собирается одновременно еще и другим компилятором (скажем, приведенный код находится в #ifdef _MSC_VER блоке), или в следующей версии поведение не изменят. Осуществляет ли PVS-Studio подобные проверки?

Andrey2008 6 фев 2017 в 12:36

Не понял суть вопроса. Анализатор находит ошибки, в том числе и неопределенное поведение. Однако в нем есть много исключений, когда определенные паттерны кода он считает допустимыми. Здесь дело практики. Можно сколько угодно рассуждать о потенциальной корректности/некорректности, но если ругаться на такие ситуации никто спасибо всё равно не скажет, так как люди пишут такой код осознанно. Более того, будут просить избавить их от ненужных предупреждений.

meduzik 6 фев 2017 в 12:48

Вот что clang делает вместо разыменовывания нулевого указателя, если записать его немного по разному: https://godbolt.org/g/NiJXiL. Замечу, делает на практике, а не в теории. На сколько из этих функций ваш анализатор выдаст предпреждение о неопределенном поведении?

Andrey2008 6 фев 2017 в 14:27

На какие-то ругнется, на какие-то нет. Не проверял. Поймите, что Вы тоже написали те-же самые бессмысленные синтетические тесты :). Анализатор будет на них сознательно молчать. Вредно ругаться на такой код. На практике в 99,9% случаев (то есть, всегда), такой код написан сознательно и все равно не угадаешь, что хотел человек. И даже не важно, есть там volatile или нет. Быть может человек хочет словить исключение. А быть может проверяет, будет исключении или нет. А быть может это микроконтроллер, где действительно надо записать по нулевому указателю. В любом случае это код написан сознательно. Случайно он получиться не может. Ну нельзя ошибиться, назвав функцию null1 и явно разменивать в ней 0. :) Да ещё комментарий рядом "//invalid opcode". А мы кстати подобные комментарии тоже иногда учитываем.

meduzik 6 фев 2017 в 14:47

Это — бессмысленный, неверный (в языке С и С++) код, который не должен появляться в программе. Что бы программист не думал, что бы он не писал в комментарии рядом, разыменование нулевого указателя всегда будет ошибкой, до тех пор пока у компилятора нет флага вроде --define-null-pointer-dereference-semantics.

В любом случае это код написан сознательно. Случайно он получиться не может.

Если я вас правильно понял, вы ищете только опечатки, но не ошибки по незнанию или непониманию языка, с которым программист работает. В таком случае, не стоит говорить, что ваш анализатор "в 10 раз лучше" — у вас разные цели и вывод в оригинальной статье абсолютно верный.

SvyatoslavMC 6 фев 2017 в 14:52

Не только опечатки, смотрите табличку.

khim 6 фев 2017 в 18:49

Что бы программист не думал, что бы он не писал в комментарии рядом, разыменование нулевого указателя всегда будет ошибкой, до тех пор пока у компилятора нет флага вроде --define-null-pointer-dereference-semantics.

Тот факт, что вы не знаете как флаг называется не означает, что его нет. Да, такой флаг, конечно же, есть, только называется он -fno-delete-null-pointer-checks. Обратите, кстати, внимание на то, что на AVR и CR16 (это как раз микроконтроллеры, о которых речь шла выше) эта опция включена по умолчанию.

meduzik 6 фев 2017 в 19:00

За ссылку на опцию спасибо, с микроконтроллерами работать не довелось. Но про то, что такого флага нет — я не говорил. Посмотрите, пожалуйста, первое мое сообщение. Я спрашивал, проверяет ли PVS-Studio, что имеет дело с ситуацией, когда поведение в этом случае документировано, или же эвристика глобальная. Судя по ответам Andrey2008 — таких проверок нет.

Andrey2008 6 фев 2017 в 19:33

Это эвристика, которой достаточно с практической точки зрения.

Antervis 6 фев 2017 в 15:01

а если программист просто забыл инициализировать указатель?

Andrey2008 6 фев 2017 в 15:04

Где и что он здесь забыл??? :-D

void null1()
{
  *(int*)0 = 1;
}

Antervis 6 фев 2017 в 15:12

мало ли

char *buff = nullptr;
if (...) {
  buff = new int[size];
} else {
  // забыл
}
return buff[5] + buff[6];

zagayevskiy 6 фев 2017 в 15:47

А кто вам сказал, что они на это не будут кидать ворнингов?

НЛО прилетело и опубликовало эту надпись здесь

Andrey2008 6 фев 2017 в 16:46

Наличие Null в названии является необходимым, но недостаточным условием. Ещё должно быть присваивание 0 и его разыменование в соседней строчке. Вероятность такого события стремится к нулю и лучше не ругаться.

Я понимаю, что всегда можно придумать теоретический вариант, где анализатор даст сбой и не выдаст полезное срабатывание. Но это не интересно с практической точки зрения. Ещё раз повторю пример с двойными скобками: if ((a = b)). Да, здесь может быть ошибка. Но ругаться здесь не следует. И таким паттернов тьма и хороший анализатор должен их учитывать.

Lachezis 6 фев 2017 в 17:17

Вероятность такого события стремится к нулю и лучше не ругаться.
Очень спорное утверждение для статического анализатора.

Lachezis 6 фев 2017 в 17:21

Конечно, ложные срабатывания очень нервируют, но я лучше самостоятельно проверю их чем буду надеятся на эвристику самого анализатора.

khim 6 фев 2017 в 18:56

Впервые встречаю мазохиста, который хочет разрбираться в сотнях сообщений об ошибках на каждую строчку программы.

Супер-программа

#include <iostream>

уже содержит сотни «подозрительных» мест, которые, формально, нарушают стандарт. И далеко не все они специальным образом помечены.

А как только вы напишите ещё что-то, что реально инстанциирует всю эту машинерию — сразу получите ещё кучу сообщений.

Вы, вообще, свой код хотя бы через все -Wall -Wextra -Wxxx (которых десятки НЕ включены ни в -Wall, ни в -Wextra именно чтобы не заваливать пользователя кучей сообщений) прогоняете? Или ваша любовь к статическим анализаторам сугубо платоническая?

Lachezis 6 фев 2017 в 19:13

Я удивляюсь как вы не определили цвет обоев в моем офисе, они красные если вам интересно.

Естественно я не хочу что бы анализатор кидал сообщение на каждый чих, но инструмент становится менее предсказуем когда начинает додумывать за программиста в спорных моментах.

Andrey2008 6 фев 2017 в 19:35

Естественно я не хочу что бы анализатор кидал сообщение на каждый чих

Это Вы зря… :)

Lachezis 6 фев 2017 в 19:42

Везде нужен баланc :)

Andrey2008 6 фев 2017 в 20:03

Ой. Это я не так понял комментарий! Ааа не читайте мой комментарий. Мне показалось, что я отвечаю на «Естественно я хочу что бы анализатор кидал сообщение на каждый чих».

DarkEld3r 6 фев 2017 в 19:36

Ну уж стандартные хедеры можно и исключать из анализа?

khim 6 фев 2017 в 20:56

Нельзя. В стандартных хедерах — туева хуча макросов и inline-функций, если вы всё это проигнорируете, то кучу вещей можете не заметить.

DarkEld3r 6 фев 2017 в 22:21

Можно пример? Потому что мне кажется, что у статического анализатора есть достаточный контекст, чтобы понимать когда надо ругаться на стандартные штуки, а когда нет.

Andrey2008 6 фев 2017 в 22:25

На системные заголовочные файлы мы не ругаемся. А вот #define, да, это сущности, которые генерируют шум и надо обучать анализатор распознавать определённые паттерны. С макросами связана часть исключений.

meduzik 6 фев 2017 в 13:00

Про rand я был не прав, я согласен с вами, что сам тест неверен. Можно придумать (очень извращенный, но корректный) пример его использования в соответствии со стандартом:

void null_pointer_006 ()
{
  int *p;
  p = (int *)(intptr_t)rand();
  *p = 1; /*Tool should detect this line as error*/
          /*ERROR:NULL pointer dereference*/
}

void foo(){
    int* mem = new int(0);
    for ( int i = 0; ; i++ ){
        srand(i);
        if ( (intptr_t)rand() == (intptr_t)mem ){
            srand(i);
            null_pointer_006();
        }
    }
}

mayorovp 6 фев 2017 в 13:00

Из-за UB оптимизатор имеет право считать, к примеру, содержимое по нулевому адресу неиспользуемым (не специально, а в результате случайного совпадения нескольких эвристик). В итоге код, который должен был по задумке падать с ошибкой — корректно завершится!

В приведенном вами реальном примере эту проблему обошли через volatile. А код из синтетического теста я бы все же посчитал ошибочным.

UPD: выше об этом уже написали, и со ссылкой. Как я и предполагал, надо обязательно добавлять volatile(что довольно очевидно) и надо обязательно использовать запись вместо чтения (что совсем не очевидно)

Andrey2008 6 фев 2017 в 14:30

Вот только невозможно угадать что хотел автор. Быть может он как раз хотело узнать ведёт себя код одинаково с volatile или нет. Я серьезно. Я насмотрелся удивительнейших проверок в коде. Даже в духе if (sizeof(int) != sizeof(unsigned int)). Поэтому я и говорю, что лучше всего молчать. Это уроки практики.

Antervis 6 фев 2017 в 15:07

Даже в духе if (sizeof(int) != sizeof(unsigned int))

так они не обязаны быть равны. Где-то sizeof(unsigned int) == 8, sizeof(int) == 4

znsoft 6 фев 2017 в 17:51

Ого, а можно реальный кейс когда они не равны? Я не гуру, поэтому интересно.

ruzzz 6 фев 2017 в 19:29

Да больше на бред похоже, unsigned перепутали с long. Иначе буду сильно удивлен.

Andrey2008 6 фев 2017 в 19:37

Ой, да ладно. Я даже где-то и if (sizeof(char) == 1) видел. Вы не поверите, какие программисты творческие натуры.

splav_asv 6 фев 2017 в 21:47

Исходники раритетного Word, если память не изменяет. Это в те времена, когда соответствие компиляторов стандартам оставляло желать много лучшего, чем сейчас.

beeruser 14 мар 2017 в 22:23

«On some targets such as TMS320C2000, TMS320C3000, and TMS320C5000, the size of
a char on the target (16 or 32 bits) differs from the size of a byte on the host (8 bits).»

http://www.ti.com/lit/an/spra757/spra757.pdf

splav_asv 14 мар 2017 в 23:07

C11:

6.5.3.4 The sizeof operator
…
3 When applied to an operand that has type char, unsigned char or signed char (or a qualified version thereof) the result is 1.

В C89 аналогично. Так что, даже если размер char 16 бит, не понятно, что должен возвращать sizeof. С одной стороны размер в байтах, с другой для char строго 1.

khim 14 мар 2017 в 23:08

Тем не менее даже там «sizeof(char) == 1». Но это сейчас, когда компиляторы стараются стандарты поддерживать.

Но не стоит забывать что первый стандарт вышел в 89м, а, скажем, Turbo C — в 1987м. И был он далеко не первым компилятором и даже не 10м.

brain_tyrin 6 фев 2017 в 20:05

Стандарт C99 (пункт 6.2.5.6) говорит, что

For each of the signed integer types, there is a corresponding (but different) unsigned
integer type (designated with the keyword unsigned) that uses the same amount of
storage (including sign information) and has the same alignment requirements.

В стандартах C++ фраза повторена почти дословно (есть пункт про «same amount of
storage»).
Так что это какие-то странные реализации.

Antervis 7 фев 2017 в 06:13

да. В стандарте С89 такого требования нет

brain_tyrin 7 фев 2017 в 09:58

В ISO/IEC 9899:1990 (который, фактически, и есть нынешний C89) такое требование есть (пункт 6.1.2.5)

Antervis 6 фев 2017 в 13:32

вопрос скорее в другом. Зачем явно вызывать разыменование нулевого указателя (которое компилятор может попросту выкинуть) вместо std::raise(SIGSEGV), throw std::runtime_error или std::exit(<какой-нибудь код>) в зависимости от ситуации? Это И явно, И не UB

Andrey2008 6 фев 2017 в 14:32

Ну пишут вот так… Что я теперь сделать могу… :)
Но надо учиться с этим как-то жить.

klirichek 6 фев 2017 в 18:04

В низкоуровневом коде для микроконтроллера, например.

НЛО прилетело и опубликовало эту надпись здесь

Andrey2008 6 фев 2017 в 21:16

Происходит некоторая путаница между явным подавлением предупреждений и исключениями для сокращения числа ложных срабатываний. Давайте я ещё раз попробую объяснить.

В PVS-Studio существует несколько механизмов для устранения ложных срабатываний, которые в любом случае неизбежны:

Отключение диагностики с помощью настроек или специальных комментариев.
Изменение настроек некоторых диагностик с помощью комментариев специального вида (про них говорится в описании конкретных диагностик).
Далее, то о чём Вы говорите — подавление предупреждения в конкретной строке с помощью комментариев.
Или в макросе (см. там-же). Или в строке кода, содержащую определённую последовательность символов.

Выключать предупреждения или подавлять предупреждения в макросах, можно также используя конфигурационные файлы (см. про pvsconfig).

Отдельно следует выделить систему массовой разметки предупреждений с помощью специальной базы. Это позволяет быстро интегрировать анализатор в процесс разработки больших проектов.

Есть ещё некоторые возможности, но, пожалуй, нет смысл повторять документацию.

Так вот, все это относится к явному указанию, что не считать ошибками. Однако, это не снимает задачу минимизации предупреждений с помощью специальных исключений. Ценность анализатора не в том, что он ругается на всё подряд, а в том, как много он знает ситуаций, когда ругаться не надо.

Примеров, столь много, что надо писать цикл статей на эту тему. Поэтому опишу только одно, из последней диагностики V779 — Недостижимый код.

Исключение:

Не надо ругаться, если блок заканчивается конструкцией 'no_return_statement; return;'. Многие так подавляют предупреждения компилятора. Пример:

int foo()
{
  ....
  exit(1);
  return 0;
}

Теоретически здесь надо ругаться, что «return» является недостижимым кодом. Однако этот return появился в коде вынужденно, как борьба с предупреждениями компиляторов или других анализаторов. В коде иногда есть соответствующий комментарий на эту тему. Так вот, никакой практической пользы от предупреждения на такой return нет. Мы проверяем как работают диагностики на 154 открытых проектах. И ни в одном, не было ошибки. Всегда было видно, что это ложное срабатывание. Всего их несколько десятков. Нет смысла оставлять их из-за гипотетической вероятности, что будет пропущена настоящая ошибка. Если бы мы оставляли такие ложные срабатывания, анализатором уже давно бы было невозможно пользоваться.

НЛО прилетело и опубликовало эту надпись здесь

ns5d 7 фев 2017 в 18:06

полностью согласен, х знает чего заминусовали.

-4

НЛО прилетело и опубликовало эту надпись здесь

Andrey2008 7 фев 2017 в 21:06

Вот делать нам больше нечего, минусовать, а тем более карму портить. Возможно это намек со стороны сообщества, что Вы слишком категоричны и стоит попробовать осмыслить альтернативную точку зрения.

Andrey2008 20 мар 2017 в 19:15

Я изложил свои мысли более подробно: https://habrahabr.ru/company/pvs-studio/blog/324372/

НЛО прилетело и опубликовало эту надпись здесь

ns5d 6 фев 2017 в 12:19

похоже на троллинг, но с чем-то согласен)

НЛО прилетело и опубликовало эту надпись здесь

Andrey2008 6 фев 2017 в 12:45

Комментарий в духе «Не пробовал, но не одобряю».

Класть указатель в int, это не всегда неверно. В теоретические споры давать не буду, но если мы тупо начнём ругаться на преобразование int->pointer и т.п., то количество желающих использовать наш анализатор явно уменьшится :). Надо быть тоньше и умнее. И наш анализатор такой и есть. У него есть ряд диагностик, относящихся в основном к 64-битным проверкам, которые предупреждают о возможной потери старших бит или например о ситуациях вида "Красивая 64-битная ошибка на языке Си".

По поводу разыменования нулевых указателей и опечаток. В наших статьях много и о разыменовании нулевых указателей. Так что речь идёт об однобокости тестов.

НЛО прилетело и опубликовало эту надпись здесь

Andrey2008 6 фев 2017 в 14:41

Предупреждаем, не бойтесь. Мы с 64-битных проблем начинали. Все что нужно, там есть. Я хотел сказать, что ругаться надо разумно. Ведь в 32-битной программе size_t может быть объявлен через unsigned int. А значит всё хорошо.

P.S. Всех интересующихся проблемой 64-битности отсылаю к своим работам:

Давно их не упоминал. Возможно новичкам будет интересно почитать этот материал.

НЛО прилетело и опубликовало эту надпись здесь

Andrey2008 6 фев 2017 в 15:06

Ой, ну давайте посоветуйте искать предобразования int <-> unsigned int. Всем кто думает, что это хорошая идея, предлагаю создать свой собственный анализатор с подобными правилами и попробовать его продать. :)

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 6 фев 2017 в 15:25

Этот каст хотя бы обратим.

Ddnn 6 фев 2017 в 17:52

Интересный факт: std::basic_string::npos — получается методом signed -> unsigned преобразования. Из cppreference:

static const size_type npos = -1;

Так что категорично ругаться на все такие преобразования не стоит точно)

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 6 фев 2017 в 13:58

Почему-почему, да потому что Си без плюсов от 89го года! В этом языке любая неизвестная функция считается обладательницей вот такой сигнатуры:

int UnknownFunction(...);

То есть принимает любое число параметров и возвращает int.

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 6 фев 2017 в 14:22

Компилятор должен компилировать старые программы независимо от того сколько лет прошло! Поэтому по умолчанию (без указания новой версии стандарта ключами компилятора) подобная "фича" будет работать для любых программ на Си.

НЛО прилетело и опубликовало эту надпись здесь

khim 6 фев 2017 в 19:17

Как думаете, следовало бы избавиться от такого поведения?

В какой-то момент — несомненно. Так, GCC больше не требует поддержки фишек, которые C89 выкинул из C. Кажется начиная с версии 5, вышедшей в прошлом году.

Legacy — потому и legacy, что остаётся с нами долгие годы.

Antervis 6 фев 2017 в 13:34

типы intptr_t и uintptr_t не являются указателями. Это числовые типы, придуманные специально для того, чтобы класть в них указатели

НЛО прилетело и опубликовало эту надпись здесь

Tujh 6 фев 2017 в 12:54

После прочтения у меня возник вопрос…
Почему

в диагностике V522 реализовано исключение A

но

мы по-прежнему будем работать над настоящими хорошими диагностиками, а не заниматься подгонкой анализатора под тесты

Разве исключение из диагностики это уже не некоторая подгонка под конкретный проект или тест? Понизьте приоритет диагностики с «критического» на «предупреждение», к примеру, с соответствующим комментарием, но не проглатывайте диагностику совсем. Это более правильное решение, на мой взгляд.
И я правильно понимаю, что А6 — это уже шестое исключение из правила? Если так, то ценность диагностик действительно падает, так как случайно (жизнь полна случайностей) может так произойти, что реальная проблема будет «проглочена» исключением, ну например:

void* GetMemoryBlockOrReturnNull( const size_t nSize, void *pStart ) {
    void *pStartLocal = NULL;
    pStartLocal = pStartLocal + 1; // хотели pStart но IntelliSense подставил локальную переменную
...
    return pStartLocal;
}

Я не претендую, что этот пример «сломает» диагностику, но это возможно в определённых ситуациях, как мне кажется.

mayorovp 6 фев 2017 в 13:05

С типом void * ни pStartLocal = pStartLocal + 1, ни *pStartLocal = *pStartLocal + 1 не скомпилируются :)

Tujh 6 фев 2017 в 13:10

Ну да, Вы правы, но сути дела это не меняет, давайте заменим void* на char*, int*, или что-то другое, нужное по смыслу.

mayorovp 6 фев 2017 в 13:18

И звездочек надо еще поставить. Иначе не понятно при чем тут обсуждаемая диагностика.

a1ien_n3t 6 фев 2017 в 14:14

Только в С++, в обычном С все ок)

khim 6 фев 2017 в 19:20

В «обычном» C не сработает. Это GNU C ное расширение.

Andrey2008 6 фев 2017 в 14:50

Разве исключение из диагностики это уже не некоторая подгонка под конкретный проект или тест?

Нет. Это подгонка под определённые принятые паттерны программирования. Например, нигде не написано, что выражение «if ((a = b))» не содержит ошибку. Однако, почти все компиляторы и анализаторы молчат на такой код, так как двойные скобки считаются дефакто подсказкой, что всё хорошо.

Ценность диагностик действительно падает.

Нет, ценность диагностики растёт. Чем больше ложного удается отсечь, тем лучше. Тогда среди мусора не затеряется настоящие ошибки. С++ такой язык, что можно выдавать предупреждение на каждую строчку, и не ошибешься. Вот только толку от такого анализатора не будет.

Объяснить подробно — надо писать целую статью. Будем читать, что я в этом вопросом просто буду давить авторитетом. :) Поверьте, исключения это очень важная и самая ценная часть анализатора. Многие диагностики начитывают десятки исключений.

Tujh 7 фев 2017 в 08:29

Про паттерн из двойных скобок не знал, интересно, спасибо.

Про исключения я понимаю вашу позицию, что множество ложных срабатываний снижает уровень доверия к анализатору. Но ведь всегда найдётся реальный пример, когда исключение может скрыть реальную проблему, как бороться с этим? Или Вы просто полагаетесь, что вероятность подобного стечения обстоятельств ничтожно мала и проще скрыть пару тысяч ложных срабатываний, чем отобразить их ради одного реального?

Andrey2008 7 фев 2017 в 09:20

Лучше потерять 1 полезное сообщение, чем при этом показать за компанию ещё 1000.

В этом нет ничего ужасного. Полнота выявления ошибок не единственный критерий полезности анализатора. Не менее важен ещё и баланс между полезными и бесполезными сообщениями.

Для тех, кто переживает о потерянном предупреждении хочу напомнить, что с другими технологиями поиска ошибок все обстоит точно также. И точно также приходится идти на компромисс. Возьмем, например, юнит-тесты. Можно пропустить ошибку, не покрыв тестами 100% кода. Но с практической точки зрения разумно остановиться, скажем на 80%. Потому, что покрытия 100% кода столь сложная задача, что на неё уйдёт неразумное количество времени и сил. И даже покрыв 100% кода тестами вновь нет гарантии, что мы проверили все случаи входных данных и можно продолжать усложнять и усложнять тесты.

Аналогично и со статическим анализом. С практической точки зрения лучше рассматривать отчет с 30 ошибками и 50 ложными срабатываниями, чем с 32 ошибками и 500 ложными срабатываниями. Почему? Потому, что рассматривая первый отчёт вы поправите больше ошибок, чем во втором случае. Второй отчет вы будете изучать гораздо более невнимательно, если вообще станете.

Внимательность быстро теряется. Просматривая отчет с большим количеством ложных срабатываний, человек начинает очень невнимательно относиться к предупреждениям и пропускает многие ошибки, помечая их как не ошибки.

Кто-то скажет, но вот я то, буду смотреть все все! Дайте мне все предупреждения!

Нет, не будете. Или покажите мне как у вас уже на 100% код покрыт тестами. Не на 100%? А почему? Там ведь может быть ошибка! :)

P.S. Сделать шумный анализатор (без исключений) очень просто. Однако мы тратим много сил как раз на эти самые исключения, так как точно знаем, что без этого пользоваться анализатором невозможно.

Tujh 7 фев 2017 в 11:48

Я понял Вашу точку зрения и в целом согласен.

Но есть один момент, который мне, как зануде со стажем, не даёт покоя. А есть ли возможность увидеть эти скрытые предупреждения, принудительно?
Вот из Вашего же примера — первичный отчёт выдал 30 ошибок и 50 ложных предупреждений. Я их все просмотрел, ошибки исправил, ложные добавил в исключения для этого конкретного проекта (а так вообще можно?) и у меня есть время для «we need to go deeper». Я хочу включить более «шумный» вариант анализа, принудительно, понимая, что я получаю в итоге, и этот «шумный вариант» выключен по умолчанию, именно для того, что бы получить те самые, оставшиеся 2 ошибки и 450 ложных срабатываний. Это возможно?

SvyatoslavMC 7 фев 2017 в 12:05

ошибки исправил, ложные добавил в исключения

Где-то в комментариях Andrey2008 уже сделал акцент на том, чтобы не путали исключения анализатора с подавлением ложных срабатываний.

1. Исключения анализатора внутренние, по их разработке и обоснованию проделана большая работа.
2. Если вы видите ложные срабатывания, значит исключения не сработали. Такие срабатывания можно разметить как ложные и больше не видеть. К ложным срабатываниям можно вернуться позже при желании.

Tujh 7 фев 2017 в 14:25

я говорил не о ложных срабатываниях, а о реальных, но скрытых из-за исключений.

EvgeniyRyzhkov 7 фев 2017 в 15:47

Если у вас есть понимание, что статический анализатор полезный инструмент — то исправьте все сообщения уровня High (самые крутые). Если вам кажется, что это у вас получилось очень легко и принесло пользу — исправьте теперь сообщения уровня Medium. Наконец, если вы вдруг еще готовы работать и дальше — то исправьте сообщения уровня Low.

Если и после этого у вас осталось желания посмотреть сообщения, которые отвалились как исключения, то я вам просто не поверю, что вы уже исправили все три предыдущих уровня :-)

Tujh 7 фев 2017 в 16:42

А теперь представьте такую ситуацию, что этим занимается специально выделенный для этого разработчик. Он не пишет продукт, он тестирует и исправляет ошибки. DevOps с уклоном в разработку, скажем.

EvgeniyRyzhkov 7 фев 2017 в 16:43

Вопрос — у него работы нет что-ли? Он реально исправил все три уровня сообщений и хочет ЧЕГО-ТО ЕЩЕ поправить?

Это какое-то теоретизирование. Нет смысла НАСТОЛЬКО увлекаться этим процессом. Всякие 80/20 никто не отменял.

Tujh 7 фев 2017 в 16:44

Вопрос — у него работы нет что-ли?

Ответ — это и есть его работа.

Andrey2008 7 фев 2017 в 12:07

Если Вы про базу разметки, то Святослав уже ответил.

Если про возможность отключить исключения, то нет.

И смысла нет. Я, например, знаю, как выглядит работа с проектом в 10 млн. строк кода. Поверьте, в таких проектах не до «we need to go deeper». Там даже особенно нет времени для изучения предупреждений 3-его уровня достоверности. Так что желание посмотреть всё-всё, может быть только в маленьких проектах. Но вопрос, а нужен ли там так сильно статический анализатор? Можно устроить code-review? Или поиграться с другими инструментами, раз есть время. :)

Tujh 7 фев 2017 в 14:26

Про возможность отключить исключения. Я Вас понял, спасибо.

HighPredator 7 фев 2017 в 12:00

Может быть я вашу мысль немного не так понял, но я как разработчик получу в рассмотрение не 30 ошибок и 50 ложных срабатываний (или 32 ошибки и 500 ложными срабатываниями), а условно 3 ошибки и 6 ложных срабатываний. Или же 4 ошибки и 60 ложных срабатываний во втором случае. Как и каждый из разработчиков в команде. Мне представляется маловероятным, что задача на фикс проблем, найденных анализатором, не будет распределена по команде. И в этом контексте вариант с большим числом предупреждений более полезен с практической точки зрения.

Andrey2008 7 фев 2017 в 12:02

вариант с большим числом предупреждений более полезен с практической точки зрения.

Нет.

Если честно, я не ожидал такого всплеска комментариев на тему того, что анализатор может очень редко, но не выдать предупреждение на ошибку из-за реализованных в нём механизмов отсечения ложных срабатываний. Борьба с ложными срабатываниями настолько большая составляющая любого статического анализатора, что как-то даже не понятно, что тут собственно обсуждать. Это надо делать и всё. И естественно такие механизмы существуют не только в нашем анализаторе, но и в других анализаторах/компиляторах.

Вот представите другой сценарий и попробуйте его прочувствовать. Допустим, команда использует нашу утилиту BlameNotifier, которая рассылает по почте предупреждения на тот код, который написал определенный человек. Если ему ничего не приходит или приходит одно-два сообщения, он их смотрит. Если ему придёт в течении недели 4 сообщения, одно из которых будет на настоящую ошибку, то код будет исправлен. Все хорошо.

А теперь представьте, что система каждый день будет присылать ему по 8-10 бессмысленных сообщений. Я уверен, что уже через несколько дней он просто перестанет их внимательно смотреть и начнет размечать на автомате код как безопасный. Вероятность что он пропустит настоящую ошибку увеличивается в несколько раз.

Т.е. большое количество сообщений позволит находить, скажем на 0.5% больше ошибок. Но при этом вероятность, что ошибка будет не замечена и пропущена, увеличивается на 500%. 500% это ещё хорошо. По факту может быть бесконечность, потому что, некоторые разработчики просто перестают вообще обращать внимание на предупреждения.

splav_asv 7 фев 2017 в 14:06

Бурю эмоций вызывает нежелание сделать галочку для отключения этих эвристик. Даже если вашим реальным заказчикам это не нужно, наверняка это не так уж и сложно. Можно ее очень глубоко спрятать, но параноиков это успокоит. Какой никакой, а репутационный плюс от этой фичи точно будет.

datacompboy 7 фев 2017 в 14:26

Я думаю нужна кнопка, включающая генерацию:
PARANOID: This line contains code. Please check it.
на каждую не пустую строчку.

Andrey2008 7 фев 2017 в 15:24

Весь мной многолетний опыт подсказывает, что это галочка не имеет отношение к реальности. Прежде чем думать о таком, можно победить предупреждения 3-его уровня. Многие с ними не работают и это нормально, так как трудозатраты от их просмотр значительны. Собственно, по умолчанию, мы 3 уровень отключаем.

(P.S. Вы уже добились 100% покрытия кода юнит-тестами? А почему?)

Если сделать такую галочку, то смотреть результаты при её включении будет нереально. Я знаю, о чем пишу. Никому весь этот мусор не нужен. Мы ведь не монетку бросаем, чтобы решить делать исключение или нет. Мы изучаем поведение диагностики и исключений на 150 проектах и проверяем, чтобы убедить, что не уберем что-то хорошее.

Возьмем скажем диагностику V670. Инициализация членов класса в неправильном порядке. Если в секции инициализации один членов зависит от другого, то необходимо проверить соответствие порядка в секции инициализации, порядку их объявления.

Казалось бы, ну какие здесь исключения? Легко. Ведь понятие «зависит один от другого» понятие растяжимое. Выражения бывают разные. Пример:

class Foo{
  X x;
  Y y;
  Foo(): x(sizeof(y)), y(1) {}
};

В выражении для инициализации 'x' используется ещё неинициализированный член 'y'. Но ошибки нет, так как это мы просто считаем размер члена.

Вы можете получить пользу если выключить исключение? Нет.

Если кто-то возразит, а вдруг там что-то другое хотели написать. Возможно. Но это можно про любую строчку в программе сказать, что «вдруг хотели написать что-то другое». И тут мы возвращаемся к идее идеального анализатора, который просто ругается подряд на все строки в программе. Даже на пустые. Вдруг неправильно, что она пустая. Вдруг там надо было написать a=b. :)

splav_asv 7 фев 2017 в 17:15

Зато имея такой режим, его можно включать для синтетических тестов. Можно автоматически (как тут уже ниже вспоминали VW) при превышении некоторой плотности ошибок, отсекаемых вашим эвристическим фильтром. Или писать сообщение вида: «Возможно, вы запустили анализатор на синтетическом тесте. Если вы хотите видеть все ошибки, сделайте следующее...»

Отключать можно не случаи, как вы только что привели пример, а как в статье — явная грубая ошибка, скорее всего сделанная намеренно. Тут конечно работы поболее, отличать одно от другого.

С точки зрения практики, вероятно вы правы. Но бодаться из принципа (с теми же тестами), если есть другие пути — занятие странное. В существующими эвристиками всё ок, просто не хватает еще одной.

EvgeniyRyzhkov 8 фев 2017 в 08:49

Берем PC-lint. Запускаем на «hello world». Получаем 100 сообщений анализатора. И что, радуемся?

splav_asv 8 фев 2017 в 09:17

Простите, но не вижу связи между моим комментарием и вашим ответом на него.
И всё же:
1)Берём и начинаем разрабатывать проект с 0. Включаем в число проверок для PR PVS-Studio. Требуем отсутствия предупреждений — либо чиним, либо обоснованно глушим. Итого проект всего чисто собирается без предупреждений. Для таких условий вполне можно время от времени смотреть, какие еще подозрительные места в коде он бы нашел без данных эвристик.
2) Если часть ваших потенциальных клиентов использует синтетические тесты(Не такой уж странное желание в конце концов, потому как лучше тестов вроде бы нет. Может вы на основе собранных случаев когда нибудь лучше тесты сделаете..), то почему бы вам, если это не слишком сложно, не сделать соответствующий режим для их прохождения? Игнорируемые по умолчанию ошибки можно добавить в отдельный 4ый уровень — предположительно намеренные ошибки. Я говорю сейчас именно про ошибки — UB и т.д.

-5

EvgeniyRyzhkov 8 фев 2017 в 09:24

1. Проекты с нуля не разрабатываются. Они всегда идут на основе какой-то кодовой базы, чаще всего большой.

2. Никому не интересно в реальной жизни как работает инструмент на абстрактном проекте. Всегда интересно как он работает ТОЛЬКО на моем конкретном проекте.

splav_asv 8 фев 2017 в 09:25

Вы в это верите. Я сталкивался с обратным. Ваше право.

khim 8 фев 2017 в 13:14

Не подскажите — какая это была фирма и сколько человек на ней работало примерно? Хотя бы порядок — тысяча человек, десять тысяч?

Я сталкивался с обратным — но никогда у практиков, которые могли бы купить подобные инструменты. Только у всегда всем недовольных теоретиков.

splav_asv 8 фев 2017 в 13:49

Фирма мало известная, практики, но область инженерно-научная. Сотрудников около 500.
Я лишь утверждаю, что выбирать инструмент без тестов не логично. Если инструмент игнорирует тесты — его тяжело оценить. Говорить, что надо только на реальном проекте проверять можно, но хочется знать в принципе на что он способен. Для этого принято использовать тесты.

Tujh 7 фев 2017 в 14:47

я не ожидал такого всплеска комментариев на тему того, что анализатор может очень редко, но не выдать предупреждение на ошибку из-за реализованных в нём механизмов отсечения ложных срабатываний

Потому что эти исключения не очевидны для большинства разработчиков и выглядят как «затыкание дыр» на примере нескольких проектов/тестов.
Если бы исключения (а для такого семейства языков, как С/С++ их априори полно) были формализованы в стандарте, или хотя бы в книгах K&R, Стауструпа, Майерса и Ко, считающимися едва ли не обязательными учебными материалами, ни кто бы и слова, я думаю, не сказал Вам.

За более чем восемь лет постоянной практики С++ я ни разу не встречал ни в одном документе, даже в гугловских рекомендациях по оформлению кода описания, что:

if ((a=b)) { ... }

Сигнализирует не об опечатке, а об осмысленном действии. Хотя конструкций вида if((a=b)!=0) видел огромное множество.
Нет такого правила, Вы их увидели в нескольких проектах и посчитали общепринятыми… но это не так.
Точно так же, и остальные исключения. Вы обвиняете синтетический тест в том, что он подпадает под Ваши исключения (вычисленные эмпирическим путём и не имеющие прообразов ни в одном стандартном документе) и Вам не кажется это, скажем так, странным?

-6

khim 7 фев 2017 в 21:42

За более чем восемь лет постоянной практики С++ я ни разу не встречал ни в одном документе, даже в гугловских рекомендациях по оформлению кода описания, что:
if ((a=b)) { ... }
Сигнализирует не об опечатке, а об осмысленном действии.

Круто, чё.

Если бы исключения (а для такого семейства языков, как С/С++ их априори полно) были формализованы в стандарте, или хотя бы в книгах K&R, Стауструпа, Майерса и Ко, считающимися едва ли не обязательными учебными материалами, ни кто бы и слова, я думаю, не сказал Вам.

Я правильно понимаю что нынче можно изучать как работать с микроволновкой не по инструкции к микроволновке, а по телепередачам лучших поваров?

Нет такого правила, Вы их увидели в нескольких проектах и посчитали общепринятыми… но это не так.

А я их увидел в документации на компилятор (только не нужно про то, что это какое-то нововведение про которое Майерс ничего не знает: -Wparentheses за последние 10 лет ничуть не изменился).

Обратите, кстати, внимание, на формулировку: warn if parentheses are omitted in certain contexts, such as when there is an assignment in a context where a truth value is expected, а когда это предпреждение срабатывает, то выглядит это как

test.c:3:3: warning: suggest parentheses around assignment used as truth value [-Wparentheses]
   if (i = 5) {

Нафига вам Майерс, если вам прямо компилятор говорит что и как делать?

Точно так же, и остальные исключения. Вы обвиняете синтетический тест в том, что он подпадает под Ваши исключения (вычисленные эмпирическим путём и не имеющие прообразов ни в одном стандартном документе) и Вам не кажется это, скажем так, странным?

А почему это должно казаться странным? Стандарты — это что, священные крижали?

Данное правило в момент выхода GCC 2.95 больше 15 лет назад было уже твёрдо установленной практикой, а кто и когда его ввёл — это ареологов вызывать надо. Было бы странно, если бы PVS-Studio игнорировала бы подобные вещи…

Tujh 8 фев 2017 в 11:09

Я правильно понимаю что нынче можно изучать как работать с микроволновкой не по инструкции к микроволновке, а по телепередачам лучших поваров?
…
Стандарты — это что, священные крижали?

В итоге то что, шашечки или ехать? То читаем инструкцию, то «кому инструкции нужны».

А я их увидел в документации на компилятор… -Wparentheses за последние 10 лет ничуть не изменился).

Не вижу там про двойные скобки ни слова.

if (  a = b  ) { // тут PVS выдаст предупреждение
...
if (( a = b )) { // а тут промолчит

В каком документе описывается подобное и при чём тут -Wparentheses?

-3

Tujh 8 фев 2017 в 11:37

ОК, про «Wparentheses» я понял, согласен, протупил. Но получается, что эта техника заставляет проглотить предупреждения для GCC, возможно для clang.

khim 8 фев 2017 в 13:23

Но получается, что эта техника заставляет проглотить предупреждения для GCC, возможно для clang.

GCC, clang, coverity, PVC-Studio и много кого ещё. Даже в линтерах таких языков как JavaScript эта конструкция поддерживается (вот тут, например — conditionalAssign). Я же сказал — чтобы выяснить когда и кто ввёл это правило впервые археологи нужны будут. Не удивлюсь, если окажется что и оригинальный lint это умел

khim 8 фев 2017 в 13:29

То читаем инструкцию, то «кому инструкции нужны».

Никто не читает инструкции™ — и это нормально.

Ненормально — рассказывать сказки про свою дотошность и готовность изучать тысячи ложных сообщений обшибках. Особенно на фоне того, что при всей своей постулируемой супердотошности выясняется что за восемь лет вы так и не удосужились прочитать не то, что полную инструкцию к компилятору, а, я извиняюсь, краткую справку man gcc.

Извините, но… не верю™.

Tujh 8 фев 2017 в 15:41

Не путайте тёплое с мягким. Даже по описанию из справки не сразу очевидно применение двойных скобок. И, как я уже писал, на тех проектах, что я видел/участвовал, писали более очевидную запись:

if ( ( a = b ) != 0 ) { ...

Antervis 9 фев 2017 в 06:39

это субъективно. Лично для меня (и я точно не один такой) true и != 0 настолько тождественны, что ваш вариант ничуть не очевиднее, даже наоборот: видя двойные скобки, я сразу понимаю, что они там не просто так, а вот != 0 мой мозг старательно игнорирует. А в погоне за очевидностью можно писать

a = b;
if (a) {
 ...

В с++17 можно будет писать

if (a = b; a) { ...

maaGames 6 фев 2017 в 13:02

Я бы хотел, чтобы описанные ошибки всё-таки PVS обнаруживал. Сейчас есть очень много ложных срабатываний и ещё парочка не помешает, зато и «рейтинг» анализатора повысит и даст нерадивому программисту лишний повод задуматься, действительно ли он написал именно то, что хотел?
Выход за границы массива, в общем случае, анализатором проверить невозможно. И пихать кучу проверок 99% программистов перед обращением не будут. С другой стороны, те же 99% программистов будут использовать vector, а не массив и ошибка будет найдена в рантайме. Тут стоит учесть, что обычно запустить программу и словить сегфолт или ещё что-нибудь оказывается гораздо быстрее, чем ждать окончание работы анализатора. Зато опечатки, копипасты и ряд других ошибок простым запуск-падением обнаружить невозможно.
В общем, пользуюсь PVS и радуюсь, что кроме ложных срабатываний почти ничего не находит. Значит, не сильно говнокодю.)

Tujh 6 фев 2017 в 13:12

В общем, пользуюсь PVS и радуюсь, что кроме ложных срабатываний почти ничего не находит. Значит, не сильно говнокодю.)

Вы не поверите, но в «говнокоде» анализатор тоже не найдёт ошибок. Они там не синтаксические, а логические :)

maaGames 6 фев 2017 в 13:15

Не совсем так. Некоторые логические ошибки он тоже неплохо находит, а вот алгоритмических, надеюсь, никогда находить не будет. А то можно сразу выкидывать программиста и нанимать статический анализатор.)

Andrey2008 6 фев 2017 в 14:54

Я бы хотел, чтобы описанные ошибки всё-таки PVS обнаруживал.

Как я сказал, подточим, но без фанатизма. Rand() уже поддержали, даже научили анализатор доставать правильную константу RAND_MAX из заголовочных файлов.
Однако, это не отменяет что тест плох и ориентироваться на него я не хочу. Я ведь только чуть-чуть покритиковал, но у меня есть и другие претензии к нему.

BekzhanKassenov 6 фев 2017 в 20:04

С другой стороны, те же 99% программистов будут использовать vector, а не массив и ошибка будет найдена в рантайме.

Стандарт C++ гарантирует, что лишь vector::at (насколько часто он встречается?) выбросит исключение (пруф). В случае же с vector::operator [] будет обычный UB.

mayorovp 7 фев 2017 в 08:45

С ключом _DEBUG стандартная библиотека от Microsoft проверяет выход за границы в обоих случаях. Вот в релизе — да, там проверки из operator [] пропадают.

maaGames 7 фев 2017 в 09:11

Про дебаг уже написали, а использование [], вместо at — преждевременная оптимизация.

-1

datacompboy 7 фев 2017 в 12:52

[] это удобство а не оптимизация.

vadim_ig 6 фев 2017 в 13:44

А мне кажется, что тут скорее ваш провтык. Продукт нужно разрабатывать не только с прицелом на качественную работу, но и на продажи, т.е. он должен уметь показать себя в тот момент, когда клиент выбирает. Наверняка было известно, что тестовые базы существуют, и уж совсем ничего удивительного в том, что их используют для быстрой проверки анализаторов. Очень круто было бы, если бы анализатор шел со включенными по умолчаниями предупреждениями об откровенной синтетике, причем в явном виде. Т.е. с сообщениями вида «Разыменование нулевого указателя (Это что, синтетический тест?)». Если человек сделат выбор в вашу пользу, он найдет, как отключить лишний шум, а вот не увидевший нужной функции будет потерян навсегда.

+15

khim 6 фев 2017 в 19:25

Вы абсолютно правы — такое везде происходит. Я общался с разработчиками V8, например — у них та же беда: Subspider уже настолько устарел, что многие решения, ускоряющие реальные программы замедляют его искуственные тестовые примеры.

Решение — регулярно гонять Subspider и следить за тем, чтобы он не сильно «проседал» в новых версиях.

То же самое и разработчики PVS-Studio должны делать. А куда деваться?

НЛО прилетело и опубликовало эту надпись здесь

EaE 6 фев 2017 в 13:54

Из параллельной вселенной тулзов для оценки покрытия кода тестами: в спорных ситуациях, когда человек «явно имел в виду намеренное использование проблемы» (например, когда в коде есть ветка «если винда, то делай А, если не винда, то делай Б») — просто помечается соответствующая строчка понятным проверяющей тулзе тегом в комментарии (вида " /* code_coverage_ignore */ "). Это позволяет избежать игры в угадайку с одной стороны, и раздражения от тонны мешающих варнингов с другой стороны.

Just sayin'.

Andrey2008 6 фев 2017 в 14:58

И? Предположим есть проект на 10 миллионов строк кода. И код такой, какой есть. Анализатор должен просить в начале его разметить? Вписать подсказки? Ну хорошо, предположим программисты скучают от безделья и готовы это делать: куда и что им вписывать? Это не серьезно, анализатор должен работать сразу. И игра в угадайку неизбежна.

EaE 6 фев 2017 в 15:07

Анализатор должен просить в начале его разметить? Вписать подсказки?

Я надеюсь, мы сейчас о реальной ситуации говорим, а не синтезируем ее спора ради (вроде только что статью прочитали о вреде этого). Так вот в реальной ситуации анализатор кода даст на 10 миллионах строк кода, ну, положим, 250к варнингов. Из них, положим, 1% ложно-положительных — тех, которые можно было бы угадать, но мы предпочтем дать юзерам самим решать, проблема это или так и предполагалось. С оставшимися 99% — 247500 варнингами — все равно ведь что-то придется сделать (если конечно вся эта катавасия с анализом делалась не для красивого отчета совету директоров). Если из 100 варнингов 99 вы поправите путем исправления бага, а оставшуюся одну проблему пометите (ПОСЛЕ прогона анализатора, а не до, разумеется) правильным тегом «такинадо» — производительность труда от этого не упадет, а потенциально-проблемное место в коде будет гарантировано прокомментировано, что проблема известна и более того специально тут сидит. Чтобы следующий разработчик на проекте, например, не «почистил» ее от большого ума.

Andrey2008 6 фев 2017 в 15:12

По необходимость подсказок и разных разметок это понятно. У нас масса механизмов на эту тему. Но это не отменяет необходимости гадания на кофейной гуще. Так как если не гадать, сообщений будет скажем не 250k а, 400k.

EaE 6 фев 2017 в 15:15

Ну, я же и не говорю, что это плохой механизм, просто он в статье подан как… единственно правильный, что ли. Кстати, вот вы разрабатываете этот инструмент, наверняка же гоняли его на реальных непуганых кодебазах и владеете статистикой: сколько там вылезает в среднем проблем на тот же миллион строк кода? И сколько из них — угадываемые псевдо-проблемы? Без подвоха спрашиваю, любопытно просто, для общего образования.

Andrey2008 6 фев 2017 в 15:22

Статистику не ведем. Могу предложить походить по нашим статьям. В некоторых из них приведены какие-то числа. Например, предыдущая статья: https://habrahabr.ru/company/pvs-studio/blog/320778/
Только учитывайте, что перед нами не стоит задача найти как можно больше ошибок. Задача — найти достаточно, чтобы написать статью.

mayorovp 6 фев 2017 в 15:27

Вы же сами рассказывали про чудесный механизм маскировки срабатываний, позволяющий замаскировать все старое и сообщать только о новых подозрительных местах.

А вообще — да, надо размечать все старые костыли. Хотя бы для того чтобы самим не забыть.

Andrey2008 6 фев 2017 в 15:29

Это разное. Это не отменяет необходимость встроенной магии.

iUser 7 фев 2017 в 06:13

Вы, вероятно, удивитесь, на что готовы люди, которым реально необходимо верифицировать код :)
Поглядите, например, на инструменты типа Frama-C, на ANSI/ISO C Specification Language.
И пишут, и аннотируют — надо, значит надо. Ничего страшного в этом нет.

AllexIn 6 фев 2017 в 14:03

void overrun_st_014 ()
{
  int buf[5];
  int index;
  index = rand();
  buf[index] = 1; /*Tool should detect this line as error*/
                  /*ERROR: buffer overrun */
  sink = buf[idx];
}

Пожалуй, такое можно встретить разве только в лабораторных работах студентов.

да ладно?
а если такое:

int gradient[GRADIENT_WIDTH];
...
int index;
index = rand() % GRADIENT_WIDTH;

из-за опечатки превратилось в:

int gradient[GRADIENT_WIDTH];
...
int index;
index = rand();

Это тоже только в лабораторных у студентов?

Andrey2008 6 фев 2017 в 15:01

Как я уже писал выше, поддержали полноценно rand(). Такая ошибка теперь найдется. Но это не отменяет моего мнения, что подобный код мало реален.

kekekeks 6 фев 2017 в 14:23

Вы лучше чем ругать чужие наборы тестов тесты, опубликовали бы свои. И не просто так, а как открытый проект, куда другие могут слать пул-реквесты. Ну и раз в три месяца прогонять оценку имеющихся на рынке анализаторов.

Примерно так в проекте FrameworkBenchmarks происходит с веб-фреймворками.

+12

Andrey2008 6 фев 2017 в 15:02

Бессмысленно. Всё равно каждый мимо проходящий будет упрекать нас в том, что мы создали такую базу, на которой лучше всего показываем себя. И непонятно как оспорить. Так что разработкой тестов в любом случае должна заниматься третья сторона. Только тогда можно говорить о какой-то адекватности и честности.

DarkEld3r 6 фев 2017 в 15:27

И откуда такая третья сторона возьмётся? Ну оплатит, например, Coverity кому-то эту работу и что дальше? И ведь даже если кто-то действительно "независимый" (опять же, личную предвзятость никто не отменял) этим займётся, то точно так же будут спекуляции, что мол проплатили.

Я, конечно, понимаю, что для вас создание такой базы — это дополнительная работа (особенно в плане дальнейшей поддержки), причём с непонятным профитом. Хотя польза вполне могла бы быть: как минимум, можно козырять тем, что подход более основательный, чем у описанных в статье тестов.

kekekeks 6 фев 2017 в 17:15

Всё равно каждый мимо проходящий будет упрекать нас в том, что мы создали такую базу, на которой лучше всего показываем себя. И непонятно как оспорить.

Предлагать этим мимопроходящим добавить свои тесты.

+14

Andrey2008 6 фев 2017 в 17:16

Хм. А вот это надо обдумать. Спасибо за мысль.

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 7 фев 2017 в 11:46

Это решается правилом — "любой тест должен быть куском кода из реального проекта с указанием источника".

Критика набора синтетических тестов целиком и правда смотрится как отмазки — но синтетический тест в набор из тестов, основанных на реальном коде довольно просто.

misha_shar53 6 фев 2017 в 14:52

Хотел попробовать вашу студию в Linux. Но оказывается нужна лицезия. Средствами не распологаю.

SvyatoslavMC 6 фев 2017 в 14:56

Предлагаю попробовать :-) Как использовать PVS-Studio бесплатно

misha_shar53 6 фев 2017 в 17:48

Обязательно попробую в ближайшее время. Требования считаю вполне обоснованными. Мне надо еще разобраться как все это присобачить к NetBeans.

-1

ns5d 6 фев 2017 в 15:50

"в 10 раз лучше" https://www.youtube.com/watch?v=FkdTW4QaDiQ

olekl 6 фев 2017 в 16:55

Подтверждаю, в продакшн коде встречал «принудительный крэш» с записыванием числа в нулевой указатель… Хоть и не сторонник такого кода…

homm 6 фев 2017 в 17:29

Андрей, при всем уважении, считаю что про null-указатель вы неправы. Давайте разберемся.

Бывают ситуации, когда аналогичный код пишут специально, чтобы добиться возникновения исключения при разыменовании нулевого указателя.

Бывает, что такое выражение пишут специально, а бывает, что не специально. Вы желали облегчить жизнь тем разработчикам, которые пишут его специально и дать возможность игнорировать его, поэтому придумали критерий, согласно которому эта проверка глушится. Но давайте посмотрим на критерий:

Разыменование переменной находится в функции, в названии которой есть одно из слов:
error, default, crash, null, test, violation, throw, exception

Вы действительно считаете надежным критерием для пропуска проверки наличие, например, слова default в названии функции? Нет же, вы просто где-то встречали код, где разыменовывание было в функции с таким словом в названии. Значит ли это, что разыменовывания в во всех функциях, где в названии есть слово default можно считать безопасными? Да нет конечно, с какой стати. То, что вы называете достаточно умной проверкой, я бы назвал достаточно сломанной проверкой.

На мой взгляд, в данном случае может быть только один надежный критерий отключения этой проверки: когда программист говорит: «эй, анализатор, я знаю, что тут разыменовывание нулевого указателя и это точно не ошибка». Я не знаком с вашим продуктом (хотя регулярно читаю ваши посты), но думаю у вас есть механизм общения программиста с анализатором через комментарии в коде. Вот его нужно оставить, а проверку на «слово в названии функции» выкинуть.

Andrey2008 6 фев 2017 в 17:39

Прошу посмотреть описание в статье более подробно. Критерием является присутствие в названии слова И странный код. Под странным кодом понимается, когда СРАЗУ присваивают NULL и тут-же его разыменовывают. Уже самое написание:

T *x = 0;
*x = 0;

Выглядит не естественным. Поймите, что не делают таких ошибок. Если присваивание разнесено по телу функции, то да, это может быть ошибка. И мы найдём такой случай. Но нельзя ошибиться, разыменовывая указатель на следующей строке.

Впрочем, мы даже на такое готовы и в качестве подстраховки дополнительно анализируем ещё и название функции.

Меня можно переубедить, только приведя реальный пример, вот такой ошибки где сразу присвоили и разменивали, хотя не хотели этого делать. И чтоб имя функции при этом было, скажем crash. Вот только нет такого примера в природе.

datacompboy 6 фев 2017 в 17:40

но ведь написано же, что это ОДИН из критериев. исключение, когда ВСЕ истина. То есть И имя с подсказкой, И нулевой прямо на предыдущей строке.
то есть в случае
int* aaa = 0;
int* aaaa = b;
*aaa = 5;

ошибка НЕ будет подавлена же!

homm 6 фев 2017 в 17:40

Поправка: понял, что пропустил дополнительное условие «При этом, переменной присваивается 0 строчкой выше». Так намного лучше для «надежного критерия», но все равно не понимаю, зачем в списке default.

Andrey2008 6 фев 2017 в 17:44

Дефолтные обработчики. Встречается в программах, активно работающими с указателями на функции. По умолчанию, указателю присваивается не NULL, а указатель на дефолтную функцию. И если её случайно позвать, то пишется отчет в лог и разыменовывается нулевой указатель, чтобы упасть.

mayorovp 6 фев 2017 в 17:49

Индусы...

nothern_wind 6 фев 2017 в 17:53

Почему бы в анализатор не добавить функцию по поиску деверсий или саботажа в коде. ПРосто эта фишка с рандомом и указателем достаточно не плохой способ нагадить перед увольнением или если заказчик кинул на денежку.

Andrey2008 6 фев 2017 в 17:56

Для этого есть специальный класс инструментов. Здесь мне стоит сделать отсылку к Эшелону.

Призываю в тред: alexdorofeeff facet npoechelon :)

Lamaster 6 фев 2017 в 18:00

Гораздо интереснее заставить программу упасть в високосную секунду (:

Lauren 6 фев 2017 в 19:07

Насколько я понял дискуссию в комментариях, в pvs не хватает опции отключения эмпирической обработки. Если пользователь хочет найти шлак, пусть ищет, его право.

Andrey2008 6 фев 2017 в 20:02

Для некоторых диагностик у нас имеются специализированные настройки. Однако, этот тот случай, когда такая настройка не нужна, так как и нет реальных ошибок, которые могут быть пропущены из-за исключения A6. А нереальные, настоящим пользователям не нужны. Впрочем, если кто-то из клиентов напишет и попросит, мы сделаем такую настройку. Я уверен, что такого запроса не будет.

Tiendil 8 фев 2017 в 09:16

Всё-таки ограничение поведения программы частным (в смысле не общим/универсальным) подходом на основе субъективного мнения (а объективного тут быть не может) — не правильно. Не соответствует оно лучшим практикам.

— Сделать опцию — ок.
— Сделать опцию, включенную по-умолчанию — ок.
— Запретить проведение более полного анализа — не ок.

Любое допущение, основанное на мнении человека, имеет вероятность оказаться неверным. Значит, в данном случае, имеется вероятность пропустить ошибку. А цена ошибки может быть очень большой.

Будет крайне неприятно, если, например, какой-нибудь спутник сойдёт с орбиты из-за того, что в названии одной из функций попалось слово, которое заставило чекер молча проглотить ошибку.

-1

EvgeniyRyzhkov 8 фев 2017 в 09:25

Будет крайне неприятно, если анализатор выдал ошибку, но из-за того, что он еще 100 сообщений рядом выдал, эту ошибку не заметили.

Andrey2008 8 фев 2017 в 09:27

Мы по кругу пошли. Нас не слышат, так как никогда не использовали подобные инструменты в больших проектах. Думаю стоит закругляться с дискуссиями по это теме.

Tiendil 8 фев 2017 в 09:32

Большие — это какие?

khim 8 фев 2017 в 13:34

Достаточно большие для того, чтобы быть интересными PVS-Studio как потенциальные клиенты. Можно посчитать. Грубо. 100 строк в день, скажем, 100 человек работает и, пусть они проработают год и ⅔ всего, что они наработают «протухнет». В любом случае у нас останется миллион строк кода.

Вот примерно отсюда и начинаются большие проекты…

НЛО прилетело и опубликовало эту надпись здесь

khim 15 фев 2017 в 22:00

100 человек, работающих над одним проектом, без всякого разделения на относительно слабосвязанные компоненты?

Ну разумеется речь не идёт о том, что все 100 человек работают с одним файлом в миллион строк. Какое-то разделение есть.

У них проблемы начнутся сильно раньше, чем через год, миллиона строк не получится.

Вот прямо даже так? Вот вам один такой проект, другой, третий… Тысячи их!

Да и какой-нибудь Android за счёт repo к этому приближается.

Речь ведь не идёт о том, чтобы в миллионе строк не было никакого порядка, а о том, чтобы всё это вместе было одним проектом. Где вам не нужно было бы получать согласования на пяти страницах на изменение API другого компонента. Сделали topic, меняющий API в 100500 файлах и 1050 подпроектах, залили, поехали дальше. Вот там инструменты типа PVS-Studio — востребованы как воздух. Так как там люди часто вносят изменения в код, о котором они буквально не знают ничего (ну кроме того, что этот код каким-то боком вызвывает их API).

Tiendil 8 фев 2017 в 09:32

Именно поэтому это делать надо опцией + возможность отключить каждое срабатывание на уровне код. Большинству не надо, а параноики спасибо скажут.

-1

4144 6 фев 2017 в 21:19

Случай a.x == a.x может найти обычный компилятор
вот пример: https://godbolt.org/g/6NMDe6

Если есть перегруженный оператор сравнения, уже не найдет.

Andrey2008 6 фев 2017 в 21:19

Какое это отношение имеет к качеству тестов?

4144 6 фев 2017 в 22:20

Зачем тестировать то, что может находить компилятор? А сложных опечаток в тестах возможно нет потому, что тесты проверяют совсем простые случаи.

А про nulll pointer, возможно вам стоит добавить еще один уровень предупреждений, которые по вашему мнению не интересны пользователям, но находят проблемы.

Andrey2008 6 фев 2017 в 22:30

Что значит может? Чуть более сложную ситуацию GCC уже не находит. В статье как раз приведён пример из его кода. И перегруженные операторы тут ни при чём. Более того, эта диагностика и некоторые другие появлялись в GCC недавно, причем они подозрительно напоминают некоторые наши диагностики :).

Ну ладно, простые случаи он может находить с недавнего времени. Что дальше? Мы должны отказаться от выявления таких ситуаций? Или такие проверки надо удалять из тестов для оценки качества анализаторов?

4144 6 фев 2017 в 22:46

Я писал про тесты а не про анализатор.
Тесты в этом репозитории только для простых случаев. А ваш анализатор не только для простых.

Gcc также может многое, что могли бы находить анализаторы, на пример ошибки форматной строки, такие как переполнение буфера назначения. Или забытые скобочки, на основе анализа форматирования кода…

Я не противопоставляю gcc и pvs studio. Просто разработчики редко даже включают и проверяют предупреждения компилятора, не то что использует статические анализаторы. Если бы все исправляли все предупреждения компилятора, то и вы бы находили меньше проблем :)

stranger777 7 фев 2017 в 09:33

Анализатор PVS-Studio понимает, что этот код написан сознательно и никакой ошибки здесь нет.

Святая обязанность анализатора — предупреждать, а не понимать. Ниже — подробнее.
«Понимают» люди, но они могут не понимать, с каким клиентом имеют дело.
Что, если я — богатенький новичок, который просто пишет что попало и хочет получить все возможные пинки?
Что, если я — тестер-критик, как Билл?
Что, если я — опытный программист, опытный, разумно-ленивый и уставший, по запарке начинающий нести чушь в коде и желающий эту чушь увидеть быстро? А анализатор — молчит…
Что, если я пишу сложный генератор кода, качество которого нужно быстро проверять?
Что, если я — учитель и понадеялся в образовательном процессе на предупредительность анализатора? Ту самую, которой внезапно не оказалось…
Что, если я — «хреновый» набор тестов?
И так далее…
Этой статьёй вы теряете несколько потенциальных клиентов, а могли бы «приобрести».

-6

khim 7 фев 2017 в 22:03

Этой статьёй вы теряете несколько потенциальных клиентов, а могли бы «приобрести».

Вряд ли. Люди, которые поднимают тут шум и отчаянно «спорят о вкусе устриц и кокосовых орехов с теми, кто их ел» мало интересны кому-либо, кроме них самих. Хотя их вопли кого-то могут, в принципе, отпугнуть. Сама статья — вряд ли…

stranger777 9 фев 2017 в 20:48

Разъясню позицию, чтобы быть понятым.
Если бы статья писалась в ключе «Теперь мы ловим даже самые сумасшедшие ошибки!», то лучше было бы всем. А от негативного субъективизма хорошо ещё никому не было.
Мне нравится, что делает PVS-Studio, (и особенно тот факт, что они не жадничают и за упоминание в комментариях готовы предоставить бесплатную лицензию некоммерческим проектам. Большое человеческое спасибо им!), недаром также подписан на посты; но…
Вот конкретно такой подход печалит. Я хочу, чтобы компания цвела и пахла, а не жаловалась на «хреновые тесты». И это я процитировал. Автор в статье так прямо и говорит, что тестовая база — хрень. И о том, какой же слабый CPPCheck и какой сильный PVS, вместо того, чтобы чуть допилить анализатор. Как говорится, «спасись сам — и вокруг тебя спасутся многие».
Гораздо конструктивнее было бы просто добавить фичу и предлагать её тем, кто в ней нуждается, а не объяснять, почему такой фичи нет… Я вот об этом.

Antervis 10 фев 2017 в 04:22

ну, значит вы проигнорировали мнение автора, которое можно вольно сформулировать как «наш анализатор слишком взрослый, чтобы играться с той детской тестовой базой»

НЛО прилетело и опубликовало эту надпись здесь

stranger777 9 фев 2017 в 21:02

адекватных клиентов

Конечно, вопрос адекватности довольно важен, что касается консультативной поддержки, (если она включена в лицензию), но в общем и целом один из основных принципов: «Кто платит, тот и музыку заказывает». Звучит довольно цинично, но так и есть… Какая разница, что представляет и не представляет себе клиент, если у него есть деньги и он готов заплатить?

-1

khim 9 фев 2017 в 23:11

Какая разница, что представляет и не представляет себе клиент, если у него есть деньги и он готов заплатить?

Самая прямая и очень серьёзная. Количество попросов в техподдержку очень негативно коррелирует с адекватностью, а готовность платить, наоборот — позитивно. Или, по рабоче-крестьянски: один дурак может задать столько вопросов что и сто мудрецов не смогут на них ответить.

А поскольку компании, почему-то, интересуют не просто деньги, а прибыль, то вопрос адекватности клиентов — очень и очень важен.

stranger777 9 фев 2017 в 23:19

Это понятно.
Думаю, эти вопросы решаются ещё на стадии заключения договора, когда разработчик сразу оговаривает, какие вопросы он решает и какие нет (что далеко ходить, примером — правила хабра). Так отсекается большое число неадекватных запросов. Хотя, конечно, всё равно тратит время службы поддержки и её ресурс.

linux_art 7 фев 2017 в 12:47

В конце статьи написано, что можно скачать и попробовать анализатор. Собственно скачал версию под линукс, попробовать не могу т.к. он требует лицензии :)

Andrey2008 7 фев 2017 в 12:50

Напишите нам письмо и мы отправим Вам временную лицензию.

P.S. Быть может, Вас ещё заинтересует такой вариант лицензирования: Как использовать PVS-Studio бесплатно.

withkittens 8 фев 2017 в 01:02

Как использовать PVS-Studio бесплатно.

Это одна из лучших штук, что вы придумали. Спасибо!

Andrey2008 7 фев 2017 в 21:27

Все, кто пишет, что хочет ещё больше неочишенных сообщений от статических анализаторов кода, никогда этими самыми анализаторами кода не пользовались. Ну или пробовали их на игрушечных проектах. В любом настоящем проекте всегда стоит проблема, как разобраться с имеющимися ложными срабатываниями. Это большая сложная задача, над которой приходится работать как разработчикам анализаторов, так и их пользователям. Куда уж ещё больше предупреждений! :)

Причем, PVS-Studio тут ни причем. То, что я написал относится к любому статическому, будь то Cppcheck или Coverity. Интегрируйте их в проект, размером в 4-5 миллиона строк кода для регулярного использования, а потом можно продолжить дискуссию о необходимости добавки. :)

stranger777 11 фев 2017 в 10:55

Понимаю, что для больших, всяко-разно тестируемых проектов с конвенцией кодирования, разработанной на UML моделью, отдельным архитектором, отдельными квалифицированными программистами с их отдельными задачами, системами сборки, баг-трекерами и конкретным ТЗ «вот это вот всё» целесообразно отключить. Это всё очевидно.
Не понимаю, зачем «взрослому анализатору» (как где-то здесь было написано) жаловаться на детей и пинать их вместо того, чтобы просто сделать функцию и к ней кнопку «вкл/выкл». Хочешь — пользуешься, не хочешь, не нужно — не пользуйся. Да, это работа. Но и да, это ваша работа. И да, спасибо вам за работу.

-4

Killy 8 фев 2017 в 21:09

Как насчёт добавить отдельный класс сообщений «синтетические тесты»? Ну или отдельную диагностику «запуск на синтетическом тесте».
С тем, чтобы в описании дать ссылку на пояснение своей позиции по этому вопросу. Ну или собрать отзывы от тех, кто найдёт «синтетические» ошибки у себя в проекте (if any).

SvyatoslavMC 8 фев 2017 в 22:59

Напомнило демонстрационный режим у современных телевизоров, который включают на витрине и показывают синтетические ~~тесты~~картинки :D

Tujh 9 фев 2017 в 09:59

Скорее уж известную историю с дизельными двигателями VW

-1

Killy 9 фев 2017 в 16:38

Задача демо-режима — покрасоваться перед пользователем.

А у вас тут есть шанс достучаться до потенциального клиента, который пытается делать выбор в условиях неполноты информации. И вы можете показать ему, что знаете, что он сейчас пытается сделать и как он может ошибиться в результате.

-1

Killy 9 фев 2017 в 16:46

Про отключение эмпирической обработки:
Если рассмотреть такую возможность, то я бы добавил кнопку «Мне нечем заняться. Покажи что-нибудь». И показывал порционно, и только на проектах, где других сообщений не осталось.

Andrey2008 9 фев 2017 в 16:58

Когда нечем заняться, а предупреждений больше нет, то рациональнее будет попробовать какой-то другой инструмент или написать новых юнит-тестов, а не выжимать ещё одну каплю. Впрочем, не думаю, что такая ситуация встречается у наших клиентов. Им и некогда и всегда есть Low уровень предупреждений. :)

Killy 9 фев 2017 в 17:23

Этот тред вырисовал психологическую проблему:
Программист, IT-шник, как привило — control freak.
И тут ему говорят, что решение за него принимает не формально верифицируемый алгоритм, а эмпирический. Как же можно! Контроль отобрали и лазеек не оставили!

Мой коммент — не очень серьёзая попытка адресовать эту проблему, предложить морковку на верёвочке…

khim 9 фев 2017 в 18:55

И тут ему говорят, что решение за него принимает не формально верифицируемый алгоритм, а эмпирический. Как же можно! Контроль отобрали и лазеек не оставили!

Ну прямо как Google и Яндекс. Ваш «сферический IT-шник» не плачет в подушку по ночам оттого, что Alta Vista умерла?

Статический анализатор — это, собственно, от начала до конца «эмпирический неверефицируемый алгоритм». Если вам такие не подходят — значит вам, собственно, статический анализатор и не нужен. Либо вы пишите идельный код (да, такие люди встречаются — но редко), либо (что гораздо чаще) — вы реально ни разу ни один анализатор на уровне «параноика» не запускали и с соответствующими сообщениями не боролись.

Killy 9 фев 2017 в 19:13

Вы уверены, что со мной спорите?

-2

Killy 10 фев 2017 в 18:58

Да, резко получилось.
Я понимаю и разделяю позицию Andrey2008 и khim. Но, видимо, из моих комментариев сложилось другое впечатление.

Мне интересны причины, почему не удалось донести позицию до значительного числа читателей, и что с этим можно сделать.
Очевидно, что не все могут переварить предложенное объяснение, пока не имеют соответствующего опыта. Апеллировать к авторскому опыту не слишком помогает. Отсюда и зациклившееся обсуждение. Либо надо искать другие способы донесения своего опыта, дать почувствовать себя на месте авторов, либо искать обходные манёвры.

НЛО прилетело и опубликовало эту надпись здесь

datacompboy 11 фев 2017 в 01:39

А если это обернуть вокруг реальных проектов на гитхабе…

EvgeniyRyzhkov 9 фев 2017 в 17:03

кнопку «Мне нечем заняться. Покажи что-нибудь»

… которая просто вызывает начальника :-)

Andrey2008 20 мар 2017 в 14:27

Продолжение: "Как и почему статические анализаторы борятся с ложными срабатываниями".

Andrey2008 31 мая 2022 в 08:17

Продолжение про Toyota ITC спустя несколько лет: Что там у PVS-Studio c покрытием Toyota ITC Benchmark?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий