katyrosomaha 2 июл 2018 в 09:09

Анализ унаследованного кода, когда исходный код утрачен: делать или не делать?

6 мин

8.5K

Блог компании СоларКомпиляторы*Программирование*

+23

Комментарии 16

Toxygen 2 июл 2018 в 09:38

Картинка не правильная. В мясорубку должна входить сосиска, а выходить барашек.

katyrosomaha 2 июл 2018 в 09:41

Спасибо за замечание :) Там так и нарисовано, только стрелки в обратном порядке поставлены с идей, что процесс в две стороны рассматривается.

katyrosomaha 2 июл 2018 в 10:27

Заменила картинку :) Спасибо.

katyrosomaha 3 июл 2018 в 08:08

Я как-то неловко отклонила Ваше предложение поменять барана и сосиску местами. Но в этот раз все верно: ДЕкомпилятор — это «мясорубка наооборот», которая именно из фарша (бинарника) восстанавливает подобие исходника, то есть барана :)

НЛО прилетело и опубликовало эту надпись здесь

Deosis 3 июл 2018 в 05:08

Все оптимизации компилятора должны сохранять наблюдаемое поведение.
До оптимизации функция либо падала при доступе к нулевому указателю либо записывала значение в память. После оптимизаций она делает то же самое.
Более эпичный случай: компилятор может иногда выкинуть бесконечный цикл:

int infinte(){
int counter = 0;
while(true){
  counter++;
  if(PureVeryComplicatedCondition(counter))
    return 1;
}
return 0;
}

katyrosomaha 3 июл 2018 в 08:06

Про оптимизационные преобразования Вы говорите верно, однако примеры, приведенные в публикации, рабочие. Там написано, как получен представленный ассемблер, чтобы каждый мог повторить и убедиться сам. Первый пример действительно на выполнение вызовет функцию, которая никогда не должна вызываться.

katyrosomaha 3 июл 2018 в 08:04

Низкоуровневое программирование — оно такое, чем дальше двигаешься, тем больше сюрпризов. «Я знаю, что ничего не знаю» — Сократ сказал очень верно :)

katyrosomaha 3 июл 2018 в 07:59

Мы делаем вручную с помощью инструментальных средств, помогающих анализировать низкоуровневые программы. Undefined behavior можно находить в исходнике на С/C++, но в бинарнике искать надежнее. Я сама использую IdaPro для низкоуровневого анализа. Для анализа C/C++ и других программ по исходникам использую InCode. Конечно, большинство работы для анализа бинарников делается руками.

qw1 3 июл 2018 в 10:02

О каком undefined behavior в бинарниках вы говорите?
Компилятор переводит C++ программу с UB в опкоды x64, поведение которых специфицировано производителем CPU. UB исчезает.

Или вы ищете недокументированные опкоды процессора? Откуда они после компилятора?

katyrosomaha 3 июл 2018 в 13:05

Я говорю о том, что UB в исходной C/C++ программе может привести к различным непредсказуемым defined behavior в низкоуровневой программе. Именно поэтому проверить исходник может быть недостаточно, а для более точного анализа надо проверять и исходник, и бинарник.

qw1 3 июл 2018 в 17:11

Ага, то есть нужно скомилировать C++ в код, затем декомпилировать обратно в C++, проанализировать результат (вручную?). Если никакой странной лажи не появилось, то, наверное, в исходной программе нет UB. Не слишком ли дорого выходит?

katyrosomaha 3 июл 2018 в 21:33

Нет, совсем не так. В статье же написано, что декомпиляцию стоит выполнять, если надо понять содержательный аспект бинарника. В декомпилированном коде уязвимости искать несравненно сложнее, нежели в исходнике, так как «артефакты» восстановления мешают работе статических анализаторов.
Анализировать и исходник, и бинарник, но именно бинарник в бинарном виде (по ассемблеру, например) нужно, если у вас критичный по надежности фрагмент кода и надо точно понимать, что будет выполняться.
В статье приведены 2 примера, когда именно по ассемблеру отлавливается уязвимость, которая «спряталась» в исходнике.

Brak0del 3 июл 2018 в 15:59

Интересная статья. Скажите, у вас используются какие-то специальные инструменты для обнаружения undefined behavior или это выполняется «врукопашную»? Не пробовали ли учесть опыт обнаружения подобных косяков в каком-нибудь средстве автоматизации/плагине и т.д.?

katyrosomaha 3 июл 2018 в 16:00

Brak0del 3 июл 2018 в 18:30

ясно, спасибо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий