Как стать автором
Обновить

Комментарии 3

ssdeep нужно патчить: для коротких одинаковых последовательностей он выдает значения меньше 100

Тут многое зависит от специфики данных, но на коротких последовательностях все алгоритмы работают плохо, это так. В нашем сценарии (анализ ответов сетевых сервисов) были тоже нюансы.
Кроме того, "нужно патчить" еще с точки зрения производительности, "из коробки" все очень медленно. Хороший, хоть и старый манул https://www.virusbulletin.com/virusbulletin/2015/11/optimizing-ssdeep-use-scale

В случае с ssdeep там искуственное ухудшение схожести на коротких (не помню точно сколько байт) данных. 100 в принципе невозможно получить :-)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий