tsung интересная штука, но его графики/цифры сильно зависят от того как настроена сессия пользователя. В итоге довольно важно качество составления теста и правильная интерпретация результатов тестирования, это еще отдельная задачу.
Более простые инструменты (вроде Apache Benchmark) имхо дают более простую и понятную оценку.
Там на каждого пользователя заводится процесс виртульной машины, они не соответствуют тредам ОС. Чисто внешне (если смотреть strace) это выглядит как программа написанная с использованием мультиплексного ввода-вывода (select/poll/epoll и т.п., что именно зависит от ОС)
там есть хитрая опция XX:+OptimizeStringConcat, которая, по идее, должна убирать StringBuilder.toString() в ситуациях когда можно обойтись без него. Но документация по ней туманна, когда она реально помогает мне не понятно
строковую конкатенацию вроде оптимизируют в новых JDK. А с new vs valueOf оптимизация затруднительна — new должен гарантированно давать новый объект (мало ли кто что потом будет с ним делать, например использовать в качестве монитора синхронизации или ключа в IdentityHashMap)
копирование решается использованием maven-ant-plugin (если не хватает более подходящих вещей, заточенные на конкретные типы сборки, вроде maven-assembly-plugin)
Технически можно, но практически так думаю не делают. По крайней мере в Android если добавить халявный билайн-wifi, то он будет присоединяться к сети с таким названием в любом бигмаке. Не думаю что там mac точки доступа одинаковый
Более простые инструменты (вроде Apache Benchmark) имхо дают более простую и понятную оценку.