Не думали об обучении с подкреплением, когда «учителем» выступает среда обитания? Было бы интересно посмотреть на поведение ботов, целью которых была бы максимизация показателя энергии и продолжительности жизни. А при почковании и порождении нового бота, в качестве мутации можно было бы менять веста сети на какой-то небольшой рандомный коэффициент.
Германия в топ 10? Это прикол что-ли какой-то?