Автор не привел результаты такого новшества.
Иными словами, реализован алгоритм локального точечного исправления кода под контролем оператора (программиста), пока последний не остановит этот процесс, автомат не приступит к непосредственному процессу и будет бесконечно учиться.
Интересно сколько времени занимает такой метод по сравнению с другими. С одной стороны отпадает необходимость в привлечении кодера, с другой время — деньги. Реализована ли технология мониторинга одновременного обучения.
Если в качестве примера взять алгоритм обучения манипулятора Baxter, там не требуется мониторить процесс, все присходит в 1 заход «Мастер — ученик».
Статья нуждается в более развернутом изложении.
В NVIDIA разработали способ обучения роботов почти без вмешательства человека