К сожалению, псевдокод и формулы очень сложно написать в браузере из-за большого количества спецсимволов. Их проще вставлять картинками. Поэтому лучше читать на экране побольше, чем телефон.
Нет, перевожу для себя. Найденный мной в сети перевод сделан банальным переводом, через гугл переводчик, без попытки переосмысления текста, что делает его практически бесполезным. Оригинальная статья мной переведена и дополнена, стала более понятной.
Введение в различные алгоритмы обучения с подкреплением (Q-Learning, SARSA, DQN, DDPG)