【深層強化学習】Actor-Critic マルチタスク学習でモデルは優秀に(実験しました) - Qiita

Actor-Criticを深層学習で実現する場合、主に以下の図の2通りのNN(Neural Network)構成がありえます。これらのうち、中間層を共有した「共有型」は、単一NN内に、Actorの…

Qiita