強化学習論文がIJCNN2021にaccept by Seiji Yamada · 2021-04-10 奥戸嵩登くん(総研大D4)と山田の下記論文が,IJCNN2021にacceptされました..サブゴール知識を利用する高速強化学習アルゴリズムDTA(dynamic trajectory aggregation)の初のトップカンファレンス論文です.この研究は,奥戸くんの博士論文研究のコアアルゴリズムなので,まずはよかったです.この後,一つ前のアルゴリズムSRSの論文が続きます. Takato Okudo and Seiji Yamada: Reward Shaping with Dynamic Trajectory Aggregation, In Proceeding of 2021 International Joint Conference on Neural Networks (IJCNN2021), online (July 2021) doi: シェアする