強化学習論文がIJCNN2021にaccept

by Seiji Yamada · 2021-04-10

奥戸嵩登くん（総研大D4）と山田の下記論文が，IJCNN2021にacceptされました．．サブゴール知識を利用する高速強化学習アルゴリズムDTA(dynamic trajectory aggregation)の初のトップカンファレンス論文です．この研究は，奥戸くんの博士論文研究のコアアルゴリズムなので，まずはよかったです．この後，一つ前のアルゴリズムSRSの論文が続きます．

Takato Okudo and Seiji Yamada: Reward Shaping with Dynamic Trajectory Aggregation, In Proceeding of 2021 International Joint Conference on Neural Networks (IJCNN2021), online (July 2021) doi: