サブゴールを使った強化学習の論文がIEEE Accessに掲載
奥戸嵩登くん(総研大D4)と山田の下記論文が,IJCNN2021にacceptされました..サブゴール知識を利用すたreward shapingにより強化学習を高速化するアルゴリズムSRS(subgoal-based reward shaping)の初のトップジャーナル論文です.この研究は,先にIJCNN2021で発表されたDTAの一つ前のアルゴリズムです.
- Okudo Takato and Seiji Yamada: Subgoal-based Reward Shaping to Improve Efficiency in Reinforcement Learning, IEEE Access, 13 pages (June, 2021) DOI: 10.1109/ACCESS.2021.3090364