清华大学交叉信息研究院高阳课题组在强化学

近日，清华大学交叉信息研究院高阳研究组在强化学习领域中取得突破，研究组所提出的模型EfficientZero首次在雅达利（Atari）游戏数据上超过同等游戏时长的人类平均水平。EfficientZero的高效率学习能力为强化学习算法应用到现实世界场景提供了更大可能。

EfficientZero在Atarik（2h环境数据）基准下与其他算法结果对比

该研究成果一经公开，便在学术圈引发

转载请注明地址:http://www.abmjc.com/zcmbhl/2514.html

最新文章