当前位置:首页 > 学生工作 > 学术交流

【机电学院·博导论坛】融入先验知识的强化学习

发布时间:2022-05-26

 

主讲人:任肖强 教授

主讲题目:融入先验知识的强化学习

主讲时间:20225271430

主讲方式:腾讯会议 207 270 514

主讲人简介:任肖强,上海大学机电工程与自动化学院教授、博导,研究方向为信息物理融合系统的安全智能控制。2012年获得浙江大学学士学位,2016年获得香港科技大学博士学位,其后在香港科技大学、新加坡南洋理工大学、瑞典皇家理工学院从事博士后研究工作。2019年入选了国家海外高层次人才引进计划青年项目,主持国家重点研发项目课题一项。

讲座简介:在本次报告中,围绕如何把先验知识融入到强化学习的设计与训练的主题,介绍我们近期的一些工作,包括未知通信信道数据的远程状态估计器的调度设计、在不规则环境下的抓取的快速学习。其中,调度器的设计中,Q函数被证明是关于状态和行为值是次模和单调的。基于此,设计了保结构的Q学习算法,以强制瞬时的Q函数满足上述的结构。算法的收敛性得到了理论证明而大量的实验数据显示出了此算法相比于经典的Q学习算法的收敛速度提升。在不规则环境下的抓取中,提出了一种通过不规则度量化及Q映射的掩藏的预抓取和抓取快速学习深度强化学习算法。此算法在需要极少的训练数据即可实现与当前主流算法相当的抓取精度。

 

附件下载: