99精品视频在线观看

学术预告 首页  >  学术科研  >  学术预告  >  正文

学术报告-强化学习原理及概述
作者:     供图:     供图:     日期:2020-11-19     来源:    

讲座主题:强化学习原理及概述

主讲人: 刘磊

工作单位:河海大学

活动时间:2020年11月21日 10:10--10:50

讲座地点:腾讯会议会议ID:281 913 245

主办单位:99精品视频在线观看数学与信息科学学院

内容摘要:

强化学习(Reinforcement Learning),属于一种机器学习架构,它是通过让智能体(Agent)不断地对所处环境(Environment)进行探索和开发并根据反馈的回报(Reward)进行的一种经验学习。2016年,谷歌旗下DeepMind团队发布的AlphaGo以4:1的战绩击败了世界围棋冠军里李世纪石,引爆了强化学习的发展势头。近年来,不论在科研界还是工业界,强化学习发挥重要的作用。本报告介绍强化学习的数学原理,以及动态规划、蒙特卡洛、时序差分等基本算法。在时间允许的情况下,将介绍DQN和Actor-Critic等深度强化学习算法。

主讲人介绍:

刘磊,男,1983年06月,博士,副教授,博士生导师。主持国家自然科学基金面上项目一项,国家博士后基金特别资助项目一项、国家博士后基金面上项目一项、江苏省博士后资助计划一项;完成国家自然科学青年项目一项。入选2018年度江苏省青蓝工程优秀青年骨干教师培养对象,2018年度河海大学首届大禹学者人才计划第叁层次。以第一作者或通讯作者在《IEEE Transactions on Automatic Control》、《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Systems, Man, and Cybernetics: Systems》、《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等厂颁滨期刊上发表论文20篇。