3月19日上午,浙江师范大学刘洋教授应邀在数学与统计学院“零壹论坛”第227讲作题为《翻转控制与强化学习算子在布尔网络中的应用》的学术报告。报告会以腾讯会议的形式开展,由黄守军教授主持,学院何春蕾副教授、孔凡超副教授以及应用数学专业的部分研究生等共计约50人参加了报告会。
报告会上,刘洋教授首先介绍了强化学习和翻转控制理论基本概念,较为详细地讨论了已知模型的强化学习和未知模型的强化学习,指出状态值函数的优化迭代的三个算法,即迭代的策略评估、策略迭代和值迭代,以五号房间问题为例解释了Q-Learning算法。随后,刘教授详细地讲解了他们团队建立的新的算法理论在布尔网络全局稳定中的应用,并指出翻转控制与其他控制以及牵制控制的区别。最后,刘教授简要介绍了他们团队在该研究领域取得的最新成果。
报告结束后,刘洋教授和与会师生进行了热烈的讨论和交流。本场报告会学术氛围浓厚,有效促进了我院应用数学方向,特别是微分方程与动力系统研究团队的对外学术交流和合作。