当前位置: 首页>> 教学科研

网络科学与智能控制系列讲座第15讲:西安理工大学刘兴华教授应邀作学术报告

编辑:戴扬 预审:崔建 终审:黄友生
发布日期:2026-04-30         浏览次数:

2026429日,西安理工大学刘兴华教授应邀在网络科学与智能控制系列讲座第15讲作题为 基于深度强化学习的主动配电网恢复策略研究 的学术报告。报告在腾讯会议线上举行。报告会由学院孔凡超副教授主持,应用数学专业部分研究生参加了报告会。

本次报告的主要内容是刘兴华老师关于利用深度强化学习构建高韧性主动配电网恢复策略的研究介绍。报告的核心背景是在新型电力系统建设的背景下,配电网因直接连接终端用户且可再生能源渗透率提高,面临极端事件时更为脆弱。为了提升其韧性,研究工作主要围绕事后恢复阶段,利用强化学习来实现供电恢复。研究内容可分为以下四个递进的方面:1. 基础框架:解决三相不平衡问题。针对接入可再生能源后出现的三相不平衡问题,报告介绍了团队早期提出的一种基于图注意力网络(GAT)与深度确定性策略梯度(DDPG)结合的图强化学习框架,以提升对配电网状态感知和决策能力。2. 系统建模:构建异构多智能体协同恢复策略。 为了更精细地模拟恢复过程,研究定义了开关智能体微电网智能体两类异构智能体,分别负责划分孤岛和优化孤岛内运行,并采用集中式训练、分布式执行的框架来解决多智能体协同恢复问题。3. 应对不确定性:提出记忆增强的恢复策略。考虑到可再生能源出力的随机性,研究将恢复问题建模为部分可观马尔可夫决策过程(POMDP),并将历史观测信息作为记忆封装到智能体的观测空间中,从而提出了一种记忆增强的递归图强化学习算法(RGSAC)来提升在不完全观测下的决策性能。4. 增强泛化能力:引入元学习思想快速适应新场景。 为了使智能体能在不同或变化的故障场景中快速适应,研究提出了一个结合图学习、强化学习和元学习的三层框架,其中元学习作为外循环用于学习通用策略,从而在面对新环境时能快速调整。

最后,报告总结这些工作共同构成了一套全面的智能恢复策略体系,并已发表多篇高水平论文。在问答环节,刘老师与孔老师等还讨论了记忆在控制理论中的含义,以及面对审稿周期长的期刊时的投稿策略。

此次学术报告是网络科学与智能控制系列活动的重要组成部分。学院非连续系统稳定与控制课题组将继续依托这一学术平台,邀请领域内知名学者开展深度交流活动,持续营造浓厚的学术氛围,推动应用数学、运筹学与控制论等专业的建设,并不断提升人才培养质量。