近日,娱乐城论坛
谢芳副教授在《Expert Systems with Applications》(中科院一区TOP,IF:7.5)上发表题为《Integrating simulation, optimization and reinforcement learning for a general class of stochastic scheduling problems》的学术论文。在线娱乐城论坛
为该论文第一单位,谢芳副教授为论文第一作者,
论文围绕随机调度问题展开研究,在考虑活动持续时间不确定、资源约束及时序关系等多重制约因素下,将离散时间马尔可夫链(DTMC)、近似动态规划(ADP)与强化学习纳入统一的研究框架。结合模拟、优化算法及遗传算法等技术,分析了不同方法对求解随机资源受限项目调度问题(SRCPSP)的性能影响,构建了可计算的闭环策略。结果表明,所提出的Sim-Opt-RL框架在15 组测试实例中9组表现优于现有算法,处理120个活动的实例平耗时小于30 分钟。本研究首次将模拟、优化与强化学习集成于随机调度问题的闭环策略设计,为复杂不确定环境下的资源调度提供了可扩展的算法框架与决策参考。
论文链接://www.sciencedirect.com/science/article/abs/pii/S0957417425011108
资料来源:烟台大学社科动态//www.ylcluntan.com/info/1211/19640.htm