《计算机应用研究》|Application Research of Computers

带平衡约束矩形布局优化问题的深度强化学习算法

Deep reinforcement learning algorithm for rectangle layout optimization with equilibrium constraint

免费全文下载 (已被下载 次)  
获取PDF全文
作者 徐义春,万书振,董方敏
机构 三峡大学 计算机与信息学院
统计 摘要被查看 次,已被下载
摘要 带平衡约束的矩形布局问题源于卫星舱设备布局设计,属于组合优化问题。深度强化学习利用奖赏机制,通过数据训练实现高性能决策优化。针对布局优化问题,提出了一个基于深度强化学习的新算法DAR及其扩展算法IDAR。DAR用指针网络输出定位顺序,再利用定位机制给出布局结果,算法的时间复杂性是O(n3)。IDAR算法在DAR的基础上引入迭代机制,算法时间复杂性是O(n4),但能给出更好的结果。测试表明DAR算法具有较好的学习能力,用小型布局问题进行求解训练所获得的模型,能有效应用在大型问题上。两个大规模典型算例的对照实验中,本文提出的算法分别超出和接近目前最优解,具有时间和质量上的优势。
关键词 布局优化问题;指针网络;强化学习;深度学习
基金项目 国家自然科学基金-新疆联合基金资助项目(U1703261)
本文URL http://www.arocmag.com/article/02-2022-01-010.html
收稿日期
修回日期
页码 -
中图分类号 TP183
文献标志码