更新时间:2024-06-28 19:12:56
封面
版权页
作者简介
前言
第1章 绪论
1.1 研究背景和意义
1.2 车间生产调度问题及研究现状
1.3 研究内容及目标
1.4 技术路线及创新点
第2章 概率推理
2.1 贝叶斯公式
2.2 概率图模型
2.3 本章小结
第3章 样本学习
3.1 决策树
3.2 回 归
3.3 支持向量机
3.4 非参数化学习
3.5 集成学习
3.6 无监督学习和半监督学习
3.7 本章小结
第4章 神经网络和深度学习
4.1 深度前馈神经网络
4.2 深度卷积神经网络
4.3 深度循环神经网络
4.4 深度自动编码器
4.5 核函数方法深度学习
4.6 激活函数
4.7 本章小结
第5章 强化学习
5.1 马尔可夫链蒙特卡洛方法
5.2 动态规划
5.3 深度强化学习
5.4 本章小结
第6章 监督学习方式求解车间生产调度问题
6.1 引 言
6.2 问题描述
6.3 调度规则与样本数据
6.4 自注意力模型
6.5 LSTM-PtrNets-CRF模型
6.6 实验与结果分析
6.7 本章小结
第7章 值函数逼近算法求解车间生产调度问题
7.1 引 言
7.2 问题描述
7.3 状态表示和动作构建
7.4 状态与动作映射
7.5 奖励函数与值函数计算
7.6 实验与结果分析
7.7 本章小结
第8章 策略梯度算法求解车间生产调度问题
8.1 引 言
8.2 问题描述
8.3 注意力机制
8.4 模型框架
8.5 策略梯度优化方法
8.6 实验与结果分析
8.7 本章小结
第9章 混合Q-learning算法求解多目标车间生产调度问题
9.1 引 言
9.2 问题描述及优化目标
9.3 改进NSGA-Ⅱ算法
9.4 路径优化算法设计
9.5 强化学习避障策略
9.6 实验与结果分析
9.7 本章小结
第10章 NASH-Q-learning算法求解分布式车间生产调度问题
10.1 引 言
10.2 问题描述
10.3 迭代贪婪算法
10.4 多智能体深度强化学习
10.5 多智能体平均场深度强化学习算法
10.6 实验与结果分析
10.7 本章小结
第11章 总结与展望
11.1 全书总结
11.2 进一步的工作
参考文献
内容简介