课程介绍
智能计算
课程介绍
讲义
Week 1: 商业决策智能化与强化学习概览
Week 2: 序贯决策建模 - 马尔可夫决策过程 (MDP)
Week 3: 最优决策与 Bellman 最优方程
Week 4: 蒙特卡洛方法 - 从完整经验中学习
Week 5: 时序差分学习 - 从不完整经验中学习
Week 6: 同策略控制 - SARSA
Week 7: 异策略控制 - Q-Learning (重点)
SARSA 与 Q-Learning 算法详解与探索策略对比
Week 8: Q-Learning 应用讨论与中期回顾
Week 9: 函数逼近入门
Week 10: 深度 Q 网络 (DQN)
Week 10 综合实验:DQN 强化学习综合实践
Week 11: 策略梯度方法 (Policy Gradient Methods)
Week 12: Actor-Critic 方法
Week 13: 商业案例分析与模拟:动态定价
Week 14: 商业案例分析与模拟: 个性化推荐与营销
智能计算 - 期末大作业要求
练习
Week 1 - 学生练习
Week 2 - 学生练习
Week 3 - 学生练习
Week 4 - 学生练习
Week 5 - 学生练习
Week 6 - 学生练习
Week 7 - 学生练习
Week 8 - 学生练习
Week 9 - 学生练习
Week 10 - 学生练习
Week 11 - 学生练习
Week 12 - 学生练习
智能计算
Author
陆海波
Published
May 21, 2025
欢迎来到《智能计算》课程!
Week 1: 商业决策智能化与强化学习概览