摘要:
在传统多期分布式鲁棒投资组合选择模型中,不确定集合的估计是一个具有挑战性的难题。使用贝叶斯强化学习方法来动态更新不确定集合中的一、二阶矩等模型参数,进而研究贝叶斯强化学习框架下均值–最坏鲁棒 CVaR 模型的求解问题。通过结合动态规划和渐进对冲算法,设计了两层分解求解框架。下层通过求解一系列二阶锥规划来得到给定模型参数下子问题的最优策略,上层使用贝叶斯公式得到可实施的非预期投资策略。基于美国股票市场的实证结果表明:多期鲁棒强化学习投资组合选择模型相较传统模型具有更好的样本外投资表现。
李柔佳, 段启宏, 冯卓航, 刘 嘉. 多期贝叶斯强化学习鲁棒投资组合选择模型[J]. 工程数学学报, 2024, 41(2): 232-244.
LI Roujia, DUAN Qihong, FENG Zhuohang, LIU Jia. Multi-stage Bayesian Reinforcement Learning Robust Portfolio Selection Model[J]. Chinese Journal of Engineering Mathematics, 2024, 41(2): 232-244.