摘要:为提高单点控制交叉口时段内信号配时的准确性,采用强化学习方法构建时段内信号配时优化模型。该模型以时段内原始固定信号配时方案为基准,向其上下区域探索建立状态空间及动作空间,同时以时段内交通状态为依据,设置常规及异常状态开关,用于区分学习常规及异常状态下Q值表,并在回报函数上进行特别设置,以快速响应交通的短期突变及长期缓慢变化,减少因交通环境变化导致Q值表不能及时适应交通状况的现象。最后通过仿真对该算法的有效性进行验证,结果表明采用该算法能生成合理的配时方案,且可将交叉口车辆总延误降低24%。