6.4.4 TriCaps-RL方法与DQN性能对比