8.1 强化学习在ChatGPT迭代中的作用