价值对齐问题:人们把握机器人奖励功能的关键