附录B 策略学习顺序