2.2.1 自注意力机制的计算过程