5.2.1 Sparse Transformer的特点