多项选择题

A.更高的并行计算能力
B.更强的长期依赖捕捉能力
C.更少的参数量
D.更简单的模型结构