A.需要计算先验概率B.对缺失数据敏感C.对小规模的数据表现很好D.算法成立的前提是假设各属性之间互相独立
A.BERT模型可用作特征提取B.神经网络语言模型可解决维数灾难的问题C.GPT和ELMo使用整个模型的全部参数来表示词向量D.BERT是一个双向注意力模型
A.计算速度快B.适用于短文本C.占用空间少D.解决稀疏性问题