本章从文本表示和文本分类两个方面介绍文本内容理解,详细介绍了多种文本表示和文本分类模型。其中,使用最广泛的文本表示模型是word2vec和BERT,感兴趣的读者可以阅读相关论文。近年来,以BERT为代表的预训练语言模型在文本分类任务上有较大的优势,尤其是在医疗、游戏等专业领域的文本分类场景中,经过专业领域语料预训练的模型可以取得更高的分类准确率。在实际应用中,读者可以多关注如何利用预训练模型提升文本分类的准确率。