聊天机器人:入门、进阶与实战
上QQ阅读APP看书,第一时间看更新

第2章 语言模型与多元文法

语言模型(Language Model,LM)是指词序列的概率模型。利用语言模型可以计算词序列作为一个句子出现的概率或者对句子中下一个出现的词进行预测。语言模型在自然语言处理中具有重要的地位,尤其在基于统计模型的语音识别、机器翻译、汉语自动分词和句法分析等相关研究中得到了广泛的应用。

求解语言模型的常用方法包括N-Gram模型、最大熵模型、马尔可夫模型、条件随机场模型、神经网络等。本章主要介绍词袋模型、N-Gram模型和一些常用的数据平滑方法。