模式识别与人工智能(基于MATLAB)
上QQ阅读APP看书,第一时间看更新

2.1 贝叶斯决策及贝叶斯公式

2.1.1 贝叶斯决策简介

贝叶斯决策理论就是在不完全情报下,对部分未知的状态用主观概率进行估计,然后用贝叶斯公式对发生的概率进行修正,最后再利用期望值和修正概率做出最优决策。

贝叶斯决策属于风险型决策,决策者虽不能控制客观因素的变化,但却掌握其变化的可能状况及各状况的分布概率,并利用期望值即未来可能出现的平均状况作为决策准则。

贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想如下。

(1)已知类条件概率密度参数表达式和先验概率。

(2)利用贝叶斯公式转换成后验概率。

(3)根据后验概率大小进行决策分类。

2.1.2 贝叶斯公式

若已知总共有M类样品,以及各类在n维特征空间的统计分布,根据概率知识可以通过样品库得知已知各类别ωii=1,2,…,M)的先验概率Pωi)及类条件概率密度函数PXωi)。对于待测样品,贝叶斯公式可以计算出该样品分属各类别的概率,叫作后验概率;比较各个后验概率,取PωiX)的最大值,就把X归于后验概率最大的那个类。贝叶斯公式为

1.先验概率

先验概率Pωi)代表还没有训练数据前ωi拥有的初始概率。Pωi)反映了我们所拥有的关于ωi是正确分类的背景知识,它是独立于样本的。如果没有这一先验知识,那么可以简单地将每一候选类别赋予相同的先验概率,通常用样本中属于ωi的样本数与总样本数的比值来近似。

2.后验概率

后验概率是关于随机事件或者不确定性断言的条件概率,是在相关证据或者背景给定并纳入考虑之后的条件概率。后验概率分布就是以未知量作为随机变量的概率分布,并且是在基于实验或者调查所获得的信息上的条件分布。“后验”在这里的意思是考虑相关事件已经被检视并且能够得到一些信息。这种可能性可用Pymx)表示。可以利用贝叶斯公式来计算这种条件概率,称为状态的后验概率Pymx)。

Pymx)表示在x出现的条件下样品为ym类的概率。在这里要弄清楚条件概率这个概念。

3.先验概率与后验概率的区别

先验概率是指根据以往经验和分析得到的概率,它往往作为“由因求果”问题中的“因”出现。后验概率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的“因”。后验概率是基于新的信息,修正原来的先验概率后所获得的更接近实际情况的概率估计。先验概率和后验概率是相对的。如果以后还有新的信息引入,更新了现在所谓的后验概率,得到新的概率值,那么这个新的概率值被称为后验概率。