3.2 线性判别函数
判别函数分为线性判别函数和非线性判别函数。最简单的判别函数是线性判别函数,它是由所有特征量的线性组合构成的。我们现在对两类问题和多类问题分别进行讨论。
1.两类问题
对于两类问题,也就是Wi=(ω1,ω2)T。
1)二维情况
取二维特征向量X=(x1,x2)T,这种情况下的判别函数g(x)=ω1x1+ω2x2+ω3,其中,ωi(i=1,2,3)为参数;x1和x2为坐标值,判别函数g(x)具有以下性质:当x∈ω1时,gi(x)>0;当x∈ω2时,gi(x)<0;当x不定时,gi(x)=0。这是二维情况下由判别边界分类。
2)n维情况
对于n维情况,现抽取n维特征向量:X=(x1,x2,…,xn)T,判别函数为g(x)=W0X+ωn+1。其中,W0=(ω1,ω2,…,ωn)T为权向量;X=(x1,x2,…,xn)T为模式向量。另外一种表示方法是g(x)=WTX。其中,W=(ω1,ω2,…,ωn,ωn+1)T为增值权向量;X=(x1,x2,…,xn,1)T为增值模式向量。
在这种情况下,当x∈ω1时,g(x)>0;当x∈ω2时,g(x)<0;g1(x)=0为边界,当n=2时,边界为一条直线,当n=3时,边界为一个平面,当n>3时,边界为超平面。
2.多类问题
对于多类问题,模式有ω1,ω2,…,ωM个类别,可以分为下面三种情况。
1)第一种情况
每个模式类与其他模式可用单个判别平面分开,这时M个类有M个判别函数,且具有性质
式中,Wi=(ωi1,ωi2,…,ωin+1)T为第i个判别函数的权向量。当x∈ωi时,gi(x)>0,其他情况下gi(x)<0,也就是每一个类别可以用单个判别边界与其他类别相分开。
2)第二种情况
每个模式类和其他模式类之间可以用判别平面分开,这样就有个平面,对于两类问题,M=2,则有1个判别平面,同理对于三类问题,就有3个判别平面。判别函数为
式中,i≠j,判别边界为gij(x)=0,条件为:当x∈ωi时,gij(x)>0;当x∈ωj时,gij(x)<0。
3)第三种情况
每类都有一个判别函数,存在M个判别函数:gk(x)=WkX(k=1,2,…,M),边界为gi(x)=gj(x),条件为:当x∈ωi时,gi(x)最大;其他情况下gi(x)小。也就是说,要判别X属于哪一个类,先把X代入M个判别函数,判别函数最大的那个类就是X所属类别。