深入浅出AI算法:基础概览
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.5 最优化原理

最优化原理是应用数学的一个分支,是关于最优设计、最优控制、最优管理问题的理论与方法。AI算法要解决的大部分问题都是在寻找一组适配模型的最优参数解,都可以归结为最优化问题。最优化问题就是将问题先用最优化的方法建立数学模型,再以最优化的方式求解。

最优化问题分为有约束的最优化问题和无约束的最优化问题。有约束的最优化问题分为等式约束优化问题和不等式约束优化问题,这类问题通常使用拉格朗日乘数法和KKT条件解决;无约束的最优化问题分为全局最优化问题和局部最优化问题,这类问题可以使用牛顿法和最小二乘法解决。

最优化问题还有一个分支,叫作凸优化。凸优化的局部最优解就是全局最优解。而大部分AI算法问题,其实都是在解决凸优化问题。解决凸优化问题的方法是梯度下降法,大致步骤如下:首先初始化算法模型的参数权重,然后依据样本数据计算误差和梯度,最后根据梯度下降法优化各参数权重,直到误差下降到可接受范围内,训练结束。

最优化问题的学术理论要求较高,本书的侧重点并不在于此,感兴趣的读者可以自行深入学习。