第1章 AI与大模型时代对基础架构的需求

1.1 我们在谈论AI时，到底在谈论什么

2022年年底，以ChatGPT为代表的生成式AI及大模型技术，再次掀起机器学习的热潮。

为什么使用“再次”这个词呢？

这是因为，2016年，机器学习因Google主导开发的AlphaGo（围棋AI程序）与围棋世界冠军李世石的人机大战而掀起热潮。在此之前，绝大多数人都不看好AlphaGo，认为李世石能够轻松战胜计算机。但最终的结果颠覆了人类过往的认知，AlphaGo以4:1的绝对优势战胜了李世石。

可能一些读者还听说过，1997年，IBM的超级计算机“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫。那么，究竟是什么原因，使得计算机在国际象棋领域战胜人类以后，又经过了近二十年的飞速发展，才实现在围棋领域战胜人类呢？

这是因为，国际象棋和围棋虽然都是棋类游戏，但关于局面价值判断的数学模型相去甚远。

在国际象棋中，只要擒获对方的“王”，就可以取得胜利，因此对于局面价值判断，其实可以用一个比较简单的数学模型来描述，也就是子力本身价值与子力控制范围的价值的加权。

而在围棋棋局中，对于局面价值判断，往往存在较大的争议。看一个例子：图1-1所示是日本围棋大师武宫正树在决定全球首个围棋世界冠军归属的1988年富士通杯决赛中下出的着法。

对于黑1这一手，在整个围棋界一直存在争议，武宫正树本人一直认为这是当前局面的最优解，但包含多名世界冠军在内的一些其他高手持反对意见。这也使得此局成为了围棋史上的名局，理由是武宫正树下出了一般人难以想到的创新着法，并最终凭此手棋赢得了全球首个围棋世界冠军。

图1-1

棋界对于武宫正树这手棋的争论，直到以AlphaGo为代表的围棋AI程序出现才有初步的结论——虽然武宫正树在下出黑1后，黑方有较大优势，但如果将黑1下在其他地方，黑方的优势会更大。

在围棋AI程序出现之前，这样的争议并不少见。这是因为，关于围棋的局面价值判断的数学模型非常复杂，存在很多难以量化评估的因素，人类一直难以建立精确的数学模型，取而代之的是围棋高手的“境界”。这也是围棋AI程序棋力长期停滞在较低水平的原因。

AlphaGo在围棋领域取得突破的核心因素是，它实现了较为精确地评估围棋局面价值及着法价值优劣的数学模型。这种数学模型就是Google通过机器学习方式，使用深度神经网络算法学习了10万局以上的人类棋谱得到的。

我们可以发现，在计算机看来，国际象棋或中国象棋与围棋的最大差异，在于采用的评估局面价值及着法价值优劣的数学模型。国际象棋或中国象棋采用的数学模型是通过专家系统实现的，而围棋采用的数学模型是通过机器学习实现的。

机器学习指的是，先构建一个参数待定的高次线性方程模型，再输入大量的训练样本（也就是方程模型中自变量及因变量的值），让计算机算出方程模型的参数。该参数被称为“权重”，该步骤被称为“训练”。而基于机器学习得到的方程模型，通过输入自变量得到因变量的过程，被称为“推理”。

在本书中讨论的AI算法，均指这种机器学习及推理算法，不包括基于专家模型的算法。

在接下来的部分章节中会出现一些数学公式，不超出高中数学的范畴，请不要轻易跳过这部分内容，因为学习这部分内容对于理解机器学习的本质有非常大的帮助。

本周热推：