上QQ阅读APP看书，第一时间看更新

第9章马尔可夫和弥达斯

马尔可夫链是20世纪最具开创性的思想之一。它由俄罗斯数学家和信息理论家安德烈·马尔可夫于1913年提出，成为一套从现实出发预测未来的统计工具。这项技术在所谓“隐马尔可夫模型”中得到了强有力的扩展，用以揭示一系列观察结果背后未被观察到的现实。被广泛运用于谷歌的猫狗图像识别，基于时间变化的天气模式构建，甚至对人类思想的解读等领域。[58]

马尔可夫蓄着浓密的黑胡须，他是无神论者，是一位国际象棋大师，也是一位政治活动家，被人称为“愤怒的安德烈”。他是一个脾气暴躁的天才，在沙皇统治的最后几年里，他与俄国的左翼站在了一起。尽管一生中，他作为数学家取得了一定的成就，但是只有当人们认识到他的工作对谷歌时代的世界体系重要而基础的作用的时候，世人才真正认识到他的影响力，然而这已经是100多年之后的事情了。

从物理学到经济学，长期以来科学与时间总是嫌隙不断。在马尔可夫之前，概率论和物理学一样，大多都避免考虑时间因素。正如艾米·朗维尔和菲利普·冯·希尔格斯在一篇权威论文中所写的那样，主流的概率概念未能区分序列过程和并行过程，也无法判断“一个骰子掷一千次，一千个骰子同时掷一次”的区分。[59]马尔可夫链探究事物从一种状态或条件到另一种状态或条件概率转移的生发过程，探究事件之间的时间依赖关系，追溯一件事情引发另一件事情的因果联系。

马尔可夫追随19世纪智力巨人詹姆斯·克拉克·麦克斯韦和路德维希·玻尔兹曼的脚步，学习他们在物理学中开创的统计思维模式。他们发明了概率工具，用以描述诸如原子、分子、波和粒子的隐藏行为。这些物理现象在当时的科学仪器中都无法看到或测量到。他们的热力学统计定律为理论物理学提供了一个亟须的时间轴，而时间轴的概念便是来自熵。

应该注意到，在马尔可夫公开阐述和使用这些统计工具的几年前，阿尔伯特·爱因斯坦已经开始阐述和使用这些统计工具了。1905年，爱因斯坦计算了布朗运动中分子的隐藏行为。他指出，分子在“随机漫步”之后会进入一串以2000兆赫左右的频率抖动的状态。这种提法和马尔可夫的概念一致。爱因斯坦展示了原子的运动，却没有看到或测量到它们。他用现在所谓气体可观测状态的马尔可夫序列，去证明当时对他来说仍然隐晦不明的分子布朗运动。

在俄国革命期间马尔可夫埋头于理论研究，到1922年去世的时候，他已经把前辈们的零散理论变成了一个完整的体系。马尔可夫技术渗透到信息理论科学的方方面面，它是谷歌时代从大数据、云计算到语音识别和机器学习等各种主要进展的坚实支撑。

早期的成功案例包括对普希金的诗歌《叶甫盖尼·奥涅金》的统计。研究表明，在不了解特定语言的情况下，可以通过数学掌握该语言的特性。在关注元音和辅音的模式时，马尔可夫的预测与克劳德·香农的信息度量相似。香农的理论把某个交流渠道中所有的信号传递器都当作马尔可夫过程来处理。[60]

20世纪和21世纪，马尔可夫的发现得到了完善和扩展，受到诸如香农等人的广泛欢迎。安德鲁·维特比最著名的身份是高通公司的联合创始人。但或许他最大的成就是开发了一种递归算法，用于高效地计算复杂链，以便克服随着链的大小呈指数级增长的计算成本。

诺伯特·维纳是《控制论》（1948）一书的作者，也是麻省理工学院的学术明星。他利用马尔可夫数学方法通过观察运动物体的当前位置来预测它们未来的位置。[61]第二次世界大战期间，他的这种方法极大地帮助了对火箭或飞机轨迹的计算。

美国国防分析研究所（IDA）的数学家伦纳德·鲍姆将马尔可夫链引入大数据中，证明了只要潜在的解释最大化，就能够说明一个足够长的观察链是如何迭代的。无论是在语言词汇领域还是在金融价格领域，这些最大化的概率定义了源的原始结构，并保证了后续预测的有效性。为鲍姆的工作提供便利的是著名但鲜为人知的马尔可夫理论奉献者、长期担任IDA负责人的李·纽维尔斯。1980年他在普林斯顿大学召开的一次会议上，建议对连锁预测使用“隐马尔可夫模型”。

综合各个方面可以发现，马尔可夫链当下最广泛、最庞大、最具影响力的实践是谷歌的基础算法——网页排名（PageRank），它涵盖整个万维网上千万亿字节的数据范围。将网络视为马尔可夫链使谷歌的搜索引擎在评估特定网络页面的时候，能够容忍搜索的任何可能性。[62]

为了构建他那不可思议的搜索引擎，拉里·佩奇便是自相矛盾地从马尔可夫式的假设开始，即从“没人真的在搜索什么东西”开始。他的“随机冲浪者”的概念使马尔可夫成为谷歌时代的核心。

网页排名将互联网用户视为在互联网上随意走动的过客。作为用户，我们都知道事实并非如此。由于一个随机冲浪者往往会访问连接最紧密的网站，他的假想行程便定义了网站的重要性和权威性。由于网页排名是一个易于管理的简单模型，并不需要了解冲浪者或网站本身，于是就可以让马尔可夫模型快速、持续地计算出它们在浩如烟海的互联网中的排名情况。

除了网络页面，马尔可夫模型把世界视作单个“状态”的集合，如音素序列、词汇、天气状况、消费者的选择、交易、证券价格、传感器数据、DNA碱基、运动的结果、健康指数、二氧化碳水平、炸弹轨迹、图灵机步骤、象棋、赌博结果、计算机性能、商品市场、交通报告等。一种状态通过“转移概率”与其他状态连接。假设我画了3个国王，那么再画第4个的可能性有多少呢？今天下雪了，那么明天下雨的概率是多少？亚马逊股票在上午9点的开盘价是1421美元，9点过1分的价格会是多少？这一切都可以从过往的数据中计算出概率，并用新的观测结果进行更新。概率权重决定了随机漫游中马尔可夫世界的各种状态。

这种方法免除了分析人员搞不清楚人们的意图或计划，或弄不清楚事件之间逻辑联系的负担。你所需要的只是状态之间概率的记录，所有其他的都可以被认为是随机的存在。在对概率中心极限定理的贡献中，马尔可夫证明了所有随机事件或数据，无论独立与否，最终都符合正态分布。长期相互依存的链是数学世界中可追踪的一部分。这与我们熟知的统计学观点一致：判断集体行为无须考量个人决定或自由意志。

马尔可夫链的一个区别性特质就是它的无记忆性，历史可以用当前的状态来概括，而不能用链条上的任何过去的历史来概括。这个特性大大简化了计算过程。按照马尔可夫模型，浏览器从一个位置到另一个位置进行“随机漫步”，略过“反映状态”（不需要的站点），穿越“过渡状态”（犹他州、内华达州），停留在“吸收状态”（谷歌山景城总部），所有这些都不需要考虑意图或计划在其中扮演的角色。

从神经网络树上的音素到单词、短语、意义和现实模型，层次化的隐马尔可夫模型支持多种层次的抽象。雷蒙德·库兹韦尔是谷歌的副总裁之一，也是一名马尔可夫拥护者。他主张层次化的隐马尔可夫模型可以被视作识别话语或其他模式的指导思想：“虽然我们不能直接进入人的大脑，但从本质上讲，如果计算言说者的大脑皮层……我们可能会很好奇，假如真能观察到言说者的大脑皮层，会不会看到与软件计算的层次化隐马尔可夫模型相对应的连接和权重呢？”他在《人类智能的未来：揭示人类思维的奥秘》（How to Creat a Mind）一书中总结道：“在（大脑的）实际生物学和我们试图模拟的大脑之间，必须有高度精确的数学对等。否则，系统就不会像现在这样运转。”[63]

就像爱因斯坦计算看不见的分子布朗运动一样，库兹韦尔用直觉的隐马尔可夫思维过程，证明在很大程度上也是马尔可夫模式的思维过程。可能雷蒙德·库兹韦尔自己的大脑已经被训练成这样的系统吧。

与现代计算机的许多成就一样，马尔可夫算法的影响取决于其计算速度。通过加速数据处理并扩展数据，在别人做出反应之前，你可以使用马尔可夫模型来预测和利用更大范围的未来事件。数量庞大的塞壬服务器构成的云，极大地增加了可处理数据的量，从而增加了可预测的序列数量。

从亚马逊到脸书，所有的云巨头都在利用马尔可夫模型来判断客户的想法，并预测他们接下来会做什么。但令人印象最深刻的马尔可夫战士和塞壬服务器不在谷歌，也不在亚马逊或脸书。而在一家鲜为人知却取得了惊人成功的公司里，这家公司正在改变金融世界的现状。真正的马尔可夫大师在长岛的塞托克特，是一家名为文艺复兴科技的公司，它是谷歌时代金融和投资领域的巨头。

还记得国防分析研究所的伦纳德·鲍姆吗？该研究所著名的数学家詹姆斯·西蒙斯是文艺复兴科技公司的创始人。这个公司对大数据的挖掘符合鲍姆的马尔可夫观。作为弦理论中的切恩—西蒙斯公式的作者，国防分析研究所脑力激荡成果的执行者，以及最了不起的对冲基金背后的天才，西蒙斯在实践数学、巨量计算能力和企业家精神方面展示出了举世瞩目的成就。

从国防分析研究所中分离出来的文艺复兴科技项目开始于1978年，最初的名字是“金钱计量学（Monemetrics）公司”，主要致力于利用鲍姆在国防分析研究所的信息和马尔可夫模型进行货币交易，并取得了一定的成功。1993年，西蒙斯将国际商用机器公司（IBM）语音识别小组的彼得·布朗和罗伯特·默瑟延揽到自己的麾下，并放手让他们创建了一个庞大的塞壬服务器，旨在运用马尔可夫理论和衍生算法赚钱。

IBM行业领先的研究是整个大数据运动的根源。利用该公司大量的语音示例和世界级的计算机能力，IBM比其他任何公司都能更好地识别人类语言。将马尔可夫工具应用于货币和投资，文艺复兴科技公司的团队发现，如果你能预测一句话中的下一个词，你就能预测股票，预测大宗商品或货币可能出现的下一个价格。有了超级计算机集群，再加上足够快的运算速度，你就可以打败任何能够进入和衡量的短期市场。2009年，西蒙斯退休，并任命默瑟和布朗为公司的联合首席执行官。

默瑟在IBM的老板弗雷德·杰利内克是麻省理工学院信息理论家罗伯特·范诺的门徒，也是克劳德·香农的学生，他认为语音识别是一种信息理论问题——涉及声音信号和噪声信道。杰利内克自豪地宣称：“每次我向语言学家发起攻击，语音识别的性能都会提高。”文艺复兴科技公司的方法同样是只关注基本面，忽视任何直接的流言蜚语，或者对特定公司有特殊了解的人的任何恶意中伤。

仰仗世界领先的数学家和物理学家的奥援，文艺复兴科技公司“避免雇佣任何具有华尔街式善意的人”，《华尔街物理学》杂志的詹姆斯·欧文·威瑟尔评论道。相反，它从分析师的报告、政府报告、报纸报道和新闻中获取了大量信息。此外，只要有可能，它还会想尽办法获取价格和交易信息。所有这些材料，都是人类努力和脑力劳动的结果，使得马尔可夫系统可以忽略人类的意图和目的。

1989年撰写《缩影》（Microcosm）一书时我便对IBM团队的成就赞叹不已。直到2016年，我才设法受邀采访了默瑟本人。[64]此访的目标是弄清楚到底是他发现了弥达斯（Midas）的秘密，还是仅仅吸取了这位不幸的国王的教训。弥达斯希望把他碰过的任何东西都变成金子，但他犯了个错误，给了他心爱的女儿一个拥抱。

开着车沿着长岛行驶，我在港首小镇找到了默瑟的家。沿着25A大道旁的一个岔道，驶入一条长长的土路，路的两边是沙滩，路的一边有一座绿色的凉亭。左曲右拐地穿过一个州立公园，避开徒步旅行者和骑自行车的人，避开阵阵尘土，再开一刻钟，就来到了默瑟家的门口。通过一根柱子上的麦克风我自报家门，被告知“从大门进来”。开着车沿着车道慢慢地朝着房子驶去。

一座3层楼的古典建筑，俯瞰着长岛海湾的石溪港。按照吩咐我把汽车停在这栋房子的旁边。用马尔可夫的话说，这是一种（不再需要转向的）“吸收状态”，意为业已抵达。以我对计算机、信息理论、马尔可夫理论和金钱的认识，我想我已经抵达了硅谷大陆上谷歌知识体系的秘密中心。

有人将我带到一个客厅里。客厅的墙壁上悬挂着默瑟的3个女儿的全身肖像画，她们的名字分别是希瑟·苏、丽贝卡和詹吉。作为数学家和知识分子的领袖，丽贝卡是默瑟在传统基金会和曼哈顿研究所等保守派智库的董事会里的代言人。

我正欣赏着这些肖像画，默瑟走进了房间。他是个俊朗严肃的人，满头的短发已经花白，穿着灰色的西装。他这个人不讲废话。寒暄的话不超过一分钟，我们就进入正题。在探讨了关于文艺复兴科技公司的交易和超级计算机的速度等问题之后，我们还就他的投资策略进行了探讨。

“速度，”默瑟对我说，“不一定是正向的。它可能是由那些明显对经济毫无益处的交易创造出来的。比如说，我可以用1000美元从某人那里买一辆车，然后再同样以1000美元的价格卖给他。对计量经济学家来说，这看起来就像买了两辆车，但实际上什么都没有改变……”

心里想着速度之于弥达斯之谜的贡献，我想到了杰伦·拉尼尔这个邋遢的圣人，这个发明了虚拟现实并命名了塞壬服务器的人。拉尼尔写道：“塞壬服务器体量巨大，往往建造在偏僻的地方。在那里建有自己的发电厂并与自然保持着特殊的联系。比如说一条偏僻的河流，可以冷却大量的废热。”[65]这似乎不适用于文艺复兴科技公司数据中心所处的长岛地区。但我立刻想到了乌尔斯·霍尔泽勒在哥伦比亚河畔的达尔斯建造的谷歌设施。

“这种新型的超流体电脑有很多不同的外衣。”拉尼尔写道，“有些公司从事金融计划，产生高频交易，另一些公司可能经营保险业务。有些负责选举，有些经营大型网上商店。还有一些人经营社交网络或搜索服务，而另一些人则负责国家情报服务。差异只不过是表面的不同而已……”[66]

“每个塞壬服务器都是一个强大的计算资源，它的计算能力超过网络上的所有人，而且似乎在第一时间给了它的拥有者一条保证无限成功的路径。”这便是塞壬服务器女妖般欲罢不能的诱惑。“但这一切收获都只是幻象而已，”拉尼尔警告说，“在不久的将来必然会带来巨大的失败。”[67]

在我看来，谷歌最终会遭遇这样的命运。但很显然默瑟和他所在的文艺复兴科技公司的同事们已经规避了弥达斯的命运。荒原之上，人们守着一堆金子挨饿的情景并没有出现。

据报道，在默瑟和布朗带领的中枢控制论团队的指导下，近20年的时间里，文艺复兴科技公司旗下的大奖章基金（Medallion Fund）每年的平均收益率约为40%。默瑟和他的那些超级巨星学者们，在金融史上一骑绝尘。世人都知道默瑟在政治上支持共和党（西蒙斯和布朗是民主党的拥趸），但他和同事们仍然对这无与伦比的成就讳莫如深——这简直就是一条隐藏的马尔可夫金链。

与西海岸的谷歌不同，文艺复兴科技集团完全摆脱了2008年大萧条的危险，当年经济上的大衰退使众多对冲基金和大银行损失惨重。在这一年的金融危机中，据说该基金在获得了业界最高的收益之后（5%的管理资金和44%的利润），又上涨了80%。而其他对冲基金却平均下跌17%，标准普尔指数下跌40%。

第二年，大奖章基金的利润超过10亿美元，在所有对冲基金中排名第一。默瑟认为我的数据不严谨。对此我无法反驳，权且把它们当作粗略的估算，当作一名财经记者在面对一个极度神秘的行业时捏造出来的数据吧。这只是对一个公司马尔可夫式炫目维度的粗浅了解。

目前，依靠对与超级计算机相连接的文艺复兴科技工作平台的运用，默瑟的团队管理着超过650亿美元的资产，他们分析了大量有序数据的马尔可夫链，以便找到可以交易的“幽灵”。这样的成就建立在从越来越大的数据库中快速处理单纯统计数据的基础之上，这和谷歌的网页排名以及它的深度学习在语言翻译和游戏方面所取得成就如出一辙。与此相似的还有IBM早期在语音识别上的突破，以及IBM“沃森”在Jeopardy智力节目中和国际象棋中的搜索战略。

正如詹姆斯·西蒙斯在1999年的一次演讲中解释的那样：“在没有严重效率低下的情况下，有效市场理论是正确的。但我们研究的异常现象往往转瞬即逝而且极易被忽略……在进进出出的过程中，我们依赖（激烈的）活动来获利。”[68]他们的策略是基于对太字节级别（terabytes）数据的全天候处理，以寻找能够产生利润机会的相关性。“有些耗费了我们15年时间不间断分析的信号，最后证明毫无意义。否则别人肯定已经发现了吧。”默瑟承认，“但从统计学的角度来看，这样做并没有任何问题。”

我经常对这种做法表示不屑，称其为“局外人交易”丑闻，我也这样向默瑟表达了自己的看法。如果投资者不理解他们成功的原因，或者不能提供重要的原创性分析的话，他们就无法为资本主义所有生产性投资提供基础知识。

文艺复兴科技公司的方法似乎违反了图灵—哥德尔原则，即所有的逻辑系统都需要“神谕”、需要自身以外的资源和假设。一个逻辑方案或计算机程序如果仅仅通过大量数据去发现不同的模式的话，那么它最终将被其所在的环境所控制。因为它本身只是数据沧海中的一粟而已。想要预测未来，却可能陷入过往的熵之中——可观测的链及其所隐藏的衍生物，更无法预见推动一切进步的人类创造力。

正如加州理工学院的卡弗·米德所说的那样：“银河系就是整个银河系内唯一合适的模型。”数据库可以快速增长，但它不能代替耐心获取公司内部关于商业计划、发明和技术等特定和单一的信息。

默瑟回应道：“在这个问题上，其实我们就是神谕。‘在当时已知的有关当时已知市场现状的信息面前，过往市场反应的历史告诉了我们什么呢？’我们之所以具备神谕般崇高的地位，是因为我们比其他人投入了更多的脑力和计算能力。”

无论是做多还是做空，基金都是市场中性的。在不了解实际的情况下，无论市场是繁荣还是崩溃，马尔可夫式的工具都能成功。如此便有了这家公司2007年和2008年之间令人惊叹的表现。在不依赖拖垮其他基金的巨大杠杆的情况下，文艺复兴科技公司的基金通过处理更多的数据、建立更大的马尔可夫链、挖掘出更多的相关性和可能性、执行更多的交易而兴旺发达起来。

一旦帕洛阿尔托沙山路上的某位风险投资家对谷歌技术有了深入的了解，就可能会在5—7年的时间里获得上千倍的回报。像文艺复兴科技这样的公司一天可能会进行上千笔交易，完全可以从最微小的异常中收获财富。凭借在全球范围内的适度杠杆和持续24小时的交易，大奖章基金在不了解股票、货币或证券交易背后的技术和商业计划的情况下，可能比风险投资家们赚到更多的钱。谷歌的马尔可夫模型可以让它翻译完全不了解的语言，文艺复兴科技公司是这个模型在金融领域的对应。

就像我不相信资本主义社会的知识和学习需要集约一样，生活和杠杆也一样不需要集中。没有新知识产生，就不会产生真正的财富。正如彼得·德鲁克所说：“做正确的事比正确地做事更重要。”效果比效率更重要。与产出相比，文艺复兴科技公司的市场效率提高幅度很小。其结果是，众多的美国资本正流向塞壬服务器领域，而避免进行“零到一”的创造性投资。“购买市场”的计算机化指数基金在IPO低迷时期蓬勃发展。没有创造出净财富，在零和博弈中，金钱只会被任意抽取并重新分配。

我指出，文艺复兴科技公司的“中立”方法得益于对内部交易规则和公平披露要求适得其反的徒劳，而这将阻碍那些使用人类大脑的竞争对手的发展。默瑟完全同意我的看法。美国证券交易委员会（SEC）继续执迷于费力地调查公司内部人士所获得的通常并无大害的信息，从而将大量交易变成了纯粹的算法。你总不能控告电脑吧。但你也不要指望用它进行创造性的投资。

我宁愿相信非马尔可夫模型会赢。为什么呢？牛顿的洞见认为“有色光是纯净光，白光是一种混合物”的见解在一个世纪以后启发了让—巴蒂斯特·约瑟夫·傅立叶，促使他运用牛顿的无限数学级数来描述棱镜效果。[69]“傅里叶变换”不仅可以用在光线的分析上，还可以用在任何基于时间的信号，如声波上。如果想分解并获取其组成部分，皆可据此而行。傅立叶用一种现在已经普及于无线电话、声学和光学的公式表明，任何复杂的波——从热浪、歌剧独奏、Wi-Fi信号到经济或货币周期——都可以像纯声或纯色一样，表示为一系列重叠的正弦波。

在金融领域，傅立叶模型从交易记录的时域开始，在一个接一个的马尔可夫链中移动到描述交易模式的纯频率成分频域。例如，从所有大奖章基金交易的时域进行转换，就可以发现一组隐含在其中，关于每次投资振幅和功率的纯信息频率集。

由于波动的强度随振幅的平方而增大，因此大规模和长期投资的重要性将以指数形式超过一系列小型交易。小波动比海啸的威力要小得多。默瑟指出：“这就是为什么‘闪电侠（flash boys）’终究赚不了多少钱。”他认为，文艺复兴科技公司的巨大成功远不止快速交易那么简单，其中包括收集和选择数据、发现并提炼算法。

频率数据也是熵的经济表现，我的模型增加了利润——利率之外出乎意料的回报维度，反映了平均和可预测的回报。从克劳德·香农的信息论可以看出，在我的模型中，熵更加惊人。微小和临时的异常既不足为奇，也是低熵的。

我认为需要修正杠杆。仅仅反映借款能力的利润通常不会对学习过程有任何帮助。他们愿意接受可计算的风险，而不是创造性学习的奇点。这样的利润是可以预测的，因此熵更小。

斯坦福大学的诺贝尔物理学家罗伯特·劳克林对泡沫相位变化的科学提出了批评。例如，当水沸腾时，对那混乱不堪的沸腾状态进行解析，这种对“混沌理论”的运用，只有傻瓜才会去做。

文艺复兴科技公司早期（当时被称为金钱计量学公司）就活跃于外汇市场。货币交易是世界市场泡沫的本质，其规模约为全球股市交易量的100倍，是全球GDP的26倍。浩如烟海的货币市场充满了劳克林式的泡沫，计算机可以分析这些泡沫，以发现短期的异常现象。即使在文艺复兴科技公司的适度杠杆水平上（据报道为5:1），这些交易也可能产生巨大的利润。

默瑟援引沃尔特·白芝浩的《伦巴第街》（1873）为此辩护。他列举货币市场和银行在大英帝国崛起过程中为积累可用财富所起到的重要作用。然而，19世纪的伦敦和今天的情景大不相同。

白芝浩所在的英国尚在牛顿的金本位世界体系下运作。如今，各国央行管理的货币在黄金上没有锚定。因此，所有逻辑体系都存在自我参照的循环性，而这些逻辑体系并非与自身之外的现实联系在一起。在美国，无岸可靠的马尔可夫货币可以被美联储随意操纵，以保护其政府赞助人及其所谓私人密友的利益。

拔了锚的金钱改变了资本主义的文化。华尔街银行喜欢波动的货币，而它们的下跌却能受到政府的保护。普通大众和硅谷却钟情于稳定的资金，以便用于长期投资，这也是法治所能保证的收益。世界各国政府，他们的钱无岸可靠，喜欢金融胜过实业，这缩短了经济活动的时间范围。对有些快速交易者而言，交易的节奏只不过是几秒钟而已，这却让经济承受着短期金融的过度吹嘘之苦。

默瑟的职业履历展示了企业创造力和“市场中性”财务策略之间的区别。在金融体系中，市场中性的交易是一种点金术，它主要由零和策略组成，难以谱写人类创造性进步的传奇。虽然它提高了市场的效率和流动性，其代价却是通过塞壬服务器，将不谨慎的人统统吸引到算法金融的贫瘠领域之中。

相比之下，在IBM工作期间，默瑟和他的同事在杰利内克的领导下，在计算机科学、信息理论和语音识别方面取得了令人瞩目的进步。他们的创造是苹果手机上的Siri系统、汽车里的免提通话以及机器翻译越来越成功的背后原因。在新一代互联网发展中，这些创造使语音接口对云计算技术的响应能力不断提高。

在这个过程中，默瑟和他的团队开创了大数据领域的先河，而大数据就是当前计算机范式的主导。与库兹韦尔和其他人工智能系统的先驱们的竞争——从国际象棋到翻译——IBM团队面临着挑战和失败的可能性。因此，他们的进步显示了可证伪知识的波普式力量，这是资本主义制度下所有新财富的源泉。

如今，大数据已经成为谷歌时代的世界体系。但拉尼尔却发出了一个不祥的警告，“卓越的计算能力让你可以为自己选择风险最小的选项，却为其他人留下了风险最大的选项……”[70]他认识到“网络金融一直假装它可以向整个经济释放风险，就像电脑可以用风扇散热一样，但是风险却变得和系统一样大。（2008年和2009年）电脑被热得融化了（此处指当时发生了金融危机）”。[71]

离开港首小镇的时候，我对默瑟愿意挤出时间接受我的采访心存感激，也被他的成就深深打动。他的成就和谷歌的成就一样令人印象深刻。但这也让我认识到，这个世界体系已经过时。它建立在大数据的基础上，而大数据将面临收益递减的局面。它建立在交易频率之上，而这并不符合任何实际的经济活动。它以随机性数学为基础，模糊了价值创造和噪声产生之间的差异。它源于无记忆马尔可夫过程，而这个过程最终将使该模型遭受不可避免的赌徒式毁灭。

爱因斯坦发现的布朗分子大概没有计划也无意规划运动路径，但是言说者和上网冲浪的人却绝不会如此。在超凡的数据统计中，马尔可夫链是一个极好的工具，但它不应该被提升为一个世界体系。

当前世界目睹了谷歌时代系统随机性的泛滥。无论是漫步在华尔街、拉斯维加斯地区或者其他任何地方，到处都弥漫着被马尔可夫链包裹着的、赌徒式的毁灭气息。有的像是地质进化一样久远，有的表现为历史上“不可避免”的发明，还有的表现为万维网上的废物和财富。偶然事件和历史看起来没什么区别，信号在统计上与噪声相似，从白光到白噪声，一切看起来都那么地随机。

世界主流体系的运行假设是看上去随机的东西就是随机的。但香农知道，本质上数据点的创造性模式，反映的是在想象和意志的真实世界里，长期而有目的的准备和发明创造。这与随机模式无法区分。都是高熵，都出乎意料。对瞬相关的随机模式进行解析不能产生新的知识。你不能用一个记录时域波动的示波器去研究市场。你需要一台显微镜，到各个公司的细胞中去探索，才能找到真正反映了技术进步的纯粹色调。

爱因斯坦利用马尔可夫链这个概念来计算分子自发的千兆赫兹振动。而加速到千兆赫频率的马尔可夫链，使科学家们能够主宰由中央银行混乱的货币政策所控制的世界经济。现在，在世界的谷歌系统中，技术人员有了这样的设想：认为计算机的速度传递了计算机的智能，如果能足够快地移动电子，就能赋予口不能言的机器以意识和创造力。

他们认为，代表这个世界上最紧凑、最有效的思维系统的人脑，实际上是随机的机器。这种观点真是愚不可及。马尔可夫模型通过消除人类的智力和知识来发挥作用。分析话语却不用懂得这门语言（香农和鲍姆），评估网页的重要性却不需要了解页面本身的内容或者使用者的观点（佩奇和布林），测量计算机的性能却忽视99%的系统细节（艾伦·谢尔），投资于股票和债券却对发行股票和债券的公司毫无兴趣（文艺复兴科技公司），或者只知道作者却根本不知道作者写了什么内容，甚至连作者使用的语言都一窍不通（马尔可夫本人）。这些程序的特点就是彻头彻尾地缺乏智慧。当你不知道实际发生的情况时，你会使用大数据统计和马尔可夫概率模型。使用马尔可夫模型的这些人预测任意模式或计划过程竟然不需要对其中任何内容有丝毫的了解。为了他们的未来，这个行业必须超越当下的这种状态。

在接受我的采访时，默瑟对现行的部分准备金制度提出了不同的见解。他援引自由意志主义经济学家穆瑞·罗斯巴德的话，认为在一个理想的体系中，资产和负债的期限会自动匹配。

这是当前马尔可夫链统治下，场外交易者的观点。由于储蓄者的动机与储蓄价值来源存在差异，几乎在任何银行体系中，期限都无法匹配。储蓄者试图保存财富，同时也需要自己的财富以流动的形式存在，以便可以随时取回。但是就其永续和扩张而言，这些储蓄的财富依赖于在危险的学习过程中进行长期投资——对公司和项目的真正投资。而这样的投资在任何时候都可能带来失败和破产。

金融的作用是将储户对证券和流动性的追求，转变为企业家必然存在的长期流动性不足和对风险的接受。如果银行和其他机构不扮演这种角色，经济增长就会停滞不前。

所有的财富最终都是基于知识和发现的长期性投资的产物。在想要保证流动性的储户和不断用持久投资摧毁流动性的投资者之间，存在着不可避免的冲突。

当货币对政府来说是一根标尺而不是一根魔法棒的时候，便触及了资本主义储蓄和投资的核心系统。由于受到政府对其交易模式进行计算机调查的威胁，新成立的对冲基金行业正在颠覆这种关系。它现在遵循的规则是“任何你了解的东西都不要投资”。由于禁止学习，目前的算法几乎不进行任何投资，也就不会产生持久的财富。相反，通过加速外汇和短期证券的交易——280万亿美元的全球债务为对冲基金提供了流动性，并助长了市场的动荡。

一旦推到速度的极限，马尔可夫只会导致用“黄金”作为财富，而不是把真正的黄金作为财富的衡量标准。黄金在资本主义崛起期间充当了外部价值的神谕，但它只是衡量财富的标尺，而不是点石成金的财富本身。

文艺复兴科技公司没有毫厘的黄金，却能在混乱的全球市场中叱咤风云，它为自己没有得到政府的补贴或特别支持而沾沾自喜。通过比竞争对手更快、更大范围的计算，文艺复兴科技公司是反复无常的政府造成的持续市场扭曲的终极仲裁人。

另外，谷歌通过免费赠送大部分商品的策略，避免了市场的非理性和价格发现。谷歌和文艺复兴科技公司都找到了逃避无情的真相，逃避知识扩张的真实市场和长期投资的方法。然而，这两种策略最终都将失败，因为这样的公司极易重复弥达斯式的错误。

弥达斯的错误在于将财富的货币计量单位黄金误认为是财富本身。财富不是一件东西，也不是一个随机的序列，它不可避免地根植于在长期的努力中获得的知识之上。

本周热推：

链接：商业、科学与生活的新思维（10周年纪念版）逃不开的经济周期2 重读哈耶克被追赶的经济体国富论（全译本）

第9章 马尔可夫和弥达斯

第9章马尔可夫和弥达斯