1.2.4 大数据驱动的智能制造科学范式
在“大数据”概念出现之前,制造系统的运行分析与决策非常依赖模型和算法。以生产调度决策过程为例,要得到良好的调度方案,首先需要分析调度参数与调度目标之间的因果关系,建立合适的数学模型来描述调度问题,包括约束、目标等。然后针对该模型设计相应的算法求解。当问题规模较小时,通常可以用数学方法求得精确解;但当问题规模较大时,往往需要针对问题特性,设计精妙的算法来得到近似优化解(如各种智能算法在车间生产调度中的广泛应用)。因此,复杂、系统的调度问题能否得到更好的解决,很大程度上取决于建模是否更加精确和算法是否更加高效。随着产品需求和工艺越来越多样,制造系统变得越来越复杂,传统的“因果+建模+算法”模式已经举步维艰。
事实上,因果关系只是事物联系的一种形态,在大数据背景下,运用关联性可以比以前更容易、快捷、清楚地分析事物之间的内在联系。关联关系的核心是量化数据值之间的数理关系,通过大数据挖掘发现不同数据之间的关联关系,成为人们观察并分析事物的最新视角。同时,大数据时代的到来也彻底改变了人们对建模和算法的依赖,当数据越来越大时,数据本身(而不是研究数据所使用的算法和模型)保证了数据分析结果的有效性。即便缺乏精准的模型和精妙的算法,只要拥有足够多的数据,也能得到接近事实的结论,数据因此被誉为“新的生产力”。当数据足够多时,不需要了解具体的因果关系也能够得出问题的结论[5]。
2009年,微软从科学研究范式的角度指出数据密集型科学将成为继实验科学、理论推导、模拟仿真之后的第四范式[6]。传统的科研范式通过实验科学、理论推导与模拟仿真来拟合系统运行的因果机理,并对系统进行分析与优化,大数据则是通过数据之间的关联关系来刻画系统运行的机理。第四范式认为,大数据处理和分析技术不是对数据的简单统计和分析,而是在系统规模越来越大、结构更加复杂的情况下,通过海量数据之间的关联分析,具备更强的洞察能力、分析与决策能力。这种基于大数据的处理和分析的预测和控制模式,在公共卫生、金融、医疗等社会领域已有不少先驱应用。
在数据科学范式下,制造系统的运行分析与决策方法也将发生变革。围绕制造系统的效率、质量与稳定性等性能指标,“关联+预测+调控”的决策新模式正在形成[7]。其中,关联是指通过数据的关联分析,量化数据之间的影响机理,从数据的角度探索制造系统运行中的关系;预测是指在关联分析的基础上,进一步描述数据与系统性能指标之间的内在关系,揭示系统性能指标的演化机理;调控是指在预测的基础上,针对具体的业务进行优化调控,从而使系统性能满足要求。
大数据驱动的智能制造方法与使能技术如图1-1所示。
图1-1 大数据驱动的智能制造方法与使能技术