工业大数据分析
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.3 工业大数据的特性

随着制造业信息化和自动化技术的飞速发展,特别是数控机床、传感器、数据采集装置和其他具备感知能力的智能设备在离散车间底层的大量使用,车间数字化和智能化程度越来越高,制造数据的规模和种类也日益扩大,车间运行过程中产生的制造数据呈现出以下几个特性。

1.规模性

以半导体制造为例,单片晶圆质量检测时每个站点都能生成几MB的数据,一台快速自动检测设备每年就可以收集将近2TB的数据,上海某晶圆企业S1厂Centura区域2014年4~9月的机台运行数据中,各类参数的监测值达到21.7亿条,涉及参数5 218个,总数据量1.12 TB。据麦肯锡咨询公司统计[3],2009年,美国员工数量超过1 000人的制造企业平均产生了至少200 TB的数据,而这个数量每隔1.2年就递增一倍。通用电气公司的报告[4]显示,未来10年工业数据增速将是其他大数据领域的两倍。由于晶圆制造车间在制品多、工艺多、产品多、设备数量大、参数多、数据采集频繁,使得记录的数据量巨大。

2.多样性

多样性主要体现为类型多样、量纲多样、尺度多样。类型上,车间生产涉及的产品物料清单、工艺文档、数控程序、三维模型、设备运行参数等制造数据往往来自不同的系统,具有完全不同的数据结构,可以表现为数值、时间、图像。仅数值类型的数据,就可分为整数类型、浮点数类型、布尔值类型等。量纲上,如参数中的温度、压力、流量,其度量单位各不相同。尺度上,如刻蚀的宽度为纳米(10-9)级别,而晶圆搬运距离为千米(103)级别,尺度跨度达1012。此外,运行数据的采集频率也不尽相同,从3~5分钟一次到每秒数十次。例如,晶圆刻蚀过程中反应腔温度采集频率为每秒1~10次,而刻蚀深度则只有在一批晶圆加工完成后才检测,时间尺度为小时级别。

3.高速性

机台加工、测量与缺陷数据随制造过程的推进而不断产生,并由相应的传感器实时采集。设备数据波动、制程工艺变化、随机性缺陷等随晶圆加工批次不断变化。采集的数据,尤其是机台数据,主要为机台运行控制提供支持,要求具有时间敏感性。因此,要求数据的采集间隔周期小,处理速度快,响应时间短。

对制造车间数据做进一步分析,发现其在上述3个特性的基础上,还兼具多来源、多维度、多噪声特性。

4.多来源

制造车间的产品订单信息、产品工艺信息、制造过程信息、制造设备信息分别来源于排产与派工(Product Planning&Scheduling,PPS)系统、产品数据管理(Product Data Management,PDM)系统、制造执行系统(Manufacturing Execution System,MES)和制造数据采集(Manufacturing Data Collection,MDC)系统、数据采集与监控(Supervisory Control and Data Acquisition,SCADA)系统等。近年来,随着工业大数据技术的发展,制造车间逐渐普及了主数据系统(Master Data System,MDS)、商务智能系统(Business Intelligence System)等。这些系统基于原始生产过程数据,经过处理后,产生了新的数据和信息。因此,制造车间中原始数据和中间数据并存,不同的信息来源决定了不同的数据结构和存储方式。

5.多维度

晶圆制造的多维度特性体现在产品、系统和设备3个方面。产品维度的性能参数有晶圆良率、测试寿命、电子性能与成品良率等;系统维度的性能参数有晶圆工期、库存水平、设备空载率、等待队列长度等;设备维度的性能参数有设备利用率、工序良率、设备平均失效前时间和平均故障间隔时间等。

6.多噪声

车间生产运行中产生的大量数据来自PLC控制器、传感器和其他智能感知设备对制造过程的不断采样,生产中的电磁干扰和恶劣环境使感知数据带有多噪声的特性。以晶圆卡的搬运过程为例,RFID阅读器在读取附于高速移动的搬运小车上的芯片时,容易出现漏读和误读现象;等离子刻蚀腔中充斥着高温高压等离子体,导致腔内传感器老化快,原点漂移严重。

以国内某半导体制造企业的某一量产晶圆类型为例,在晶圆制造过程中采集的质量相关数据及其特性如表1-1所示。

表1-1 晶圆制造过程中采集的质量数据及其特性

智能车间大数据与其他行业大数据的对比如表1-2所示。

表1-2 智能车间大数据与其他行业大数据的对比

续表