大数据时代,由于缺乏获取全体样本的条件与手段,往往通过随机采样的方法获取分析所需的数据。所得的样本数据往往经过精心采集,具备完整性与代表性,且可直接用于数据分析。大数据时代,泛在传感器强大的数据采集能力使获取足够大的样本数据乃至全体数据成为可能。海量的数据具备缺失值、异常值、非正态等特点,直接运用人工智能算法进行数据分析容易出现精度下降、预测不准等问题。在这种背景下,对实际采集的全局大数据进行预处理,得到可靠、可复用、易分析的数据,是工业大数据分析的前提保障。