1.4 统计数据的收集
在购买家庭住宅时主要考虑交通区位还是功能配套?大学生在购买手机时是考虑价格还是性能?外商直接投资时主要考虑目的地的经济发展水平还是交通区位?在日常的经济和社会工作中,我们经常会遇到大量的这种问题,为了回答这些问题,需要搜集相关的数据进行分析。在确定了研究目标以后,我们就要考虑进行研究所需数据的问题,其包括:我们从哪里获得数据?哪里有我们所需要的数据?如果需要调查,有那么多潜在被调查者,我们应当向谁进行调查?选中被调查者以后,我们应该怎么实施调查?有些研究问题可能需要通过实验的方法获得数据,那么具体怎样进行呢?我们所得到的这些数据都准确吗?如果不准确,误差是怎么产生的?应当怎样控制误差以便获得较高质量的数据?这些工作都是一项统计研究活动所不可缺少的环节。
统计数据的来源主要有两个方面:一是数据的间接来源,即数据是由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以使用,此类数据称之为数据的间接来源。二是通过自己的调查或试验活动,直接获得第一手数据,即数据的直接来源。
1. 统计数据的间接来源
如果与研究内容有关的原信息已经存在,只是对这些信息重新加工、整理使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据。从手机的范围看,这些数据既可以取自系统的内部,也可以来自系统的外部。来自系统外部的数据主要有:统计部门和政府部门公布的有关资料,如各类统计年鉴、统计公报等;各类经济信息中心、信息咨询机构、专业调查机构等提供的数据;各行业协会和联合会提供的市场信息和行业发展的数据情报;各类专业期刊、报纸、书籍所提供的资料;各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料;从互联网或图书馆查阅到的相关资料等。取自系统内部的数据,如果就经济活动而言,则主要包括业务资料,如与业务经营活动有关的各种单据、记录;经营活动过程中的各种统计报表;各种财务、会计核算和分析资料等。
这类数据的搜集相对比较容易,采集数据的成本较低。这些间接的数据资料能够帮助研究者了解所研究问题的背景,帮助研究者更好地定义问题,检验和回答某些疑问和假设,寻找研究问题的思路和途径。所以,研究者应该首先考虑这种较容易获得的二手资料。
但是,二手数据资料也有其局限性。因为二手资料不是针对研究者所研究的问题而产生的数据,所以可能对我们所研究的问题的有些方面来说是有缺陷的,如数据不够准确、时效性不强、相关性不高、统计口径不一致等。因此,在使用二手资料之前需要对其进行评估。具体考虑的内容如下。
数据是谁搜集的?主要考虑数据搜集者的实力和社会信誉度。为什么而搜集的?是为了某个利益集体搜集的数据应该慎重采用。数据是怎样搜集的?数据的质量来源于数据的产生过程,采用不同的搜集方法搜集的数据是针对不同问题的,不了解其搜集方法,很难对数据资料的质量做出客观的评价。什么时候搜集的?过时数据的采用应该受到质疑。
在使用二手数据时,应注意数据的定义、含义、计算口径和计算方法、时效性等问题,避免滥用、错用、误用。在引用二手数据时,应该注明数据来源。
2. 统计数据的直接来源
为了克服二手数据相关性弱的缺点,我们可以通过调查的方法和实验的方法获得一手数据资料。这就是统计数据的直接来源。通过调查的方法获得的数据称为调查数据,通过实验的方法得到的数据称为实验数据。
调查是针对社会现象。调查数据通常取自有限总体。如果调查针对数据总体中的所有个体单位,这种调查称为普查。普查所获得的数据,信息全面、完整,对普查数据的全面分析是统计分析的重要内容。但是,当总体较大时,普查是一项大工程,调查的过程耗时、费力、成本高、涉及范围广、受调查的个体多,因此普查不可能经常进行。一般情况下,研究者所面临的是样本数据。因此如何抽取一个有效的样本,是我们要解决的一个重要问题。
实验是针对自然现象。例如,验证新药的疗效、一种新的技术方法的采用等,都需要通过实验的方法获得数据。