1.2 统计的应用
1.2.1 统计的产生与发展
统计学的英文Statistics最早是源于现代拉丁文Statisticum Collegium(国会)以及意大利文statista(国民或政治家)。德文Statistik最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。19世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。
统计学的发展可划分为以下3个阶段。
(1)“城邦政情”阶段。“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。“城邦政情”式的统计研究延续了一两千年,直至17世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。
(2)“政治算数”阶段。与“城邦政情”阶段没有很明显的分界点,本质的差别很小。“政治算数”的特点是统计方法与数学计算和推理方法开始结合;分析社会经济问题更加注重运用定量分析方法。1690年,英国威廉·配弟出版《政治算数》一书作为这个阶段的起始标志。威廉·配弟用数字、重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉·配弟的《政治算数》被后来的学者评价为近代统计学的来源,他本人也被评价为近代统计学之父。配弟在书中使用的数字有三类:第一类是对社会经济现象进行统计调查和经验观察得到的数字。第二类是运用某种数学方法推算出来的数字。第三类是为了进行理论性推理而采用的例示性的数字。
(3)“统计分析科学”阶段。在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。19世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程,当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。“统计分析科学”课程的出现是现代统计发展阶段的开端。1908年,“学生”氏(William Sleey Gosset的笔名)发表了关于t分布的论文,创立了小样本代替大样本的方法,开创了统计学的新纪元。现代统计学的代表人物首推比利时统计学家奎特莱,他将统计分析科学广泛应用于社会科学、自然科学和工程技术科学领域。现代统计学的理论基础概率论始于研究赌博的机遇问题,大约为1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到19世纪初,数学家们逐渐建立了观察误差理论、正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。
20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来,有以下几个方面。
(1)由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的、以概率形式表述的推断。西方国家所指的科学统计方法,主要就是推断统计。
(2)由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,统计的范畴已覆盖了社会生活的领域,成为通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。
(3)统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了进一步发展。
(4)信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共同之处,分别从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作出现了新的发展趋势。
(5)计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。伴随着计算机技术的不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。而今,计算机科学已经成为统计科学不可分割的组成部分。随着科学技术的发展,统计理论和实践深度与广度方面也在不断发展。
(6)统计在现代化管理和社会生活中的地位日益重要。英国统计学家哈斯利特说:“统计方法在生活和习惯中的应用是这样普遍,应当重视统计的作用。”后来,甚至有的科学还称之为“统计时代”。
统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展。
1.2.2 统计的应用领域
随着社会和科学技术的蓬勃发展,统计学与其他学科的相互渗透与影响更加广泛深入,应用于各个领域。在商业以及工业中,统计被用来了解与测量系统变异性、程序控制、对决策提供数据支持。在第一产业方面,可运用统计计算出各种农产品的需求情况及价格分布,从而指导生产;在生产行业中,统计学可以运用在产品开发、营销、财务管理等方面,从而提高企业的营运能力;在服务行业中,例如在金融行业中,运用统计技术对各种交易资料加以分类、整理,从而得到如客户贡献度、客户偏好、存款变动趋势、产品分析、行业发展等数据,进而为管理层提供决策依据等。
(1)企业发展战略。发展战略是一个企业长远的发展方向。控制发展战略一方面需要及时了解和把握整个宏观经济的状况及发展变化趋势,另一方面还要对企业进行合理的市场定位,把握企业自身的优势和劣势。所有这些都需要统计提供可靠的数据,利用统计方法进行科学的数据分析和预测。
(2)产品质量管理。质量是企业的生命,是企业持续发展的基础。质量管理中离不开统计的应用。在一些知名的跨国公司,6σ准则已经成为一种重要的管理理念。质量控制已经成为统计学在生产领域的一项重要应用,各种统计质量控制图被广泛应用于监测生产过程。
(3)市场研究。企业要在激烈的市场竞争中取得优势,首先必须了解市场。要了解市场就需要进行广泛的市场统计调查,取得所需信息,并对这些信息进行统计分析,以便作为生产和营销的依据。
(4)财务分析。上市公司的财务数据是股民投资的重要参考依据。一些投资咨询公司主要是根据上市公司提供的财务和统计数据进行分析,为股民提供参考。企业自身的投资也离不开对财务数据的分析,其中要用到大量的统计方法。
(5)经济预测。企业要对未来市场状况进行预测。例如,对产品的市场潜力进行预测,及时调整生产计划。这就需要利用统计方法进行收集、整理和分析数据。
(6)人力资源管理。利用统计方法对企业员工的年龄、性别、受教育程度、工资等进行分析,并作为企业制度工资计划、奖惩程度的依据。
统计学的应用非常广泛,除了管理科学之外,自然科学和社会科学等领域也需要统计学为其处理大量的数据问题。从某种意义上说,统计学是与数学一样的一种数据分析工具。表1.1.1列举了一些统计学的应用领域,由此可见统计学的应用之广泛。
表1.1.1 统计学的应用领域
1.2.3 统计的分科
任何一门科学,随着人们对它的研究逐步深入,总是在不断地发展与进步。由于研究人员观察的角度不同,研究的重点不同,必然会出现各个相互联系而又有所区别的分支。统计学也不例外,大致有以下两种分类。
1. 描述统计学和推论统计学
统计学分为描述统计学和推论统计学,一方面是反映统计发展的两个阶段,另一方面各有不同的侧重。描述统计学是研究如何对客观现象进行数学的计量、概括和表示的方法。有些客观现象的数字计量是比较简单的,如人的身高、体重等;而在某些领域如社会经济方面就比较复杂,例如要计量居民生活费的变动或不同国家人民生活水平的比较,就要涉及很多方面。因此需要确定一些反映现象数量特征的范畴,即统计指标。研究某一个问题,要选择恰当的统计指标。然而一个指标往往只能说明某一方面的问题,要想用来全面评价社会经济现象的发展状况常常是困难的。为了比较全面系统地认识社会经济现象,就需要用若干个相互联系的指标来反映所研究问题的各个侧面,这些相互联系的统计指标就构成了统计指标体系。有了统计指标体系后就必须搜集数据,搜集数据的方法也要根据不同的研究对象和研究目的来确定。在一些自然科学中通常是根据实验观察来获得数据,而在社会科学中往往通过调查和访问来取得。搜集来的数据开始总是许许多多杂乱无章的原始资料,难以直接看出什么问题,于是需要对数据进行简缩、加工,按各种项目分门别类加以整理,综合成一些图、表醒目地表达出来。这一系列的内容都是描述统计所要研究的。
推论统计学也称归纳统计学。在20世纪之前,统计学基本上处于描述阶段,戈赛特、费希尔、奈曼等人对统计学的发展,使推论统计学的理论不断丰富并成为统计学研究的主流。它是研究如何根据部分数据去推论总体的情况,因为对客观现象搜集数据有时不可能对全部单位去作调查,即使有时可以调查工作量也太大。例如要研究我国人口的年龄结构、婚姻状况、文化水平以及死亡率等情况,用普查的方法工作量极大,如果没有足够数量且训练有素的工作人员,难免会出现误差,其结果也就不理想。故通常抽取部分样本进行研究,从而对总体作出推断。当然,样本只是总体的一部分,包含的信息不完备,而且抽样是随机进行的,必然会出现误差,对于推断的结论是否可靠要冒一定风险。但是推论统计根据概率论的原理可以使归纳推断所产生的不确定性得到度量。为了使样本对总体作出更可靠的推断,推论统计也要研究如何对抽样进行设计等内容。
2. 理论统计学和应用统计学
理论统计学是指统计学的数学原理,扎根于纯数学的一个领域——概率论。从广义来说,统计理论可以认为是包括概率论的,此外还包括一些并不属于传统概率论的内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理,可以看成是概率论公理的扩增。在统计实践中常常会遇到一些新问题,使原有的统计方法不适应,需要统计学家针对新问题去建立一个与实际情况相符合的统计模型,创造新的统计方法去分析。前面已经提到统计学是应用性很强的一门学科,因此将统计学的基本原理应用于各个领域就形成了各种各样的应用统计学。它包括一整套统计分析方法,有的是一般性的统计方法,适用于各个领域,如参数估计、假设检验、方差分析、相关与回归等。有的则是某一专业领域中特有的分析方法,例如经济统计学中的指数分析法等。近几十年来,由于统计研究的范围越来越广,一些科学实验也日趋复杂,统计方法也相应地复杂化和专门化,在应用统计方法中必须对因模型和实际情况不一致而引起的各种误差的性质和大小做出判断,或提出改进的措施。由于统计的工具更加专门化了,也就缺少通用性,一个统计学家要熟悉所有的专门工具已不可能。为适应这种发展的需要,要求既熟悉统计知识又熟悉某一领域业务的应用统计学家就应运而生,同时也产生了相应的应用统计学。这类统计学的特点不着重于统计数学原理的推导,而是侧重于阐明统计的思想,并将理论统计学的结论作为工具应用于各个具体领域。