统计学图鉴
上QQ阅读APP看书,第一时间看更新

序章 统计学概述

0.1 何谓统计学 

除了自然科学领域,统计学在心理学等社会科学领域中也是一门必不可少的学问。

统计学

统计学是一门将数据汇总为统计量(平均数等)或图表,以获取其特征的学问。

统计学的分类

统计学分为用于获取手头数据特征的描述统计学,通过样本获取总体特征的推断统计学,以及在市场营销中备受关注的贝叶斯统计学等。

统计(statistics)…用于掌握分析对象总体特征的数据集合,也指统计学。

统计学(statistics)…是将用于掌握对象总体特征的方法系统化的一门综合性科学,分为描述统计学和推断统计学。

专栏 统计学的历史

统计学这门学问并不是某天由某个人突然提出来的。后面的专栏中会介绍一些为奠定现代统计学基础做出重大贡献的统计学家。在此之前,笔者先来简单介绍一下统计学的发展历史。

① 统计的起源:国情调查

“统计学”是一门学问,“统计”一词强调的则是收集数据。统计(学)起源于国家在征税时进行的国情(人口)调查。古埃及就有为建造金字塔而实施种种调查的记录,日本在飞鸟时代(592 年 ~ 710 年)也就田地面积进行过调查。

② 早期的统计分析:源于流行病学的描述统计学

17 世纪中叶,伦敦鼠疫肆虐。约翰·格朗特(John Graunt)着手调查鼠疫时期的人口情况,并在历史上首次开展了统计分析。格朗特通过教堂保存的统计资料(死亡记录)发现了婴幼儿的死亡率较高、城市人口死亡率高于农村等现象。这表明只要进行充分的观察,我们也能从偶然发生的社会现象中发现一定的规律。这种描述统计学后来被卡尔·皮尔逊(Karl Pearson)发扬光大。

③ 采用概率论来推断整体:推断统计学

进入 20 世纪,罗纳德·A. 费歇尔(Ronald Aylmer Fisher)和威廉·S. 戈塞(William Sealy Gosset)开始通过小样本(较少的数据)来推断总体特征(总体参数)。近年来,主张参数本身服从某一概率分布的贝叶斯统计学也受到关注。与现代生活和研究息息相关的推断统计学从诞生到现在还不到 100 年,真是令人惊叹。

0.2 统计学可以做什么

统计学在我们的生活中扮演着非常重要的角色。下面,我们通过一些具体示例来看看它到底能做些什么。

描述统计学

● 帮助我们掌握手头数据的特征(平均数、离散程度)或趋势。

是以大量(样本容量很大的)数据为对象的统计学。

推断统计学

● 根据样本信息来推断总体的特征。

主要内容有无偏估计、置信区间估计和假设检验等。

描述统计学(descriptive statistics)…通过平均数、方差等统计量或者图表来获取数据特征的学问。

推断统计学(inferential statistics)…根据数据来推断或检验其背后总体特征的学问。

实验设计法

● 让实验成功的方法集。

包含节省时间和空间的方法。

多元回归分析、多变量分析

● 一次性处理大量变量的方法的总称。

使用简单的模型对复杂的问题进行预测和评估。

贝叶斯统计学

● 贝叶斯统计学是一种可以灵活吸收知识、经验和新数据的统计学。

可通过慢慢学习提高精确度。

实验设计法(experimental design)…确定空间和时间的配置方法和样本容量,提高实验效率的方法论。

贝叶斯统计学(Bayesian statistics)…可以灵活吸收知识、经验和新数据的统计学,其核心是贝叶斯推断。