2.2 课后习题详解
1为什么要进行抽样?
答:抽样是指根据某种既定规则从一个总体中选取一组元素的过程,由此产生的元素集合称为样本。即在抽样的专业化表述中,每一个具体的研究对象被称为元素,全体研究对象被称为总体,样本则代表一部分研究对象,它可以是个人、家庭、学校、医院、地块、交易事件,也可以是文章、杂志,甚至是歌曲。之所以要抽样,主要是考虑调查项目的可行性。
(1)在社会调查中,经费是一项硬约束,多增加一个调查对象,就意味着多花一份钱。因此,如果总体太大,限于资源,无法逐一对每个总体元素进行调查。而借助抽样就能克服这个困难,因为,根据抽样理论,无论社会调查涉及的总体有多大规模,只要抽样是按随机原则实施的,则被抽出的少数元素的情况,就能够比较准确地代表总体的情况。
(2)即使有充足的调查经费,当总体太大时,也很难找到足够多训练有素的研究人员完成调查。这时如果聘用训练不足的工作人员,或对调查主题进行过于简单的调查,势必会降低调查质量。而抽样由于只涉及较少的元素,因此可以集中使用资源,从而增加每一个研究人员调查的元素数量,进而提高调查的质量。
2为什么说“街头拦人”不是随机抽样?
答:“街头拦人”这种碰到谁就选谁的抽样方法并不是随机抽样,原因如下:
(1)电视台、电台和报纸记者的“街头拦人”调查,采用的就是方便抽样。方便抽样即偶遇抽样,是指研究者使用对自己最为便利的方法来选取样本。这种方法很容易产生系统误差,样本代表性很差,因此,在使用时要特别小心,总体的情况越复杂,方便抽样的效果就越差。
(2)虽然方便抽样旨在排除主观因素的影响,纯粹依靠客观机遇来抽取对象,但它并没有通过随机过程,使总体中的每一个元素有相等的被抽中概率。那些最先被碰到的、最容易见到的、最方便找到的对象,具有比其他对象大得多的机会被抽中。与“正常”的研究对象相比,那些衣着破烂、年纪太大、不擅辞令的研究对象,很少有机会进入电视镜头。
3判断抽样比较适合用于哪些场合?
答:判断抽样经常被用于以下三种研究场景:
(1)研究者用判断抽样来选择特别能提供信息的独特个案。
例如,在问卷设计阶段,为检验问题设计是否得当,常有意地选择一些观点差异悬殊的人作为研究对象。
(2)研究者用判断抽样来选取难以接近的特殊人群。
例如,在娼妓研究中,研究者可以通过搜寻一些主观信息,如娼妓聚集的地区,与娼妓相关的社会团体,也可以访问“专家”,如“红灯区”执勤的警察、老鸨和皮条客等,来界定研究计划所包含的娼妓样本。
(3)研究者用判断抽样来选取某种特殊个案类型,以便进行深入探究。
例如,选择一些收入远高于农民人均收入水平的农民作为研究对象,深入分析他们的致富途径。这种研究是希望获得对这种类型的深入了解,它的作用在于发现问题,提出假设,而不在于对总体做出概括,因此,无需根据样本对总体进行推论。
4目标总体与抽样总体之间有哪些差异?
答:总体可以进一步划分为目标总体和抽样总体,具体阐述如下:
(1)目标总体是理论上具有研究者所考察特征的全体总体元素的集合体。
(2)在实际抽样中,有些总体元素并不一定都能有机会被抽取到。由那些有机会被抽取到的总体元素构成的集合体,就是抽样总体或调查总体,它是排除了研究总体中的一些特例后的总体。
5简单随机抽样中,有哪几种方法可以产生随机数?彼此之间有何差异?
答:(1)当总体单位很多时,通常采用随机数法。
(2)具体操作可以利用随机数表、随机数骰子、计算机产生的伪随机数等进行抽样。在几种操作方式中,最经常用到的是随机数表。由统计软件产生的随机数是伪随机数,在通常情况下有循环周期,故一般无法保证其随机性。
(3)尽管有些统计软件产生的伪随机数有较长的循环周期,但为了保证抽样的随机性,在有条件的情况下,最好还是使用随机数表或随机数骰子来产生随机数。
6为什么说等距抽样是一种准随机抽样方法?
答:在系统抽样中,等间距抽取是最常用的规则,故系统抽样经常被称为等距抽样。由于抽样使用的是抽样间距,而不是随机数,故等距抽样是一种准随机抽样方法。
7为什么系统抽样的代表性与总体单位的排列顺序有关?
答:系统抽样需要将总体单位按顺序排列。并非所有排列顺序都能满足系统抽样的要求,例如,当单位的排列存在周期性的变化,样本的代表性就可能很差。与系统抽样有关的单位排列大致有以下几种情况:
(1)总体单位随机排列
总体单位按随机顺序排列的系统抽样称为无序系统抽样,其效果等价于简单随机抽样。
(2)总体单位线性趋势排列
即总体单位按某个辅助变量的大小顺序排列,而这个辅助变量与所研究的指标值线性相关。对线性趋势总体进行系统抽样称为有序系统抽样,其效果优于简单随机抽样。
(3)总体单位周期排列,即总体单位指标值按其顺序呈周期性变化
对于周期排列的总体,系统抽样的估计效果与抽样间距以及单位指标值的变化周期有关。
8为什么分层抽样中,各层的样本规模要进行非比例分配?
答:非比例分配设计最常见的目的如下:
(1)对总体中规模太小的层进行比较研究
当某些层的单位在总体中的比例太小,如果按比例分配样本,则这些层的样本规模会很少,无法进行统计分析,这时可以加大该层的样本规模,即使用较大的抽样比,以便对这些层的子总体进行研究和比较。
(2)在费用一定的情况下,获得尽可能高的抽样精度,又称为最优分配
①当各层的单位调查费用相等时,最优分配的原则是:层内单位标准差越大的层,抽样比越高。这时抽样比与层内单位标准差成正比。
②当各层的单位调查费用差异较大时,最优分配的原则是:单位调查费用越低的层,抽样比越高。这时抽样比与层内单位平均调查费用的平方根成反比。
9分层抽样中,层的数目要受到哪些因素的限制?
答:在实际抽样中,层的数量受到以下限制:
(1)样本规模的限制
因为要考虑估计量方差的无偏估计,故每层至少要有两个样本单位,这样层数就不能超过n/2。
(2)调查经费的限制
①增加层数势必会增加调查的管理费用,而当层数增加到一定的时候,在精度上的收益将非常小,这就是收益递减现象;
②在调查费用一定的情况下,增加层数必然导致降低样本规模,而每层的样本规模越小,对总体方差的估计值也就越不精确,这时就要考虑增加层数而降低样本规模在精度上是否合算。
10群的划分原则与分层原则有什么不同之处?
答:(1)群的划分遵循以下原则:群内方差尽可能大,群间方差尽可能小。
(2)分层抽样遵循的原则是:如果单位之间差异很大,那就对它们进行分组,使得各组内的差异变小,这样在各组内进行抽样就会提高精度,增加样本的代表性。
11PPS抽样是如何保证大小不等的群中的元素以相等概率入样的?
答:多阶段PPS抽样关键是在第一阶段抽取PSU时,要先放弃等概率抽样条件,采用PPS抽样方法,即赋予规模不等的群与其规模(或辅助变量)成比例的入样概率。由于抽取PSU的过程是不等概率抽样,因此如果这样大概率抽取群,小概率抽取样本单位,一大一小相互抵消,就保证了总体单位抽取的等概率性。要保证总抽样比不变,就需要以一个固定的样本规模从抽中的PSU内抽取样本单位。因为如果抽取的单位规模对每个PSU都一样,那单位入样的概率就会与群的规模成反比。这样大概率抽取群,小概率抽取样本单位,一大一小相互抵消,就保证了总体单位抽取的等概率性。
12总体规模与样本规模之间是一种什么关系?
答:样本规模越小,与总体的差异就越大。一般说来,总体规模越小,增大抽样比率,对抽样精度会有较大的改善。但当总体规模达到一定程度时,样本规模的增大并不会带来精度的线性增长。