上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2011年中央财经大学432统计学[专业硕士]考研真题及详解

一、单项选择题（本题包括1～20题共20个小题，每小题1.5分，共30分）

1网站把调查问卷刊登在网页上，然后由感兴趣的网民自行填写。对于此类调查，以下说法正确的是（　　）。

A．这是简单随机抽样

B．这是方便抽样

C．这是雪球抽样

D．这是全面调查

【答案】B

【解析】B项，方便抽样是指调查过程中由调查员依据方便的原则，自行确定入抽样本的单位。A项，简单随机抽样是指从总体N个单位中任意抽取n个单位作为样本，使每个可能的样本被抽中的概率相等的一种抽样方式；C项，滚雪球抽样是指先随机选择一些被访者并对其实施访问，再请他们提供另外一些属于所研究目标总体的调查对象，根据所形成的线索选择此后的调查对象，往往用于对稀少群体的调查；D项，全面调查是指国家统计系统和各个业务部门为了定期取得系统的、全面的基本统计资料，按一定的要求和表式自上而下统一布置，自下而上提供资料的一种统计调查方法。

2随机变量X的方差为2，随机变量Y＝2X，那么Y的方差是（　　）。

A．1

B．2

C．4

D．8

【答案】D

【解析】由于Var（cX）＝c²Var（X），故Var（Y）＝Var（2X）＝2²×Var（X）＝2²×2＝8。

3某政府机构想尽快了解社会公众对其出台的一项政策的态度，最恰当的数据搜集方式是（　　）。

A．面访

B．深度访谈

C．计算机辅助电话调查

D．邮寄调查

【答案】C

【解析】C项，计算机辅助电话调查是利用现代化电脑程控通讯设备进行的随机电话访问方式，采用这种访问调查方式，具有调查内容客观真实、保密性强、访问效率高等特点。A项，面访即调查者直接走访被调查者，当面听取被调查者的意见，可以比较全面、深入，能获得大量真实的研究资料，但这种方法容易使研究结论带有主观成分；B项，深度访谈是一种无结构的、直接的、一对一的访问形式。最常应用于探测性调查，但是这种访谈方法所得的资料难以进行统计处理和定量分析，而且特别耗费时间，使得访谈的规模受到较大的限制；D项，邮寄调查法，是指将事先设计好的调查问卷，通过邮政系统寄给被调查者，由被调查者根据要求填写后再寄回，是市场调查中一种比较特殊的调查方法。这种调查方法的调查周期通常比较长，时效性差。

4将一颗质地均匀的硬币先后抛掷3次，至少出现2次正面的概率是（　　）。

A．1/4

B．3/8

C．1/2

D．5/8

【答案】C

【解析】记X为抛掷3次硬币出现正面的次数，根据古典概率计算公式可知：

5设函数f（x）在区间（a，b）上等于0.4，在此区间之外等于0，如果f（x）可以作为某连续型随机变量的密度函数，则区间（a，b）可以是（　　）。

A．（0，0.5）

B．（0.5，2.5）

C．（1.5，2.5）

D．（0，2.5）

【答案】D

【解析】根据概率密度函数的性质可知：

解得：b－a＝2.5，只有D项满足条件。

62000年的一项调查发现，新购买小汽车的人中有40%是女性，在今年将再做一项调查旨在检验新车主中女性的比例是否有显著增加，建立的原假设和备择假设为（　　）。

A．H₀：π＝40%，H₁：π≠40%

B．H₀：π≥40%，H₁：π＜40%

C．H₀：π≤40%，H₁：π＞40%

D．H₀：π＜40%，H₁：π≥40%

【答案】C

【解析】通常将研究者要证明的结论作为备择假设。原假设与备择假设互斥，肯定原假设，意味着放弃备择假设；否定原假设，意味着接受备择假设。由题意可知原假设H₀为π≤40%，备择假设H₁为π＞40%。

7已知数列{1，3，3，5，5，7，7，9，122}，下面说法错误是（　　）。

A．算数平均数是18

B．中位数是5

C．众数是5

D．极差是121

【答案】C

【解析】众数是一组数据中出现次数最多的数值，由题干可知，众数分别是3，5，7。

8在多元线性回归分析中，t检验是用来检验（　　）。

A．总体线性关系的显著性

B．各回归系数的显著性

C．样本线性关系的显著性

D．H₀：β₁＝β₂＝…＝β_k＝0

【答案】B

【解析】在多元线性回归分析中，F检验用来检验回归方程整体线性关系的显著性；t检验用来检验各回归系数的显著性；H₀：β₁＝β₂＝…＝β_k＝0是进行回归方程整体线性关系显著性检验时的原假设。

9以下关于“非抽样误差”说法正确的是（　　）。

A．只有非全面调查中才有

B．只有全面调查中才有

C．全面调查和非全面调查中都有

D．全面调查和非全面调查都没有

【答案】C

【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差；非抽样误差是相对抽样误差而言的，是指除抽样误差之外的，由于其他原因引起的样本观察结果与总体真值之间的差异。抽样误差是一种随机性误差，只存在于概率抽样中；非抽样误差则不同，无论是概率抽样、非概率抽样，或是在全面性调查中，都有可能产生非抽样误差。

10把数据中的每个数值减去最小值然后除以极差是一种常用的数据预处理方法。对于经过这一变换之后的数据，以下说法不正确的是（　　）。

A．服从正态分布

B．没有计量单位

C．取值在0和1之间

D．是相对数

【答案】A

【解析】极差等于一组数据中的最大值减去最小值，将数据中的每个数值减去最小值然后除以极差得到一个相对数，其取值在0和1之间。经题干中的方法处理后，消除了量纲，数据没有计量单位了，并且数据仍保持原分布。

11一名研究人员希望通过图形来说明4月份以来北京地区二手房租金每天的变化，如下哪个图形最合适（　　）。

A．直方图

B．散点图

C．折线图

D．茎叶图

【答案】C

【解析】直方图是用于展示分组数据分布的一种图形，它是用矩形的宽度和高度（即面积）来表示频数分布的；散点图是用二维坐标展示两个变量之间关系的一种图形；茎叶图是反映原始数据分布的图形；如果数值型数据是在不同时间上取得的，即时间序列数据，则可以绘制线图，线图主要用于反映现象随时间变化的特征。

12以下关于参数和统计量的说法正确的是（　　）。

A．总体参数是随机变量

B．样本统计量都是总体参数的无偏估计量

C．对一个总体参数进行估计时，统计量的表达式是惟一的

D．样本统计量是随机变量

【答案】D

【解析】参数是用来描述总体特征的概括性数字度量，它是研究者想要了解的总体的某种特征值，研究者所关心的参数通常有总体平均数、总体标准差、总体比例等；由于总体数据通常是不知道的，所以参数是一个未知的常数。在对总体参数进行估计时，可以采用最小二乘估计、极大似然估计等估计方法，不同方法得到的估计量可能不同，也不一定具有无偏性的性质。统计量是用来描述样本特征的概括性数字度量，它是根据样本数据计算出来的一个量，是样本的函数；由于抽样是随机的，因此统计量是随机变量。

13关于有常数项的一元线性回归方程，以下正确的是（　　）。

A．判定系数等于自变量和因变量的相关系数

B．判定系数等于自变量和因变量相关系数的平方

C．自变量和因变量相关系数等于判定系数正的平方根

D．修正的判定系数等于自变量和因变量相关系数的平方

【答案】B

【解析】在一元线性回归中，自变量和因变量的相关系数实际上是判定系数的平方根，且它与回归系数的符号一致。

14如果y关于x的回归方程为＝2－x，而且这个回归方程的R²＝0.81，则x与y之间的相关系数（　　）。

A．r＝1

B．r＝－1

C．r＝0.9

D．r＝－0.9

【答案】D

【解析】在一元线性回归中，自变量和因变量的相关系数实际上是判定系数的平方根。

由y＝2－x知，x与y是负相关的，所以其相关系数为－0.9。

1595%置信水平的区间估计中95%的置信水平是指（　　）。

A．总体参数落在一个特定的样本所构造的区间内的概率为95%

B．总体参数落在一个特定的样本所构造的区间内的概率为5%

C．在用不同的样本构造的总体参数的多个区间中，包含总体参数的区间比例为95%

D．在用不同的样本构造的总体参数的多个区间中，包含总体参数的区间比例约为95%

【答案】C

【解析】如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值，5%的区间不包含总体参数的真值，那么用该方法构造的区间称为置信水平为95%的置信区间｡

16关于单因素方差分析中的F检验（　　）。

A．拒绝域在F分布曲线的右侧

B．F统计量的样本观测值可能为负值

C．拒绝域在F分布曲线的左侧和右侧

D．以上表述都不对

【答案】A

【解析】在单因素方差分析中，若F＞F_α，则拒绝原假设；若F＜F_α，则不拒绝原假设。

17在假设检验中，如果所计算出的P值越小，说明检验的结果（　　）。

A．越显著

B．越不显著

C．越真实

D．越不真实

【答案】A

【解析】P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小，说明这种情况发生的概率很小，而如果出现了，根据小概率原理，则有理由拒绝原假设；P值越小，拒绝原假设的理由就越充分。

18某商场2008年12月的商品销售额为100万元，该月的季节指数等于125%（乘法模型），在消除季节因素后该月的销售额为（　　）。

A．80万元

B．100万元

C．125万元

D．以上都不对

【答案】A

【解析】计算出季节指数后，将各实际观察值除以相应的季节指数，即可将季节性成分从时间序列中分离出去。即100/125%＝80（万元）

19在一次问卷调查中要求被调查者直接填写出个人的民族、婚姻状况、居住地的邮政编码、年龄和收入。以下说法不正确的是（　　）。

A．民族是定性变量

B．邮政编码是定量变量

C．年龄的计量尺度是定比尺度

D．收入数据是定量数据

【答案】B

【解析】变量分为定性变量和定量变量。定性变量是指观测的个体只能归属于几种互不相容类别中的一种，一般是用非数字来表达其类别的变量。定量变量是指可以用数值表示其观察结果，而且这些数值具有明确的数值含义，不仅能分类而且能测量出来具体大小和差异的变量。定距尺度也称等距尺度或区间尺度，是一种不仅能将变量（社会现象）区分类别和等级，而且可以确定变量之间的数量差别和间隔距离的方法。定比尺度也称比例尺度或等比尺度，是一种除有定距尺度的全部性质之外，还能测量不同变量（社会现象）之间的比例或比率关系的方法；以定比尺度测量的数据具有绝对零点。由于邮政编码只是对应于行政区域的一个标签，其数值并没有实际意义，故它是定性变量。

20下列指数中属于质量指数的是（　　）。

A．消费者价格指数

B．销售量指数

C．GDP增长率

D．销售额指数

【答案】A

【解析】数量指标指数是反映数量指标变动程度的相对数，如商品销售量指数、工业产品产量指数等，数量指标通常采用实物计量单位。质量指数指标是反映品质指标变动程度的相对数，如产品价格指数、产品单位成本指数等，质量指标通常采用货币计量单位。

二、简答题（本题包括1～5题共5个小题，每小题10分，共50分）。

1简述假设检验的过程。

答：假设检验的过程如下：

（1）根据所研究问题的要求提出原假设H₀（或称为零假设、无效假设）和备择假设H₁；确定显著性水平，显著性水平为作假设检验时犯第一类错误的概率。

（2）选择合适的检验方法，构造适当的检验统计量，确定统计量的分布，并代入样本数据计算在原假设成立条件下它的数值。

（3）根据计算出的检验统计量观测值，查阅统计表，确定相对应的p值；将p值与显著性水平α比较，若p≤α，则拒绝H₀，接受H₁；若p＞α，则不能拒绝H₀。

2请给出你所知道的概率抽样的组织方式。

答：概率抽样也称随机抽样，是指遵循随机原则进行的抽样，总体中每个单位都有一定的机会被选入样本。

调查的实践中经常采用的概率抽样方式有以下几种：

（1）简单随机抽样。简单随机抽样指从包括总体N个单位的抽样框中随机地、逐个地抽取n个单位作为样本，每个单位入样的概率是相等的；

（2）分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层，然后从不同的层中独立、随机地抽取样本，将各层的样本结合起来，对总体的目标量进行估计；

（3）整群抽样。整群抽样是指首先将总体中若干个单位合并为组，这样的组称为群，抽样时直接随机抽取一个群，然后对中选群中的所有单位全部实施调查；

（4）系统抽样。系统抽样是指将总体中的所有单位（抽样单位）按一定顺序排列，在规定的范围内随机地抽取一个单位作为初始单位，然后按事先规定好的规则确定其他样本单位；

（5）多阶段抽样。采用类似整群抽样的方法，首先抽取群，但并不是调查群内的所有单位，而是再进一步抽样，从选中的群中抽取出若干个单位进行调查；因为取得这些接受调查的单位需要两个步骤，所以将这种抽样方式称为二阶段抽样；这里，群是初级抽样单位，第二阶段抽取的是最终抽样单位。将这种方法推广，使抽样的段数增多，就称为多阶段抽样。

3在盒子图（箱线图）的作图中，会使用哪些描述指标。

答：箱线图（Boxplot）也称箱须图（Box-whisker Plot），是利用数据中的五个统计量：最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法，它也可以粗略地看出数据是否具有对称性，分布的分散程度等信息，特别可以用于对几个样本的比较。故箱线图使用的描述指标有：最小值、第一四分位数、中位数、第三四分位数与最大值。

4下列调查问卷中的提问都有问题，请修改。

（1）您和您爱人是否对现有住房满意？

（2）您最近一次是几点上班的？

（3）绝大多数喝过明光牛奶的人都认为它口味纯正，您认为是这样的吗？

答：（1）您对现有住房满意吗？您爱人呢？

（2）您最近一次是几点离开家去上班的？

（3）您认为明光牛奶的口味纯正吗？

5如果有百分之五的人是左撇子，而小明和他弟弟都是左撇子；那么小明和他弟弟都是左撇子这个事件的概率是不是0.05×0.05＝0.0025？为什么？

答：不是。

显然，小明和他弟弟都是左撇子的事件不是独立的，所以这种计算方法错误。

当两个事件相互独立时：

P（AB）＝P（A）P（B）　（1）

当两个事件不相互独立时：

P（AB）＝P（A）P（B|A）＝P（B）P（A|B）　（2）

记事件A为小明是左撇子，事件B为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左撇子这两个事件不相互独立，所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。

三、计算与分析题（本题包括1～3题共3个小题，第1题10分，第2、3题30分，共70分）

1．离散型随机变量X的概率分布率如下。

（1）确定概率分布率中a的值。

（2）试给出随机变量X的分布F（x）。

（3）计算随机变量X的均值和方差。

解：（1）根据离散型随机变量的概率分布列的正则性，即∑p_i＝1可知：0.2＋0.1＋0.3＋a＝1，得a＝0.4。

（2）当x＜1时，F（x）＝0；

当1≤x＜2时，F（x）＝0.2；

当2≤x＜3时，F（x）＝0.2＋0.1＝0.3；

当3≤x＜4时，F（x）＝0.2＋0.1＋0.3＝0.6；

当x≥4时，F（x）＝0.2＋0.1＋0.3＋0.4＝1。

所以随机变量X的分布为：

（3）

2一家紧急救护中心目前每天的值班护士人数相同。表1是2010年11月1日至2010年11月26日到紧急救护中心的病人数（紧急救护中心周六，周日不营业），表2和表3分别是表1数据的描述统计和方差分析的结果。

根据表1、表2和表3中的数据和统计分析结果，请你替这家紧急救护中心的主任给他的上级主管部门撰写一份报告，阐明根据一周每天病人人数安排相应的值班护士人数的理由。

报告至少涵盖下面两项内容：

（1）一周中每天的病人人数是否存在差异？

（2）如果存在差异，哪些天似乎是最繁忙的？

答：（1）提出假设：

H₀：μ₁＝μ₂＝μ₃＝μ₄＝μ₅

H₁：μ_i（i＝1，2，…，5）不完全相等

由表3可知，方差分析中F检验的P-value＝6.26E-12＜α＝0.05，故拒绝原假设，认为周一至周五每天病人的平均人数之间有显著差异。

（2）由表二我们知道周一至周五每天病人的平均人数里周一和周五最多，周四病人的平均人数最少，故可减少周四相应的值班护士人数增派安排到周一和周五，以达到护士人员的合理安排优化配置。

报告略。

3某汽车租赁公司的财务主管发现有位司机报销的年度维修费用过高，你怀疑他和汽车维修公司合伙，开出虚高的发票。这位财务主管收集了6位非常可靠的司机的汽车年度维修费用和对应的汽车使用年限数据（见表4）。以年度维修费用为因变量y，相应汽车的使用年限为自变量x，建立回归模型

y＝α＋βx＋ε

或者

y_i＝α＋βx_i＋ε_i（i＝1，…，6）

在EXCEL中，通过回归分析，得到表5和表6的输出结果。这位司机提交的年度维修费用发票共8001元，他的汽车的使用年限为5年。根据表5和表6，可以计算使用年限为5年的汽车对应的年度维修费用的95%置信预测区间为[4498.722，7348.021]。

请你为这位财务主管给他的上级主管部门撰写一个500字以内的报告，阐明调查这位司机的理由。

报告至少涵盖下面两项内容：

（1）解释模型的合理性；

（2）区间预测的合理性。

注：在计算预测区间时使用了下面的公式。给定汽车的使用年限x_p，汽车年度维修费用的置信度为1－α的预测区间为：[_p－t_α/2（n－2）s_ind，_p＋t_α/2（n－2）s_ind]。

其中，_p＝＋x_p

s是ε标准差的估计。

表4　维修费用记录表

表5　方差分析

表6　系数估计

答：（1）

表7　回归结果

由表6可以得到，线性回归方程为：.657＋814.7429x

回归系数₁＝814.7429表示：汽车的使用年限每延长1年，汽车的年度维修费用平均增加814.7429元。

由表7可知R²＝92.8704%，表明在汽车年度维修费用的变差中被汽车的使用年限与年度维修费用的线性关系所解释的比例为92.8704%，回归方程的拟合程度十分好。

估计标准误差s_e＝0.558497，表示，当用汽车的使用年限来预测年度维修费用时，平均的预测误差为0.558497%，表明预测误差十分小。

（2）由表5可知，Significance F＝0.001953＜α＝0.05，即回归方程的线性关系显著。回归系数检验的P值＝0.001953＜α＝0.05，表明回归系数显著，即汽车使用年限是影响汽车年度维修费用的显著性因素。表明该模型十分合理，故可以用来进行预测。通过计算使用年限为5年的汽车对应的年度维修费用的95%置信预测区间为[4498.722，7348.021]，表4中汽车使用年限为5年的年度维修费用为6449元，显然落在了置信区间内，由此可说明区间预测的合理性。据此可判断这位司机提交的年度维修费用发票共8001元未落在置信区间内，明显不合常理，不能排除他和汽车维修公司合伙，开出虚高的发票的疑点。

报告略。