1.4 抽样设计和制定样本计划
1.4.1 关于抽样的概念
受调研时间与调研费用的限制,市场调研活动更多地采用抽样调查的方式搜集市场信息。而采用抽样调查必须掌握以下几个相关的重要概念。
1.总体及定义总体
市场调研者应该在明确调查对象后,再实施相应的市场调研活动。调查对象就是调查总体。定义总体要解决这样几件事:总体的范围、性质和构成。例如,杂志社主编希望掌握所有读者的意愿,以便调整杂志的内容设计。“全部读者”就是主编对总体的定义。而杂志社的市场调研人员认为应该对杂志的订阅户进行调查,因为杂志社有较为完整的订阅户资料。
2.样本与样本单位
样本是由一定数量的样本单位所组成的集合。样本单位的多寡又称样本容量的大小,即有大小样本之别。样本单位是按一定的抽样方法从总体中抽取调来的。提高样本对总体的代表性可以减少抽样误差的大小。
3.抽样框架及抽样框架的选择
抽样框架是包含所有样本单位的集合。抽样框架的确定可以保证调研人员从中抽取自己所要的调查样本。市场调研可以借用的抽样框架有时会有多种类型,这样调研人员就必须从中选择一个相对理想的抽样框架。
4.随机抽样与非随机抽样
整体中的所有基本单元,根据被抽中的概率是否相等而将抽样调查分为两大类,即随机抽样调查与非随机抽样调查。
5.抽样误差
简单地说就是调研所得出的对总体某个特征的推断与总体该特征最终实际结果之间的差距。采用随机抽样调查方式所存在的抽样误差是可以计算并控制的,而非随机抽样调查虽然也同样存在调查误差,但无法确定哪些是抽样误差。
1.4.2 随机抽样方法
调研人员在实施抽样前必须确定抽样的具体方式。他们最终选择随机抽样方式的原因有:
(1)调研人员确定使用统计分析方法处理和使用调研数据。采用随机抽样调查,以保证调研数据对总体具有足够的代表性。
(2)调研结果必须具有较高的准确性和把握性。只有随机抽样调查获得的调研数据才能得出具有相应准确性与把握性的对总体特征的推断结果。
(3)调研人员已经掌握了随机抽样的程序、原理和原则。随机抽样的程序设计必须确保每个总体单位被抽取的机会(概率)相等。
(4)存在随机抽样必须存在的相对理想的抽样框架。
市场调研中采用随机抽样的方式确定调研单位的具体方法主要有下列5种。
1.简单随机抽样
调研人员必须先将总体的所有单位逐一编号。再根据“随机数码表”中数值的出现顺序,对照总体单位的号码,逐一确定调研单位。成年人的身份证号码、工作证或学生证号码等都是消费者抽样时可以利用的编码资料。
2.系统或等距随机抽样
与简单随机抽样一样,调研人员也需要先对总体单位进行编码。然后再确定抽样间隔。从第一个间隔中按简单随机抽样方法抽取第一个调研单位,即抽样起点,随后按规定的间隔,一一抽取调研单位,组成调研样本。
系统随机抽样应该防止产生“系统性抽样误差”。因为调研对象的变动会带有某种规律,即以一定的数量间隔发生周期性变化,而此时抽样间隔又同这类周期间隔相似。例如,在城市的居民小区做各项调研,若采用系统随机抽样方法确定样本单位,要注意抽样间隔不要同楼层恰好相同,因为这样抽到的样本单位都是住在同一层楼上的居民,从而使样本根本无法代表总体的特征,导致调研结果无效。
3.分类随机抽样
分类随机抽样先要有一个完整的总体分类资料,能够使调研人员明确知道总体内部结构的大致状况,确定各类样本单位的分配比例,随后再按预订从各类总体单位中抽取相应数目的样本单位。
调研窗口1-5
分类随机抽样方法的运用——教师生活水平变动状况调研
调研人员深知各种教师生活水平的提高幅度存在一定的差别,所以为抽取到一个更具代表性的样本,应该采用分类随机抽样的方法来确定样本单位。
第一步:寻找并确定一个具有总体分类特征的抽样框架,从上海市统计局提供的上海市教育发展统计资料中得到上海市各类教师人数比例。
第二步:确定各类样本单位数ni=(Ni/N)·n。例如,大学教师占全市教师的25%,若样本容量为200人,则必须从大学教师中抽取25%×200=50人。构成对应各类总体的“子样本”。
第三步:按简单随机抽样方法从各类中抽取相应数量的样本单位。可以按“教师证编号”结合随机数码表抽取样本单位。
第四步:将各子样本组合在一起构成一个完整的上海市教师生活水平变动调研的样本。
第五步:取自各类总体的子样本所得出的调研结果可以满足对相应类别总体特征的推断,例如,大学教师样本所提供的信息,可以用来推断上海所有大学教师生活水平的变动状况。而整个样本所提供的信息则可满足对上海市所有教师生活水平总体变动的推断。
在现实生活中,调研人员可以很方便地找到那种总体经过一定分类的抽样框架,这些框架一般以各种普查结果的分类数据为主。
4.整群随机抽样
与上述几种随机抽样方法的最大不同是,整群随机抽样是“一批批”地抽取样本单位。调研人员若想使用整群随机抽样方法来确定调研样本,就必须将总体分成若干群,随后再给它们逐一编号,最后根据随机数码表的数字出现次序,抽取它们中的若干群构建成一个调研样本。此时若是每个群体的大小不一,那么调研人员在抽样前就无法确定样本容量大小,能够确定的是抽取多少“样本群”。
当“群”之间的差异十分明显而使“群”内的差异不明显时,在抽取的样本群极为有限的情况下,就会冒产生极大的抽样误差的风险。
5.多阶段随机抽样
当调研范围很大时,为了在一定的把握条件下获得相对准确的调研结果,就必须扩大样本容量。此时调研人员可以尝试多阶段随机抽样方法。
调研窗口1-6
多阶段随机抽样方法的运用——上海市民购买地点选择倾向调研
调研人员在尝试整群随机抽样的方法后发现,采用这种方法确定调研样本开展的调研会使误差大到无法接受的地步。而若是增加样本群数就会增加调研费用,这同样也是无法接受的。怎么办?多阶段随机抽样方法可解燃眉之急。
第一步:将上海近20个区县逐一编码,再使用随机数码表抽取若干区县。
第二步:将抽中的区县的全部街道列出并加以编码。再根据随机数码表抽取若干街道。
第三步:将抽中的街道的全部所属居委会逐一列出并编码,再根据随机数码表抽取若干居委会。
如果调研人员觉得根据这些“居委会”进行普查式的调查能够确保获得准确的结果,那么这个3阶段抽样方案就告成立,反之,则可将抽中的居委会下辖的居民小组再全部列出,按随机数码表实施四阶段抽样。
1.4.3 非随机抽样方法
市场调研人员可以选择采用非随机抽样的方法确定调研样本。较为常用的非随机抽样方法主要有以下几种。
1.便利抽样
调研人员根据“最便利”原则确定自己的调研样本单位。例如,调研人员接受一项对上海年轻市民需求状况的调查任务,他就直接选择同学或朋友作为访问对象,立即开展调查迅速获得了调研分析所要的资料。
2.判断抽样
调研人员根据“最符合调研对象特征”原则来确定自己的调研样本。这种抽样方法不同于便利抽样的“最便利”原则,而是“最适合”。例如,对大学生的消费倾向调研,某调研人员选择在大学的学生餐厅采用拦截式现场访问的方式来搜集完成此项调研任务所需的资料。
3.推荐抽样
也称“雪球抽样”,对于初次涉及市场调研工作的人来说,最使他们为难的或许不是缺乏调研方法、信心不足或者是独立进行入户访问的胆怯,而是缺乏具体的调研对象,即找到一个具备被调查者的所有条件而又愿意回答问题的人,此时调研人员不妨尝试一下“雪球抽样”方法,具体操作步骤见“调研窗口1-7”。
调研窗口1-7
雪球抽样方法的运用——新产品的顾客意见调研
“伊利”是一家食品生产企业。在2006年以其享誉中国北方数省的冰淇淋“苦咖啡”打入上海冷饮食品市场。为获得更加准确的市场信息,伊利公司想开展一场市场调研活动。调研对象是上海冷饮食品经销商。但是,伊力公司手头上只有少数几家上海经销商的名单。于是想采用“雪球抽样”来确定所有的访问对象。
第一步:伊利上海分公司选择上海的老客户——家利超市公司,作为第一个访问对象。访问员张小姐与李先生在按调研提纲的规定要求,提问完所有问题后起身向家利超市公司市场部徐经理致谢。张小姐向徐经理问道:“徐经理,我们对上海的情况不熟悉,不知您是否可以向我们介绍几家与贵公司相似的上海冷饮经销商的情况?”于是热心的徐经理请两位客人再次坐下,对徐经理来说这些都是“烂熟于胸”的东西。两位访问者十分仔细地听着。
第二步:张小姐请徐经理将自己介绍给徐经理熟悉的几家上海冷饮经销商的有关管理人员。“徐经理,太感谢您了,很冒昧地提出这样的要求,您是否能把我们介绍给您在这几家公司的朋友?”“当然没问题。”于是,徐经理拿起了办公桌上的电话,拨通了“华联”、“联华”几家超市公司的朋友的电话:“我是小徐啊,我有两位朋友想去你那儿,了解有关冷饮的销售情况,你看有空吗?有空!好,请他们马上就来?好的,谢谢,有空我请你吃饭。再见。”
第三步:张小姐与李先生又马不停蹄地赶往“华联”与“联华”。在搜集了有关资料后又请这两家超市公司的受访者为自己介绍新的受访者。
这样伊利的调研样本单位数以几何级数迅速增加。
在一个陌生的地方或市场,进行市场调研可能不会存在随机抽样所必需的各项基本条件,如一个理想的抽样框架、一个按某种次序排列的总体单位资料等。同时由于对当地情况知之甚少而无法采用便利抽样和判断抽样,雪球抽样真的是一种好办法。
4.配额抽样
这种抽样方法与“分类随机抽样”方法很相似。调研人员如果对调研总体的结构特征有较为详细的了解,在不具备采用随机抽样条件的情况下,可以尝试配额抽样方法。与分类随机抽样一样,可以根据总体各类单位的所占比例,确定在各类总体单位中抽取样本单位的具体数量。例如,对产业市场的客户需求调研,将客户分为以下几类。
表1-1 产业市场需求调研的样本结构设计
现在调研人员已经确定在各类客户中抽取多少户作为开展调研的访问对象。接下来调研人员就要具体确定向哪些客户开展本次产业市场需求调研。例如,要对22户“中等数量购买者”用户进行调查,究竟是由哪22家客户组成这类样本?调研人员可以选择便利抽样或判断抽样等方法。
非随机抽样在具体实施时无须调研人员掌握各种随机抽样技能,所以十分简便易行。只是最后无法做出精确和可靠结论。但是这绝不是说,由非随机抽样调查最终得出的结果就没有准确性可言,或者说不如由随机抽样确定的样本所得出的调研结果那样准确、可靠。
1.4.4 制定样本计划
样本计划是一个由几个阶段所组成的工作过程,或者说样本计划也属于抽样设计的一个重要组成部分。结合上述内容,我们将样本计划的全过程用图1-4予以说明。
图1-4 样本计划的流程
第一步到第三步中涉及的内容,此前都已做了介绍。现在从第四步“确定样本容量大小”说起。为了达到预期的调研目的,调研人员都会遇到“应该抽取一个多大容量的样本才合适”的问题。事实上合适的样本容量受多种因素的制约与影响。直接影响样本容量大小的因素有:
(1)总体单位在某个研究特征上的差异大小。为提高样本对总体的代表性,差别越大要求样本容量也越大。总体的差异性大小,能够用总体标准差来说明。
(2)抽样允许误差的大小。调研人员在样本计划中做出保证调研误差不超出一定的范围。在其他条件确定后,抽样允许误差越大,则样本容量就越小。
(3)调研人员对自己的推断结论成立的把握性。因为调研人员的调研结果将会对决策者的某项重大决策造成极大的影响,所以需要谨慎,调研人员需要提高调研结论成立的把握性,从而就必须增大调研样本容量。
在抽样的实施过程中还会遇到许多具体问题。而这些问题中有的对样本容量的大小会产生直接影响。较为重要的有以下几个:
(1)调研预算的多少。样本容量大,就需要增加调研工作量从而增加调研费用。
(2)调研规定的期限长短。增大样本容量需要投入更多的调研时间。
(3)调查方法不同。邮寄问卷调研的样本可以比入户访问调研的样本大得多。
(4)被调查者合作态度的差异。对于一个十分重视信息搜集的地区或人群来说,开展一项市场调研会得到大家的诚意合作,样本容量减少的可能性小。
第五步:在确定必须抽取的样本容量后,再按照已经确定的抽样方式,逐一抽取样本单位,直到达到规定的样本单位数量为止。
第六步:也是一个较为重要的环节,在实施抽样时发现,许多在样本设计中确定的样本单位在实际调查时都失踪了,这样无法做出具有原来那种准确性和可靠性的推断。解决的办法是扩大样本容量,如表1-2所示。
表1-2 抽样样本的调整及最终样本容量的确定
由于每一类教师中都有不同程度的“样本单位损失率”,所以在正式市场调研开始前,必须调整样本容量。但是各类扩容幅度不尽相同。