第二节 统计论证的有效性分析
统计论证也叫统计概括,属于广义的归纳论证,是指由样本具有某种属性的单位频率(百分比)推出总体具有某种属性的概率(可能性)的论证。
一、统计论证的批判性准则
统计推理是从样本过渡到总体的推理,属于不完全归纳推理,其结论所断定的范围超出了其前提所断定的范围,该前提与结论之间的联系不是必然的,因而,它的结论是或然的,不一定可靠。
(一)统计中的重要概念
1.统计中的重要概念主要有:总体、抽样和样本的代表性
所谓“总体”,就是指统计推理的结论所涉及的对象的集合。总体又可分为对象总体和样本总体。对象总体是研究对象的全体,而样本总体是被考察的对象的全体。例如,要调查某城市3万名高二学生的平均身高,从中抽选500人进行调查,这3万名学生就是对象总体,而被调查的500名学生就是样本总体。统计推理的本质就是根据样本总体的性质来推断对象总体的性质。
“抽样”是指从对象总体中选取样本总体的过程。抽样的方法对于统计推理的结论来说至关重要。如果抽样方法不合理,统计数据再准确,它对统计推理的结论也没有说服力。
“样本的代表性”是指被调查的对象能够反映其他未被调查的对象的性质。要提高统计推理结论的可靠程度,关键在于从对象总体中抽选出的样本总体是否具有代表性。
2.统计概括与统计属性
统计概括是指从样本的统计属性概括出总体的统计属性的推理,具体说就是由样本具有某种属性的单位频率(百分比)推出总体具有该种属性的概率(可能性)的推理。
所考察的样本个体中,有些具有P属性,有些不具有P属性,我们把具有这部分特征的样本属性叫做样本的统计属性。
(二)统计推理的论证结构
1.统计推理的一般结构
前提:样本有属性P。
结论:总体有属性P。
2.统计概括的论证型式
前提:样本S的x%有P属性。
结论:总体A的x%有P属性。
在以上型式中,“x%有P属性(1<x<100)”表示被考察样本S和总体A的统计属性。
增强统计推理(统计概括)可靠性的准则如下。
准则①:样本的规模越大,样本就越具有代表性。
准则②:样本与总体的相关性越大,样本就越具有代表性。
概率抽样这个概念可用来描述样本与总体的相关性,如果样本是根据总体的不同性质,选择恰当的随机抽样方法选取的,那么样本与总体就有相关性,并把它称为统计相关。随机抽样的方法包括:简单随机抽样、分层随机抽样和系统随机抽样。
准则③:结论中统计数值的参数区间越大,归纳强度就越高。
样本的统计值是总体估测值的一个参数,围绕这个参数有一个正负误差的区间,称之为参数区间。
3.统计三段论的论证型式
统计三段论是统计概括的逆转形式。其推理结构如下。
前提:总体A的x%有P属性;
前提:这个(这些)a属于总体A;
结论:这个(这些)a可能有P属性。
增强统计三段论可靠性的准则如下。
准则①:总体中的x越接近100,结论为真的可能性就越大。
准则②:样本或样本个体应当在总体中具有代表性。
准则③:结论统计数值的参数区间越大,归纳强度就越高。
(三)评估统计论证的批判性问题
在进行统计推理(论证)时,需要考虑以下批判性问题。
CQ1.明确结论问题:结论是什么?
(1)论题说了什么和没说什么?
(2)是否明确了结论中的具体概念?有人混淆或偷换概念了吗?
CQ2.数据意义问题:统计数据有何含义?
(1)数据能否说明问题?能说明什么问题?是否存在数据理解的陷阱?
(2)是否遗漏了什么?——揭示相关因素和比较基础。
(3)这个资料是否有意义?——揭露统计数据赖以建立的未经证实的假设。
CQ3.数据可信度问题:统计数据从何而来?
(1)该统计数据是谁说的?——验证资料来源的正当性和权威性。
(2)该统计数据是如何知道的?——检验样本。
CQ4.样本代表性问题:样本是否能真正代表总体?
统计推理的可靠性主要取决于样本是否有代表性。只有从能够代表总体的样本出发,才能得到关于总体的可靠结论。通常从样本的容量和样本与总体的相关性两方面来保证样本的代表性。为了保证样本的代表性,人们一般从对抽样过程提出如下要求。
(1)抽样规模应当尽可能地大。样本容量越大,结论的可靠性就越高。
(2)抽样范围应当尽可能地广。样本范围越广,结论的可靠性就越高。
(3)样本的选取应当是随机的。选取样本时不应带有主观偏见。
CQ5.反案例问题:有无未具有原样本属性的其他样本?
(1)若没发现相反的案例,则结论的可靠程度就较高。
(2)若存在相反的案例,相反的案例越多,则结论的可靠程度就越低。
CQ6.数据应用问题:统计数据的应用是否合理?
分析统计推理的前提与其结论之间的相关程度,对统计数据与结论进行如下评估。
(1)数据的相关性
统计数据与结论是否相关?相关度如何?统计数据是否能支持结论?
数据的相关性表现在样本的归属问题上。对于不同的群体,某事在样本身上发生的可能性的大小通常是不一样的。所以,当我们衡量某事在某一个样本身上发生的可能性时,必须确定这个样本属于哪个群体。
(2)数据的可比性
统计数据是否进行了比较?是否设定了供比较的对象?是否设定了比较的根据或基础?
统计概括的结论总是涉及总体的性质,也就是总体的规模和它的异质性程度,如果忽略总体性质的差异而对两个统计数据进行比较,并试图在此基础上得出某一结论,那么就犯了数据不可比的错误。其中,独立数据是指脱离比较基础的数据,这种缺乏比较的数据在论证中不具备令人信服的证据效力。
(3)结论的恰当性
要考察从这些统计数据中可以推出什么结论?得出的结论是否恰当?
二、统计论证的案例分析
■案例一:分析下面的论证在概念、论证方法、论据及结论等方面的有效性。
随着总体人口寿命水平的上升,我国的老年人口数量在持续增长。例如,在我国某个人口较密集的地区,65岁以上的老人就占了20%,而过去6个月以来,该地区度假酒店的入住率大幅下降。有鉴于这两种趋势,一个谨慎的投资者最好放弃对酒店业的兴趣,把投资转向医院和老人护理院。
【论证缺陷分析】
上文是一则统计论证,但其论证的有效性值得怀疑,其主要逻辑缺陷在于:统计数据难以说明问题,其样本可能不具有代表性,甚至可能存在反例,以及结论的得出不合理等。
【参考范文】
考虑欠周的投资建议
上文基于老年人口数量持续增长的趋势和一个人口较密集的地区度假酒店的入住率大幅下降的趋势,得出了放弃酒店业转而加大医院和老人护理院的投资建议。由于其理由不充分且存在逻辑漏洞,因此其结论不可靠,现把该案例的主要论证缺陷分析如下。
首先,作者解释“我国的老年人口数量在持续增长”这一趋势,用了“我国某个人口较密集的地区,65岁以上的老人就占了20%”这一例子,这一论述是模糊且无效的。这20%的老人本身是否数量大是不得而知的,因为缺乏比较的基础;而且老年人口数量持续增长的趋势是否存在也不清楚,因为没有和过去进行比较。
其次,这个地区的代表性如何,很难说。由于这个地区的人口较密集,不一定能成为全国人口变化趋势的典型样本。如果该地区恰好是老人喜欢移入居住的地区,那以该地区作为样本就没有代表性了。
再次,全国范围内是否存在老年人口数量持续增长,同时度假酒店的入住率上升的反例呢?上文没有论述在适合养老度假的地区,可能这样的现象是存在的。因此,老年人口数量增多未必会导致度假酒店的入住率下降。
最后,即使上述两个趋势真的存在,那放弃对酒店业的兴趣,也不能轻易地提出要把投资转向医院和老人护理院。因为现有的医院和护理院也许闲置率很高,也许老年人更喜欢居家养老、康复和护理。
总之,该作者的投资建议是建立在不充分的论据以及没有内在联系的统计数据基础之上的,因此,其论证是缺乏说服力的。
■案例二:分析下面的论证在概念、论证方法、论据及结论等方面的有效性。
我公司研制开发的财务软件,自5年前投放市场以来,受到市场高度关注,目前,市场占有率一直保持在25%左右,市场占有率位居同类软件第二名。根据市场调研,我们与第一名“财信通”的差距主要表现在界面的易用性方面,有0.9%的客户反映“财信通”的软件界面比我们的产品界面更友好。我们经过慎重考虑,在新版产品中,并未对这一问题进行任何修改。我们认为,尽管有9‰的客户对我们的产品界面提出了批评,但是,相反的方面,也就是说,99.1%客户是满意的。因此,保持独特的产品风格,保持软件的平稳升级,尊重广大客户的习惯应该是我们的选择,这样,老客户会更稳定,新客户会逐渐多起来,最终扩大我们的市场占有率,做到业内第一。
【论证缺陷分析】
上文是一则统计论证,其主要逻辑缺陷是统计数据应用不合理、没有提供数据间的比较、理由不充分、得出的结论不恰当等。
【参考范文】
混乱的统计论证
上文对其财务软件产品的竞争分析是基于统计论证的,由于该论证存在统计数据应用不合理等逻辑漏洞,因此,其得出的结论不恰当。现把其主要逻辑缺陷分析如下。
首先,作者认为“我公司的财务软件受到市场高度关注”的理由是“市场占有率一直保持在25%左右,位居同类软件第二名”,这一论述的漏洞在于数据既没有提供比较也没有明确含义。一方面,该论述没有提供与第一名的比较,另一方面,25%的市场占有率指的是“整个财务软件市场”,还是该公司财务软件的细分市场?假如该公司5年前推出的财务软件只占整个财务软件市场的1‰,虽然在本行业专用财务软件市场中占25%,而第一名的公司在去年才推出类似的软件,市场占有率就高于50%。如果是这样的情况,那么就很难说该公司的财务软件受到了市场的高度关注。
其次,作者认为,他们与第一名“财信通”的差距主要表现在产品界面的易用性方面,得出这一结论的理由是,根据市场调研,有0.9%的客户反映“财信通”的软件界面比我们的产品界面更友好。这一理由是不充分的,关键是没有提供有多少比例的客户对该公司产品与“财信通”在其他方面差距的数据,没有比较是无法得出结论的。比如,有95%的客户反映“财信通”的软件性能比我们的产品性能更优,那么该公司软件产品与“财信通”的差距就主要在性能方面而不是界面的易用性。
再次,由“有9‰的客户对我们的产品界面提出了批评”推不出“余下的99.1%的客户是满意的”。因为这些客户中也许有很多人对软件的界面并不满意,但只是未提出批评意见而已,或者多数客户对软件的界面谈不上不满意,也谈不上满意。
最后,界面更友好些不一定就会影响我公司产品的“独特产品风格”,也不一定影响“软件的平稳升级”,没准还会更符合广大客户的习惯。所以不能武断地认为,我们目前不作修改就是尊重广大客户的习惯。即使不升级用户界面,真的满足了老客户的要求,新客户是否会增加也是个未知数。由此,根本得不出“最终扩大我们的市场占有率,做到业内第一”的结论。
总之,作者思路混乱、推理机械,使得该统计论证的有效性受到严重质疑,其结论完全不具有说服力。
■案例三:分析下面的论证在概念、论证方法、论据及结论等方面的有效性。
其实,坐飞机出行的安全系数是最高的。
统计表明,坐飞机出行的安全系数是远远高于乘坐火车、汽车等地面交通工具的。近10年,国际上飞机百万架次事故率的平均水平为1.03。按照这个比例计算,一个人每天坐一次飞机,要2660年才遇上一次空难。我们外出都要算里程,所以在安全的数据度量问题上,用路程比用时间更合适、更科学。自20世纪70年代中期以后,飞机每飞行1000公里死亡的人数大约为0.05个,这个数字远远低于铁路和公路。中国民航飞机的百万架次事故率只为0.23。在中国从1982—2004年算下来,22年有21起空难,遇难人数才1404人。
人们认为火车更安全,是一种偏见。一般各国的飞机事故都会及时报道,而火车事故报道就不是很及时或者不进行报道,这给我们一种错觉,飞机似乎总出事。
【论证缺陷分析】
上文是一则统计论证,统计数据需要比较才有意义,结论不能从单方面的数据来认定,上文只列举了一组与飞机相关的安全数据,没有列举与火车等地面交通数据的对比。而且,该作者没有明确比较的基础,是不能笼统地得出“乘坐飞机出行的安全系数是最高的”这一结论的。
【参考范文】
乘坐飞机出行真的最安全吗?
作者试图通过一则统计论证来证明“坐飞机出行的安全系数是最高的”,但由于存在诸多逻辑问题,其论证是值得怀疑的,现把其中的逻辑缺陷分析如下。
首先,上文没有明确“安全系数”这一概念。因为按照不同的数据统计和理解,存在不同的比较方式,比如,有事故率方面的不同比较,包括百万架次(辆)事故率、百万乘客事故率,百万公里事故率等;也有死亡率方面的比较,比如每十亿次出行死亡人数、每十亿小时出行死亡人数、每十亿公里死亡人数等。不同的比较,结果可能是完全不同的。
其次,该作者用飞机百万架次事故率为1.03,推算出,一个人每天坐一次飞机,要2660年才遇上一次空难。由此作为飞机出行安全的一个证据,理由也是存疑的。因为虽然飞机百万架次事故率很低,但一旦出现事故,死亡率是最高的,而且是死亡人数众多。而且,该作者没有提供同样出行次数的情况下,乘坐飞机和乘坐火车的出事故次数和死亡人数的比较,也许每百万次出行死亡人数,飞机是要高于火车的。
再次,该作者用“飞机每飞行1000公里死亡的人数大约为0.05个,这个数字就远远低于铁路和公路”来支持飞机出行安全的结论也是片面的。因为飞机速度快,按照公里数计算,事故率和死亡率确实相对较低。但是,如果按照出行次数或出行时间计算,乘坐飞机出行的死亡率很可能高于乘坐火车或汽车。
另外,上文笼统地认为,飞机比火车等地面交通工具安全,该结论是不成立的。因为人们对安全的理解各不相同,有人以出行次数为基础,有人以出行时间为基础,有人以出行路程为基础,不同比较的结果是不同的。按照任何单一指标比较飞行和地面交通的安全性都是不恰当的。
最后,作者认为“火车更安全,是一种偏见”,仅仅举出报道差异,这个理由是不充分的。很多人认为火车安全的理由可能很多,比如火车事故的死亡率低、火车出事后逃生的机会比飞机大得多、飞机出事后很少有生还者、有些人对高空恐惧的心理偏见等,如果该作者想证明自己的观点,这些都需要进行驳斥。
总之,由于上述统计论证存在诸多逻辑漏洞,因此,其结论是值得商榷的。