三、谁的估计结果更为可信?
除了上述学者之外,还有其他一些人(如杨功焕等)也对当代中国人的自杀率进行过计算。但上面介绍的这些文献已经足以向我们表明,在“当代中国人的自杀率到底是多少”这个问题上,情况是多么的扑朔迷离、令人困惑。以1995年左右中国人的自杀率数字为例,在上面介绍的这些文献中,我们就至少可以得到以下几个不同的数字:
在上面这些关于中国人自杀率的数字中,最低的数字是16/10万,最高的数字则是32.9/10万,两者相差1倍左右。虽然前一个数字涉及的年份是1994年,后一个数字涉及的年份是1998年,前后相差了4年时间,有可能是自杀率的实际变化造成了自杀率数字上的差异,但无论是经验的考察还是理性的分析都可以告诉我们,这种情况(4年间中国人实际自杀率上升1倍)发生的概率是微乎其微的。这种数字上的差异更可能是数字生产方式方面的差异所致。而那些针对同一年份或时间段的不同自杀率数字,则更只能用数字生产方式上的差异来解释。这就使我们不得不去思考这样一个问题:对于这些用不同数据生产方式生产出来的自杀率数字,我们该怎样来加以对待呢?
人们通常都认为,面对同一个问题,当存在着不同的答案时,其中应该只有一个答案是正确的,或相对而言更为正确。假如我们坚持这样一种我曾经称之为“传统实在论”的常识性看法,那么我们就不得不问:在上述这样一些关于中国人近年(譬如,1995—1999年)自杀率的数据中,尤其是那些有关相同年份或相近年份的数据中,哪一个才是正确的,或相对而言是更为正确的呢?
要回答这个问题,我们就不得不去对上述这些数字的生产过程进行一番回溯,对它们各自的合理性进行分析,看看我们最终到底是否能够判断出在那些关于同一时期中国人自杀率的不同数字中哪一个数字才是正确的,或相对而言是更为正确的。
1. 编号1自杀率数字的“正确性”
参照费立鹏等人在《中国的自杀率:1995—1999年》一文中的叙述,编号1的自杀率数据是以中国卫生部统计信息中心下属的死亡登记系统提供的1995—1999年人口死亡率资料中所获的属于自杀范畴的人口数据为基础计算出来的。不过,由于发现卫生部统计信息中心下属的死亡登记系统覆盖的城市人口与农村人口的比例(57:43)与国家统计局数据显示的同期城乡人口比例(22:78)有较大出入,费立鹏等人在计算中国居民的自杀率之前,根据国家统计局报告的1995—1999年人口数据,对该登记系统每年的死亡率数据按性别、年龄组以及城乡人口比例进行了调整,并根据国家统计局1995年1%抽样调查的结果分配72组人群中每组人口所占的比例,使该样本人口能代表全国的情况。因此,编号1的自杀率数字至少在以下条件存在时才可能是可靠的或“正确的”:中国卫生部统计信息中心下属的死亡登记系统提供的1995—1999年人口死亡率资料中所获的属于自杀范畴的人口数据是准确无误的(至少没有漏报和错报现象)。但费立鹏等人后续的一些研究则警示我们,这一条件很可能是不存在的。
2. 编号2自杀率数字的“正确性”
编号2的自杀率数字是费立鹏团队的研究人员判断中国卫生部统计信息中心下属的死亡登记系统提供的1995—1999年人口死亡资料可能会有漏报现象后,对其进行了进一步的调整后计算出来的。调整的具体方法和步骤是:采用国家统计局报告的年死亡率估计值来推算卫生部死亡登记系统漏报的死亡率。作者将国家统计局报告的每年的死亡总数按比例分配到72组人群,来推算每组人群的预期死亡人数;根据1995年1%抽样调查中每组人群死亡人数占死亡总数(死亡总人数为79 619人)的比例来分配研究中每组死亡人数占总死亡人数的比例。然后,通过比较每组人群的预期死亡人数(根据国家统计局的数据)以及根据卫生部资料中每组人群总的粗死亡率计算出的死亡人数,来推算卫生部死亡登记系统每年每个年龄组、男女、城市与农村人群的漏报的死亡率。最后,根据计算出的漏报的死亡率对卫生部的自杀率数据进行调整,然后根据调整后的自杀率以及每一年每组人群的相应人口数推算出每年每组人群的自杀人数。正如费立鹏等人已经意识到的那样,用这种方法对卫生部死亡登记系统的数据进行调整,实际上也是以一些隐含的假设为前提的。譬如,首先,必须假定国家统计局报告的死亡率估计值比卫生部和DSP报告的死亡率数据更为准确(否则就没有任何理由拿国家统计局报告的死亡率估计值来做参照);其次,必须假定每组人群中各种死亡原因漏报的死亡率均一样;再次,必须假定国家统计局的人口数据系统和卫生部或DSP的数据系统所使用的一些基本概念,如“城市人口”“农村人口”定义完全或大体相同;等等。但事实上,这些假设也并不一定能够成立。譬如,就像费立鹏等人认识到的那样,首先,我们并无什么充分的根据来断定国家统计局报告的死亡率估计值比卫生部和DSP报告的死亡率数据更为准确。其次,在实际情况中,每组人群中各种死因的死亡漏报率是很难完全一样的。而且,更大的困难在于,我们实际上根本无法来判断按照上述方法推算出来的各种死因的死亡漏报率与实际的漏报率到底有多大的差别(因为“实际漏报率”本身就是一个有待探究并将充满争议的未知数)。再次,费立鹏等人也已经发现,至少就他们所考察的这个时间段而言,卫生部和DSP两个死亡登记系统所采用的“城市人口”与“农村人口”的定义与国家统计局的定义有所不同:国家统计局将城市和城镇人口作为城市人口,卫生部和DSP系统则将大、中型城市的“非农业人口”作为城市人口,将县和城镇人口作为“农村人口”。因此,费等人也不得不承认,将卫生部的城市死亡率数据推广至国家统计局报告的城市人口,将卫生部的农村死亡率数据推广至国家统计局报告的城镇和县人口,显然“不是完美无缺的”。
3. 编号3和编号4自杀率数字的“正确性”
按照前面的叙述,我们可以知道,编号3和编号4的自杀率数字若要能够成立,必须以下列假设为前提:
第一,GBD和WHO报告的作者应用来对估算期内的中国人口数据进行调整并估计此一时期内总死亡人数的统计方法——一般增长—平衡方法——具有无可争议的可靠性;
第二,GBD和WHO对DSP数据所做的另一个调整,即将DSP数据中编码为“意外死亡,外部原因不明”和“其他种类的暴力死亡”的许多案例看作自杀案例,这一做法具有无可争议的合理性。
如果以上两个前提存在,那么编号3和编号4的自杀率数字就可以被认为具有无可争议的“正确性”;反之,我们就不能不得出不同的答案。
对于上述第一个假设,费立鹏等人曾经认为有一定合理性。他们认为国家统计局通过在抽样调查中询问每个被调查者在过去一年中该户家庭中死亡人数的方法来获得人口死亡的数据,这种做法可能会有一些问题。因为“这些调查存在回忆偏倚,因此可能会低估总的死亡人数,特别是孩子的死亡”。对此,我们首先可以提出以下质疑:人口死亡(无论是成人的死亡还是孩子的死亡)不是一个普通事件,很难相信一个被调查者对自己家中仅仅“过去一年”中的死亡人数都会有“回忆偏倚”。其次,即使我们同意费立鹏等人的判断(入户调查中的调查对象在回忆前一年家中的死亡人数时会有“偏倚”),但我们也很难确定GBD和WHO报告的作者应用一般增长—平衡方法来对估算期内的中国人口数据所做的调整以及对此时期总死亡人数所做的估计是否一定与“实际”情况相一致(因为“实际情况”本身也是一个有待探究并将永远充满争议的未知数)。
对于上述第二个假设,我们也没有办法来判断是否一定成立还是不成立。GBD的研究人员在以DSP数据为基础估算1990年中国自杀率的过程中,将许多原本被登记为“意外死亡,外部原因不明”和“其他种类的暴力死亡”的死亡案例重新归入自杀案例,必定有其认为适当的判定标准。只有当这个标准能够被(过去、现在、将来的)所有人都接受为合理的标准时,GBD研究人员的做法才可以被认定为具有绝对的或确定的“正确性”;反之则否。虽然由于资料的缺乏,我们无法对此做出详细的讨论,但根据以往的研究经验,我们可以确定,这样一种能够让所有人都接受为“正确”的自杀判定标准是不存在的。因此,即使GBD的研究人员在对死亡案例的属性重新加以判定时严格遵守了判定标准,其结果的“正确性”也只能是在该标准赖以引申出来的话语体系中得到确定。对于受其他不同话语体系引导和约束的研究人员来说,由于可能会形成不同的自杀判定标准,GBD研究人员工作结果的“正确性”就可能会饱受质疑。但反过来,我们也不能斩钉截铁地说GBD研究人员的工作结果绝对缺乏“正确性”(只要GBD研究人员在对死亡案例的属性重新加以判定时严格遵守了判定标准)。因为按照GBD研究人员所属的话语体系,他们所遵守的判定标准可能是完全合理的。
4. 编号5和编号6自杀率数字的“正确性”
编号5的自杀率数字是费立鹏等人判断无论是卫生部统计信息中心的死亡记录,还是中国疾病监测(DSP)系统的死亡记录,都还可能存在着一定的错报现象后,通过采用心理解剖法对伤害死亡案例进行研究的方法来对1995年8月至2000年8月间DSP系统关于中国人群自杀死亡数据进行评估和调整后初步计算出来的。和前面几个数字类似,这一数字的可靠性完全取决于费立鹏等人采用心理解剖法来对从DSP系统中抽调出来的1653个相关死亡案例的死因报告进行评估时,对每个案例死因重新做判断的可靠性。
那么,费立鹏等人在对1653个死亡案例的死因重新加以评估时所做的判断是否“正确”或“可靠”呢?为了回答这个问题,我们需要对费立鹏等人在从事这项工作时所完成的每个案例的死因判断过程本身进行分析。而为了能够进行这种分析,我们又需要获得记录了每个案例死因判断过程的那些文字材料(相关调查问卷、相关访谈记录、参与现场调查的1—3名调查员在完成调查后根据该被试者提供的所有资料对该案例属于自杀的可能性进行判断的讨论记录、未参与现场调查的1—3名负责质量监督的研究者在详细了解每个案例的两种调查资料之后对该案例属于自杀的可能性独立加以评估的分析报告、在上述研究者的判断出现分歧的情况下课题负责人与调查员深入讨论后对这些案例是否属于自杀加以判断的报告等)。然而,遗憾的是,我们目前没有能够搜集到这样一些资料,因此,也无法在这里实际展开这种分析。但是,和刚才我们碰到的情况一样,根据国内外以往的一些研究经验[31],我们同样可以确定,即使我们获得了这些资料,我们也只能对费立鹏等人在对1653个死亡案例的死因重新加以评估时所依据的判断标准(自杀死亡的判断标准、非自杀死亡的判断标准)、推理思路以及这些标准和推理赖以成立的话语系统有一个初步的了解,并以此为基础,对费立鹏等人所做的每项死亡案例评估结果在该话语系统之下的“正确性”进行判断:若严格遵循统一的标准、推理过程严谨、理由充足,就是“正确”的,否则就是不“正确”的。然而,尽管如此,这种合理性也只是一种相对的“正确性”,而非绝对的“正确性”:对于受其他不同话语体系引导和约束的研究人员来说,这些评估结果就可能被认为是不“正确”的。而对于这样一些分歧,我们是没有办法来对它们之间的是非对错做出终极判断的。
编号6的自杀率数字则是费立鹏等人在编号5的基础上,参照全国疾病监测点系统1998年报告的漏报率(22.46%),对编号5数字进行校正后得出的。因此,除了编号5数字的可靠性问题外,编号6数字的可靠性还取决于全国疾病监测点系统1998年所报告之漏报率的可靠性。
5. 编号7和编号8自杀率数字的“正确性”
编号7和编号8的自杀率数字是何兆雄以世界卫生组织公布的有关资料为依据,用两种有所不同的方法推算出来的。因此,这两个自杀率数字的“正确性”首先就取决于世界卫生组织公布的相关资料的“正确性”及何兆雄所用推算方法的“正确性”。而根据前述相关文献提供的信息我们又可以发现,世界卫生组织公布的中国自杀率数字又是以中国疾病监测中心(DSP)的数据加以修订后推算而来。世界卫生组织在以DSP的自杀数据为基础推算中国相关年份自杀率时至少对DSP的数据进行了两个环节的调整:首先,运用一般增长—平衡方法对估算期内中国人口数据进行调整并估计此一时期内总死亡人数;其次,对DSP数据中编码为“意外死亡,外部原因不明”和“其他种类的暴力死亡”的许多案例重新判定为自杀案例。我们前面说过,世界卫生组织在这两个环节上对DSP自杀数据所做调整之结果的可靠性取决于其所用调整方法的可靠性。而我们前面的分析试图表明,对于这种可靠性,我们既没有办法加以保证,也没有办法加以否认。就此而言,对于编号7和编号8自杀率数字的可靠性,我们也只能采取一种将信将疑的态度。[32]