试验设计与数据处理
上QQ阅读APP看书,第一时间看更新

2.2.2 试验数据的位置特征参数

试验数据的位置特征参数是表示试验数据的集中性指标。在处理实验结果时,常用的试验数据的位置特征参数有以下几种:

1.算术平均值

算术平均值是常用的一种平均值。设x1,x2,…,xn代表各次测定值,n代表测定次数,则算术平均值

算术平均值的一个重要性质,就是若测定值的分布服从正态分布,则算术平均值即为一组等精度测量中的最佳值,或称为最可信赖值。

算术平均值的Excel函数为AVERAGE()。

功能:返回参数平均值(算术平均)。

语法:

AVERAGE(number1,number2,…)

其中,number1,number2,…要计算平均值的1~30个参数。

说明:参数可以是数字,或者是涉及数字的名称、数组或引用。如果数组或单元格引用参数中有文字、逻辑值或空单元格,则忽略其值。但是,如果单元格包含零值则计算在内。

提示:对单元格中的数值求平均值时,应牢记空单元格与含零值单元格的区别,尤其在“选项”对话框中的“视图”选项卡中已经清除了“零值”复选框的条件下,空单元格不计算在内,但计算零值。若要查看“选项”对话框,可选择“工具”→“选项”命令。

示例:如果A1∶A5的数值分别为10、7、9、27和2,那么,AVERAGE(A1∶A5)等于11。

2.加权算术平均值

设x1,x2,…,xn代表各次测定值,ω1,ω2,…,ωn代表各次测定值对应的权,则加权算术平均值(或简称加权平均值)为

加权平均值中的权应该酌情而定,例如,在不等精度的测量中,认为某一精度的测定值较好即可给予较大的权值,加重它在平均值中的分量。

我们也可以将权理解为测定值xi在很大的测量总数N中出现的频率ni/N,若代之以概率pi来表示,则式(2-2)可改写为

计算式(2-3)的加权平均值需用到函数SUM()。

功能:返回某一单元格区域中所有数字之和。

语法:

SUM(number1,number2,…)

其中,number1,number2,…为1~30个需要求和的参数。

直接输入到参数表中的数字、逻辑值及数字的文本表达式将被计算。

如果参数为数组或引用,只有其中的数字将被计算。数组或引用中的空白单元格、逻辑值、文本或错误值将被忽略。

如果参数为错误值或为不能转换成数字的文本,将会导致错误。

示例:SUM(3,2)等于5。

如果单元格A2∶E2包含5、15、30、40和50,则SUM(A2∶C2)等于50。

计算式(2-3)的加权平均值的Excel公式为:

{=SUM(P单元格区域*X单元格区域)}

其中,P单元格区域、X单元格区域的形状要求相同,即含有单元格的个数相等且同为行或列。用“{}”括起来表示为数组公式,当输入完“{}”内的公式(不包括“{}”)后按【Ctrl+Shift+Enter】组合键确定。“{}”是自动显示的。

如果A1∶A4的数值分别为0.3、0.2、0.1、0.4和B1∶B4的数值分别为8、6、9、4,操作C1∶=SUM(A1∶A4*B1∶B4),按【Ctrl+Shift+Enter】组合键确定后,显示结果【按式(2-3)计算的】为6.1,而单元格C1显示的公式为{=SUM(A1∶A4*B1∶B4)}。

3.对数平均值

在化学反应、热量传递及质量传递中,其分布曲线多具有对数的特性。在这种情况下,表征平均值的量就应该用对数平均值。

设两个量x1、x2,其对数平均值是这两个量的差与它们的自然对数的差之比,即

变量的对数平均值总小于算术平均值,如果变量间相差甚小,可用算术平均值代替对数平均值,而并无多大误差。x1与x2间之差越小,其误差也越小。对于这一点,可做如下证明:

当x1与x2相差很小时,α≪1,此时可采用近似公式

ln(1+α)=α,ln(1-α)=-α

由对数平均值的定义式及上面几个公式

即在所讨论的条件下,对数平均值近似地等于算术平均值。通常,若比值(x1/x2)<2,则可以用算术平均值来代替对数平均值,引起的误差不超过4%。

用Excel计算对数平均值要用到函数LN()。

功能:函数LN()返回一个数的自然对数。自然对数以常数项e(2.71828182845904)为底。

语法:

LN(number)

其中,number是用于计算其自然对数的正实数。

说明:LN()函数是EXP()函数的反函数。

4.几何平均值

几何平均值是将n个测定值相乘后再开n次方所得的值。即

或以对数形式表示

计算几何平均值的Excel函数是GEOMEAN()。

功能:返回正数数组或数据区域的几何平均值。

语法:

GEOMEAN(number1,number2,…)

其中,number1,number2,…为需要计算其平均值的1~30个参数。除了使用逗号分隔参数的形式,还可使用数组或对数组的引用。

说明:参数可以是数字,或者是涉及数字的名称、数组或引用。如果数组或引用参数里包含文本、逻辑值或空白单元格,这些值将被忽略;但包含零值的单元格将计算在内。如果任何数据点小于0,函数GEOMEAN()返回错误值“#NUM!”。

示例:GEOMEAN(4,5,8,7,11,4,3)等于5.476987。

5.均方根平均值

均方根平均值简称均方根值,在统计学中被广泛应用。其定义式为

计算均方根平均值的Excel公式为SQRT(SUMSQ()/COUNT())。

①函数SUMSQ()返回所有参数的平方和。

语法:

SUMSQ(number1,number2,…)

其中,number1,number2,…为1~30个需要求平方和的参数,也可以使用数组或对数组的引用来代替以逗号分隔的参数。

②函数SQRT()返回正平方根。

语法:

SQRT(number)

其中,number为需要求平方根的数字,如果该数字为负,则函数SQRT()返回错误值“#NUM!”。

③函数COUNT()返回参数的个数。利用函数COUNT()可以计算数组或单元格区域中数字项的个数。

语法:

COUNT(value1,value2,…)

其中,value1,value2,…是包含或引用各种类型数据的参数(1~30个),但只有数字类型的数据才被计数。

计算均方根平均值示例:如果A2:A5单元格的数值是3、4、3、4、5,则在C2单元格填入公式:=SQRT(SUMSQ(A2:A5)/COUNT(A2:A5)),显示结果为3.87。

6.中位数

中位数是在一组数据中居于中间的数,换句话说,在这组数据中,有一半的数据比它大,有一半的数据比它小。

计算中位数的Excel函数为MEDIAN()。

功能:返回给定数值集合的中位数。

语法:

MEDIAN(number1,number2,…)

其中,number1,number2,…是需要找出中位数的1~30个数字参数。

参数必须是数字、名称、数组或包含数字的引用。Excel会检查每一数组变量或引用中的所有数字。如果数组或引用参数中包含有文字、逻辑值或空白单元格,则忽略这些值,但是其值为零的单元格会计算在内。

说明:如果参数集合中包含有偶数个数字,函数MEDIAN()将返回位于中间的两个数的平均值。

示例:MEDIAN(1,2,3,4,5)等于3;MEDIAN(1,2,3,4,5,6)等于3.5,即3与4的平均值。

7.众数

在某一数据集中出现频率最多的数值称为众数。

计算众数的Excel函数为MODE()。

功能:返回一数据集中的众数。同MEDIAN()一样,MODE()也是一个位置测量函数。

语法:

MODE(number1,number2,…)

其中,number1,number2,…是用于众数计算的1~30个参数,也可以使用单一数组(即对数组区域的引用)来代替由逗号分隔的参数。

说明:

①参数可以是数字,或者是涉及数字的名称、数组或引用。

②如果数组或引用中包括文字串、逻辑值或空白单元格,这些值将被忽略。

③如果数据集合中不含有重复的数据,则MODE()函数返回错误值#N/A。

在一组数值中,众数是出现频率最高的数值,而中位数是位于中间的值,平均数是平均后的值,这些函数都不能单独地完全描绘所有数据。例如,假设数据分布在3个区域中,其中一半分布在一个较小数值区中,另外一半分布在两个较大数值区中。函数AVERAGE()和函数MEDIAN()可能会返回位于数据点稀疏处的中间值;而函数MODE()则会返回位于数据点密集处的较小值。

示例:MODE({5,6,4,4,3,2,4})等于4;MODE({5,5,4,4,5,2,4})等于4。

以上介绍的几种试验数据的位置特征参数都是从一组测定数据中找出最接近真值的那个值,选择哪一个,主要决定于实验数据的分布类型。例如,当实验数据服从正态分布(参见2.6节)或近似服从正态分布时,应采用算术平均值;当实验数据服从对数正态分布时应采用几何平均值。本书所讨论的实验数据均假定服从正态分布或近似服从正态分布,故后面所讨论的平均值均指算术平均值。