统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
上QQ阅读APP看书,第一时间看更新

10.2.1 示例

数据集合A包括10个个体和3个变量,见表10.1。二值变量是RESPONSE(Y),INCOME的单位是千美元(X1),AGE的单位是年(X2)。我用数据集合A对INCOME和AGE的回应做一个逻辑斯谛回归分析。

表10.1 数据集合A

表10.2是标准的LRM结果,其中包括逻辑斯谛回归系数和其他信息“列”(这些内容超出了本章范围)。“参数估计值”这一栏是变量INCOME、AGE的系数和截距值。截距是一个数学概念,记作X0,通常等于1(即截距=X0=1)。系数b0作为“初始”值赋值给所有个体,不管模型里的预测变量的值是多大。

表10.2 LRM结果

LRM的估计值见公式10.3:

记住,LRM预测的是RESPONSE的logit值,不是RESPONSE的概率。