1.3 研究方法与技术路线
1.3.1 研究方法
本书力求在吸收国内外相关研究成果的基础上,采用理论与实证研究相结合的方法,对人口普查格网数据的理论、方法和应用进行综合性、多学科研究,以创新人口空间化模型,拓展对人口普查数据开发与应用的视野和深度。本书采用的研究方法主要有以下5种:
1.理论与文献研究
准确理解人口分布规律与机理是开展人口空间化研究的前提,对提升人口空间化精度意义重大。本书对研究所需要的人口空间分布规律和机理,以及人口空间化和人工人口合成建模指标、建模方法等相关内容进行了系统梳理与总结,从理论与文献方面为本书的研究奠定了基础。
2.空间统计与地统计分析方法
人口分布的关键特征是具有空间性,空间数据所特有的关联性和集聚性,使得传统描述性统计分析方法同质独立的假设前提不再成立。因此,为深入挖掘人口分布的空间特征,本书采用空间统计分析方法中的全局与局部空间自相关,以及地统计分析方法中的人口重心、误差椭圆、结构指数等,对人口空间分布的理论进行实证检验。
3.空间计量模型
在构建人口空间化模型时,人们常采用多元线性回归模型,假设样本同质独立且仅考虑自变量与因变量之间的线性相关关系,但忽略了空间数据所特有的相关性和异质性特征,且生成的人口空间化数据集普遍存在城市人口低估和乡村人口高估的问题。因此,本书采用空间计量模型中的空间变系数模型GWR、GTWR和MGWR,对超大城市进行人口空间化建模与对比分析,以提升人口空间化的模拟精度。
4.机器学习模型
本书基于人口统计数据、土地利用类型、夜间灯光数据和多类POI等多源数据,采用机器学习中的随机森林模型、XGBoost模型及其与OLS、MGWR模型的堆叠集成学习模型,对超大城市进行人口空间化建模与对比分析,以探索机器学习模型在人口空间化中的应用与生成效果。
5.人工人口合成方法
在当前的人口空间化研究中,受限于属性信息的复杂性,现有对人口属性空间化的研究较少,本书采用微观模拟人工人口合成的方法,对人口属性空间化进行探索。当前,人工人口合成方法主要有合成重构法和组合优化法,前者为确定性方法,后者为随机性方法,两种方法与基础数据密切相关,各有优缺点。因此,本书分别采用合成重构法中的迭代比例拟合和迭代比例更新方法,以及组合优化法中的改进遗传算法,探索不同人口微观数据源下人工人口合成的过程与精度等。