人口普查格网数据理论及应用研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.2 研究内容

本书以“人口普查格网数据”为研究对象,对其理论、方法和应用展开系统研究,主要包括三个方面:人口空间分布规律与机理研究、人口空间化模型的创新研究、人口普查格网数据在人口与社会地理学中的典型应用研究。

1.人口空间分布规律与机理研究

人口空间分布规律与机理,是人口空间化模型构建及指示因子选择的理论基础,也是其成果评价的重要标准。在构建人口空间化模型之前,我们必须对其支撑理论进行系统分析,当前的人口空间化结果基本能够刻画乡村人口分布特征,而对城市人口分布特征的刻画较为粗糙,需要进一步深入研究柏中强,王卷乐,杨飞.人口数据空间化研究综述[J].地理科学进展,2013,32(11):1692-1702.

因此,本书第一部分将系统梳理人口空间分布的研究文献,总结城市人口的空间分布特征,以及自然、人文、社会、经济等因素与人口之间的关系与作用机理。同时,从实证视角,基于街镇尺度人口数据,采用空间统计分析方法、地理探测器和空间计量模型,以我国典型的超大城市——成都为研究对象,对城市人口空间分布的时空特征及影响因素进行实证研究。该研究的目的是从理论与实践两方面,探讨人口分布与多源数据之间的相关关系,验证多源数据作为区域人口空间化辅助数据的合理性,为第二部分人口空间化模型的创新奠定理论和实证基础。

2.人口空间化模型的创新研究

基于人口空间化理论和统计学发展前沿,本书将从以下途径对人口空间化模型进行创新研究:

(1)基于空间计量模型的人口空间化模型研究

人口空间分布具有显著的空间特征,现有研究主要采用经典统计学方法分析人口与空间分布指示因子之间的关系,忽略了人口分布的空间特征——空间异质性和空间相关性。因此,本书以文献综述和第一部分的理论研究为指导,以土地利用类型、夜间灯光和POI等多源数据为基础,引入以城市人口空间分布的时空异质性和相关性刻画与测度的空间变系数模型——地理加权回归(geographically weighted regression, GWR)模型、时空地理加权回归(geographically and temporally weighted regression, GTWR)模型和多尺度地理加权回归(mulitscale geographically weighted regression,mGWR)模型,来构建人口空间化模型,以提高人口空间化精度,并以成都市城区为例,生成2000年、2010年、2020年的100m×100m、500m×500m和1km×1km成都市人口格网数据集。

(2)人口空间化数据的时空分辨率提升方法研究

传统的人口空间化结果多集中在静态年度上的区域或百米以上网格等尺度,缺少对较为精细的时空尺度的认识和理解,而高时空分辨率的人口数据应用价值更大董南,杨小唤,蔡红艳.人口数据空间化研究进展[J].地球信息科学学报,2016,18(10):1295-1304. 柏中强,王卷乐,姜浩,等.基于多源信息的人口分布格网化方法研究[J].地球信息科学学报,2015,17(6):653-660.。随着2015年我国第一次地理国情普查工作的完成,以及基于位置服务(location based services,LBS)技术的快速发展,城市建筑数据的可获得性进一步增加,是有效的高分辨率人口空间化数据源董南,杨小唤,蔡红艳.基于居住空间属性的人口数据空间化方法研究[J].地理科学进展,2016,35(11):1317-1328.。同时,收集人口分布数据,最简单精确的方法是直接采集每个人的地理位置,然后计算格网内的人口数量刘瑜.社会感知视角下的若干人文地理学基本问题再思考[J].地理学报,2016,71(4):564-575.。而现在,这一想法变得可行,社交媒体数据具有样本量大、覆盖面广、时空分辨率高等特征,使得人的空间分布、行为,以及城市场所等信息在空间上反映成为现实,且不存在尺度效应秦萧,甄峰,熊丽芳,等.大数据时代城市时空间行为研究方法[J].地理科学进展,2013,32(9):1352-1361. 徐仲之,曲迎春,孙黎,等.基于手机数据的城市人口分布感知[J].电子科技大学学报,2017,46(1):1-7.。因此,本书以城市建筑物轮廓与楼层数据、住宅小区AOI数据、微信定位数据三类细粒度地理大数据,作为精细人口分布的基本单元,对提升人口空间化数据的时空分辨率的方法进行研究,旨在实现城市人口在建筑物尺度上的高时空分布模拟。

(3)基于机器学习的人口空间化模型研究

在构建人口空间化模型时,相关研究认为,与多元线性回归、地理加权回归相比,机器学习模型为数据所驱动,没有固定的模型,结构灵活,能拟合因变量与自变量之间的非线性关系,不用考虑多元变量的共线性、过拟合等问题。因此,本书基于人口统计数据、土地利用类型、夜间灯光和各类POI数据,采用机器学习中的随机森林模型、XGBoost模型及其与OLS、MGWR模型的堆叠集成学习模型进行人口空间化的实证研究。

(4)人口属性空间化模型研究

我国人口普查个体样本数据是不面向公众开放的,可获取的仅为统计层面的数据,当前的人口空间化主要针对人口数量(人口密度)的空间分布,并不涉及人口样本社会经济属性的空间化,这部分研究成果较少,既包含人口空间分布,又包括属性信息的格网数据更有价值。基于国家统计局陆续公布的全国人口普查数据和全国1%人口抽样调查微观数据,本书拟借鉴人工人口合成方法,采用合成重构法中的迭代比例拟合和迭代比例更新,以及组合优化法中的改进遗传算法,分别进行人工人口的生成研究,以探索各种合成方法的适用范围与特点,并在此基础上进行人口属性空间化及应用研究。

3.人口普查格网数据在人口与社会地理学中的典型应用研究

(1)成都市人口分布与收缩格局时空特征分析

本书对2000年、2010年、2020年成都市100m×100m、500m×500m和1km×1km人口密度及其变化率进行了空间统计分析,以研究成都市人口分布的时空动态变化过程、城市化阶段及不同区域的时空特征;同时,采用成都街镇人口普查数据进行比较分析,以对人口格网数据的应用效果进行验证。

(2)成都市社会空间分异研究

社会地图是指基于历史或当下的社会数据,通过空间可视化方法,对社会要素的空间特征、社会空间结构等进行解析,在社会空间研究中有着独特作用,是分析复杂社会空间的有力工具。人口数据是社会地图的核心变量,本书基于多尺度格网和行政区划人口数据,采用隔离指数中的匀度、能见度、浓度、聚类度四个维度下的双组指数,对成都市进行了社会空间分异研究,以探索人口格网数据在社会学研究中的应用。

(3)基于人工人口数据的传染性传播仿真实证研究

本书以高精度的人工人口数据为基础,建立了多智能体疫情传播仿真模型,刻画了疫情在城市中的动态传播情况,并对采取的防控措施的有效性进行研究。同时,根据研究结论提出了相应的对策建议,以期为疫情防控提供高精度基础人口数据集和仿真研究方法。