三维实景可视化室内定位导航技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 绪论

1.1 室内定位系统概述

1.1.1 室内定位系统的发展历史

导航与位置服务在信息技术产业中具有举足轻重和不可或缺的地位。近年来,随着智能移动终端和移动互联网的迅速普及,人们对室内/外高精度定位导航的需求日渐增长,特别是智能移动终端、位置服务、大数据分析的深度结合,逐渐改变了人们现有的生活方式和商业模式,并发挥了重要的基础支撑作用。目前,尽管以全球定位系统(Global Positioning System,GPS)、北斗导航卫星系统(BeiDou Navigation Satellite System,BDS)为代表的室外卫星定位导航服务已经成功地商业化运作,但是室内定位导航技术仍处在探索阶段,并未出现大规模商业部署和运营。

最初的室内定位系统可以追溯到20世纪90年代。当时剑桥大学AT&T实验室提出了Active Badge系统,它是一种典型的基于红外线的室内定位系统。由于红外线的视距传输特性的限制,该系统要求物体必须和红外接收机成一条直线,定位精度不高。1998年,微软公司提出了名为RADAR的室内定位技术解决方案,利用无线局域网(Wireless Local Area Network,WLAN)的无线射频信号强度值来进行指纹定位。随着物联网技术的飞速发展和硬件技术的成熟,室内定位技术得到了持续关注。2002年,加利福尼亚大学提出了Calamari定位系统,将到达时间(Time Of Arrival,TOA)与接收信号强度指示(Received Signal Strength Indication,RSSI)两种技术进行融合来实现室内定位。2004年,香港科技大学研发了基于RFID(射频识别)技术的LANDMARC定位系统。该系统通过在区域内放置参考标签,利用射频阅读器采样标签信息来完成无线环境下的数据采集,并最终估算目标点位置。2006年,北京航空航天大学提出了Weyes定位系统,通过利用差值模型对WLAN接收信号强度进行定位前预处理来实现定位。2010年,哈尔滨工业大学提出了HIT-WLAN室内定位系统,利用惯性导航和WiFi信号,进一步提高了WLAN定位精度。2011年,北京邮电大学提出了室内外无缝衔接的TC-OFDM定位系统,也取得了不错的效果。

2013年,苹果公司推出了iBeacon技术,该技术也逐渐成为蓝牙室内定位的业界标准。该技术以蓝牙4.0为基础来获取用户的位置信息,并首先在美国加州科学院和旧金山的韦斯特菲尔德购物中心开启了基于iBeacon的室内定位应用。在国内,很多公司也开发了基于iBeacon的室内定位产品,包括四月兄弟的April Beacon、智石科技的Bright Beacon和ebeoo的Beacon CS公共服务平台。2015年,受益于互联网公司的推动,iBeacon技术应用呈现爆发性增长。腾讯公司利用iBeacon近场感知功能推出了微信“摇一摇”功能,并在此基础上开发了一系列室内定位导航、餐饮行业搭配服务行业等场景化的营销方式。高德公司提出了为大型商场的用户提供商场室内地图绘制、室内定位技术和室内定位导航等服务。阿里巴巴公司的“喵街”软件利用了蓝牙iBeacon技术,为商场里的用户提供室内定位导航和停车场的智能停车等服务。2016年,百度开发者中心提出了百度地图的室内定位技术,并将自身领先的室内定位技术应用于大型商场,结合蓝牙、地磁和WLAN 3种定位技术进行了混合定位。

基于计算机视觉的室内定位是一种较新的室内定位方法,简称视觉室内定位方法。该方法由机器人控制领域的同步定位与地图构建(Simultaneous Localization And Mapping,SLAM)方法发展而来。加利福尼亚大学伯克利分校的Avideh Zakhor研究团队开发的室内定位系统利用设备摄像头拍摄的图片来计算设备持有者的位置和方向,但前提是,需要有类似Google街景图的建筑物内部全景图库。慕尼黑工业大学的NAVVIS研究小组针对室内视觉定位问题,提出了鲁棒性更高、应用场景更普遍的基于视频流的室内定位算法。利用NAVVIS研究小组提出的室内定位算法,用户只要开启摄像头,就可以实现自身的位置确定和目的地路径导航。多伦多大学的Shahrokh Valaee教授研究团队首次提出了利用对极几何的性质进行精确定位的算法。该算法使用定位图像的SURF特征及像素坐标进行定位,在对比加权位置估计时体现了良好的性能。该算法最大的优势是,当图像数据库缺失位置相同的图像时,仍然可以给出定位位置的估计,但其使用的检索算法在某种程度上会影响精确定位的结果。

现阶段,国内关于计算机视觉定位的研究多集中在机器人领域。大疆公司近年来推出了全球首个量产无人机视觉传感导航系统DJI Guidance。该系统将摄像头和超声波传感器相结合,在室内无法接收卫星定位导航信号的情境下完成无人机定位。在距离地面30~300cm的高度上,该系统可以对20m范围内的物体进行感知,与高精度视觉定位系统相结合,可实时检测多个方向的环境信息,即使飞行器在高速实时飞行中也能够对可能发生的碰撞及时避让。目前,该系统已经成功应用于大疆Phantom 3系列四旋翼无人机和Inspire 1系列产品。此外,国内也有很多高校针对室内视觉定位问题进行了相关的研究,包括北京理工大学、浙江大学、哈尔滨工业大学等,其研究成果可被应用于机器人视觉与导航、视觉增强与医用图像处理的相关领域。

1.1.2 主流室内定位技术

从目前技术发展和实际应用情况来看,室内定位技术可以利用不同的技术来实现,包括无线电信号、图像信息、点云、惯导、地磁、声音等。不同的室内定位技术适用于不同的室内环境,各有优缺点。下面对各种室内定位技术进行简单的介绍。

1.超宽带定位技术

超宽带(Ultra Wide Band,UWB)定位技术通过对具有很陡上升和下降时间的冲击脉冲进行直接调制,使信号具有吉赫兹(GHz)量级的带宽。超宽带信号具有多径分辨能力强、定位精度可达厘米级的优点。但是,利用超宽带信号进行定位的缺点也是显而易见的。超宽带定位技术往往适用于视距环境,难以实现大范围室内覆盖,对于非视距环境的定位精度往往难以满足要求。普通手机不支持超宽带,定位成本非常高。

超宽带定位技术的基础是测距,测距的基本原理是利用飞行时间(Time Of Flight,TOF)方法。该测距方法属于双向测距技术,主要利用信号在两个异步收发机之间的飞行时间来测量节点之间的距离。常用的测距方法有到达时间(Time Of Arrival,TOA)方法、到达时间差(Time Difference Of Arrival,TDOA)方法等。TOA方法首先测量一个超宽带定位终端和多个超宽带定位基站之间的传播时间,然后将该时间转换为传播距离,最后利用三边法给出终端的位置。该方法要求超宽带定位基站与超宽带定位终端之间必须保持直线和可视,发送设备和接收设备必须始终同步。TDOA方法基本与TOA方法相同,但它不需要超宽带定位基站与超宽带定位终端之间同步,这使TDOA方法的定位比TOA方法的定位更容易实现,因此,TDOA方法的应用非常广泛。

2.WLAN定位技术

1997年,电气电子工程师学会(Institute of Electrical and Electronics Engineers,IEEE)为WLAN制定了第一个版本标准IEEE 802.11。该标准规定,物理层工作在2.4GHz频段上,可采用红外线、直接扩频方式和跳频扩频方式3种物理介质。数据链路层采用载波监听多路访问/冲突检测(Carrier Sense Multiple Access/Collision Avoid,CSMA/CA)机制。随着WLAN定位技术的发展,工业界众多领先公司组成了WiFi联盟,致力于解决符合标准的产品生产和设备兼容性问题。WiFi自20世纪90年代被发明后,经过不断更新和推广,目前已广泛用于城市公共接入热点、家庭和办公网络,全面渗透人们的日常生活和出行。由于WiFi的快速普及,WLAN定位变得非常有前景。

WLAN定位可以采用三角定位方法和指纹定位方法等实现米级的定位精度。三角定位方法测量移动终端和3个无线网络接入点的无线信号强度,通过差分算法对终端进行定位,也可以采用近邻法判断,即移动终端最靠近哪个信号源,就认为移动终端处在什么位置。指纹定位方法稍微复杂,分为离线和在线两个阶段。离线阶段需要大量采集已知位置的信号强度并形成指纹数据库,这样移动终端可以将在线阶段采集的信号与指纹数据库进行匹配,从而估计其位置。该方法不需要额外铺设专门的定位设备,用户在使用智能手机时开启WiFi就可实现定位,因此,该方法具有扩展方便、成本低的优势。但是,离线阶段需要大量的人员进行采集工作,WiFi受周围环境的影响较大,指纹数据库也需要定期进行维护,因此,离线阶段的工作量巨大。

3.蓝牙定位技术

蓝牙定位基于RSSI定位原理,根据定位终端的不同,蓝牙定位方式分为网络侧定位和终端侧定位。

网络侧定位系统由终端、蓝牙信标节点、蓝牙网关、WLAN和后端数据服务器构成,其具体定位过程大体如下:首先,在待定位区域内铺设蓝牙信标节点和蓝牙网关,这样,当终端进入信标信号覆盖范围时,终端就能感应到信标的广播信号;其次,终端或蓝牙信标节点测算出在某信标下的终端的RSSI值,并通过蓝牙网关传送至后端数据服务器;最后,通过后端数据服务器内置的定位算法测算出终端的具体位置。网络侧定位主要用于人员跟踪定位、资产定位和客流分析等情况。

终端侧定位系统由蓝牙终端设备和蓝牙信标节点组成。其定位原理与网络侧定位大同小异。首先,需要在待定位区域内铺设蓝牙信标节点,蓝牙信标节点不断地向周围广播信号和数据包;其次,当蓝牙终端设备进入信标信号覆盖的范围时,测出其在不同基站下的RSSI值;最后,通过蓝牙终端设备内置的定位算法测算出具体位置。终端侧定位一般用于室内定位导航、精准位置营销等用户终端。

蓝牙定位的优点在于实现简单,定位精度和蓝牙信标节点的铺设密度与发射功率有着密切关系,且功耗低,可通过深度睡眠、免连接等方式达到省电的目的。其缺点是需要额外部署大量蓝牙信标节点,而这些节点往往不属于室内常规基础电信设施。

4.惯性导航技术

惯性导航技术是一种纯终端侧的定位导航技术,主要利用移动终端所使用的惯性测量单元(Inertial Measurement Unit,IMU)传感器采集运动数据,如利用加速度传感器、陀螺仪等测量物体的速度、方向、加速度等信息,基于步行者航位推测(Pedestrian Dead Reckoning,PDR)法经过各种运算得到移动终端的位置信息。然而,随着运动时间的增加,惯性导航定位的误差会不断累积,需要外界更高精度的数据源对其进行校准。因此,在室内定位导航中,惯性导航技术一般会和其他室内定位技术结合,每过一段时间与其他室内定位技术获取的位置进行比对,以此对产生的误差进行修正。

惯性导航技术的经典算法——PDR算法主要通过对步行者行走的步数、步长、方向进行测量和统计,并推算步行者的行走轨迹和位置等信息。该算法主要在定位信号源环境下使用IMU感知步行者在行进过程中的加速度、角速度、磁力和压力等数据,并利用这些数据对步行者进行步长与方向的推算,从而达到对步行者进行定位跟踪的目的,其中主要涉及的过程有步态检测、步长和方向计算。

5.超声波定位技术

超声波定位大多采用反射式测距法来实现。超声波定位系统由一个主测距器和若干个电子标签组成。主测距器可放置在移动物体上,各个电子标签放置在室内空间的固定位置。在定位时,由上位机发送同频率的信号给各个电子标签,电子标签接收到信号后反射传输给主测距器,从而可以确定各个电子标签到主测距器的距离,并得到定位坐标。目前,比较流行的基于超声波的室内定位技术有两种:一种是将超声波与射频技术相结合进行定位的技术;另一种是多超声波定位技术。对于将超声波与射频技术相结合进行定位,由于射频信号传输速率接近光速,因此可以利用射频信号先激活电子标签,然后使其接收超声波信号,利用TDOA方法测距。这种技术成本低、功耗小、精度高。对于多超声波定位技术,可在移动物体上的4个方向安装4个超声波传感器,将待定位区域分区,并由超声波传感器测距形成坐标。超声波定位技术的优点是精度可达厘米级,定位精度比较高;缺点是超声波在传输过程中衰减明显,从而影响其定位的有效范围。

6.地磁室内定位技术

地球本身是一个巨大的磁体,在地理南、北极之间形成一个基本的磁场。但这种磁场会受到金属物质的干扰,尤其在穿过钢筋混凝土结构的建筑物时,原有磁场被建筑物内金属物质干扰而发生扭曲,使建筑物内形成一个独特的有规律的室内磁场。当建筑物内金属物质不发生结构性变化时,室内磁场也固定不变。地磁室内定位技术通过采集这种室内磁场的规律特征,利用地磁传感器收集室内磁场数据,辨认室内环境中不同位置的磁场信号强度差异,从而确认空间的相对位置。理论上,不同位置的磁场强度的差异非常微小,普通工具无法探测。但这种被建筑物内金属物质改变后的室内磁场,恰恰增大了磁场差异性,使获取室内磁场数据变得更有意义,间接地提高了定位的精度。因此,终端设备在获取其区域内的磁场特征后,将匹配地磁定位系统中的磁场数据库,完成较为精确的定位。

7.SLAM技术

SLAM技术通常是指在机器人或其他载体上通过对各种传感器数据进行采集和计算,生成对其自身位置姿态的定位和场景地图信息的系统。SLAM技术对机器人或其他智能体的行动和交互能力至关重要,因为它代表了这种能力的基础,使机器人或其他智能体知道自己在哪里、周围环境如何,进而知道下一步该如何自主行动。SLAM技术在自动驾驶、服务型机器人、无人机、增强现实、虚拟现实等领域有着广泛的应用,大部分拥有一定行动能力的智能体都拥有某种形式的SLAM系统。

SLAM技术可根据所使用的传感器的不同分为两类:基于激光雷达的SLAM(激光SLAM)和基于视觉的SLAM(Visual SLAM或VSLAM)。激光SLAM的工作原理与雷达非常相似,以激光作为信号源,激光器发射出的脉冲激光照射到周围障碍物上引起散射,一部分光波会反射到激光雷达的接收器上,根据激光测距原理计算从激光雷达到目标点的距离。脉冲激光通过不断扫描目标物体得到目标物体上全部目标点的数据,用此数据进行成像处理,得到精确的三维立体图像。激光雷达采集的物体信息呈现一系列分散的、具有准确角度和距离信息的点,将其称为点云。通常,激光SLAM系统通过对不同时刻两片点云的匹配与对比,计算激光雷达相对运动的距离和姿态的改变,即完成对承载激光雷达载体自身的定位。VSLAM系统则以照相机拍摄的图片作为系统的输入。该系统首先提取照相机所拍摄的一系列图片中的图像特征,包括全局特征和局部特征。为了降低系统的复杂度并提高效率,一般需要对可以提取特征的图片进行筛选,以事先设定的时间或空间阈值作为间隔,在每个间隔范围内挑选最能代表周围环境的一幅图像,即关键帧图像。然后在关键帧图像的基础上,根据相邻两张图片的视差求取距离,或者直接利用深度照相机获取距离,并利用相邻两张图片中配对好的特征点,求解照相机的距离和姿态变化,即机器人的距离和姿态变化。最后加入一系列的优化措施,即可从一系列图片中恢复机器人的运动情况,完成机器人的自身定位。

8.视觉定位技术

视觉定位技术也分为离线和在线两个阶段。离线阶段需要建立室内图像数据库,在线阶段需要先利用移动终端的照相机获取物体图像,然后通过计算机进行图像处理,并利用计算机视觉技术获得移动终端的位置。在视觉定位过程中,所需的基本数学原理包括本质矩阵、基本矩阵和对极几何。本质矩阵包含物理空间中两台照相机之间的旋转和平移信息。旋转和平移信息描述了一台照相机相对于另一台照相机在全局坐标系下的相对位置关系。本质矩阵是单几何意义上的,它将一台照相机观测到的点的物理坐标和另一台照相机观测到的相同点的物理坐标关联起来。基本矩阵除了包含本质矩阵的信息,即外参数,还包含两台照相机的内参数。由于基本矩阵包含这些内参数,因此它可以在像素坐标系下将两台照相机关联起来。基本矩阵将一台照相机的图像平面上的点在图像坐标系(像素)上的坐标和另一台照相机的图像平面上的点关联起来。对极几何是两幅图像之间内在的射影几何,它独立于物体结构,只依赖照相机的内参数和相对姿态。本质上,两幅图像之间的对极几何是图像平面与以基线(连接两台照相机中心的直线)为轴的平面束的交集形成的几何。