在人手一部智能手机的时代,出门用手机导航已非常普遍。但在这种平常之后,则是一整套复杂技术方案的支撑。尤其是定位技术,更是地图导航底层的重要基础,直接决定了产品的使用体验。“让定位更精准”,也成为了全球各大相关机构和企业竞相角逐的“技术奥林匹克”。
近日,在西班牙刚闭幕的室内定位与导航领域国际会议IPIN2021上,武汉大学与高德地图联合团队以大幅领先的优势,斩获了“基于智能手机的室内定位”赛道冠军。
这也是联合团队连续第二年在该大赛中获得冠军——去年的IPIN2020上,武汉大学与高德地图共同摘下的则是“车载环境下的手机定位”组别冠军。
一场更贴近实际场景,同时更具挑战的全球技术角逐
国际室内定位导航大会IPIN(Indoor Positioning and Indoor Navigation)始创于2010年,是目前室内定位领域全球最大的国际学术会议,在谷歌学术排名中属于“顶尖级别定位与导航会议”。同期举办的比赛则是全球室内定位领域顶级赛事之一。
IPIN2021 共有3个赛道,其中武汉大学与高德地图联队拿下了“基于智能手机的室内定位”赛道的冠军。该赛道自2015年便已设立,迄今已有数十个国家的知名高校和公司参赛,是设立时间最长、参与团队最多的赛道。
该赛道旨在利用智能手机的内置传感器,在不额外加装定位设施的情况下,实现室内场所的行人定位。与其他专业的室内定位方案相比,该赛题更贴近目前用户的实际应用场景(例如室内手机导航),在技术方案的选型上更具灵活性,但难度也因低性能的传感器和复杂的实际场景被放大。
据了解,本次比赛首次采用模拟实时定位的方式——参赛团队被要求使用官方提供的API 实时获取数据和上传定位结果。其中,比赛数据由组织方在西班牙一所多层建筑内采集手机内置传感器信号,包括:GNSS(全球导航卫星系统)、惯性传感器、磁力计、Wifi、蓝牙、气压计、光照强度等。
比赛过程中,由不同的测试员携带智能手机,模拟日常手机使用的各种行为,如上下楼梯、坐下、接打电话、屏幕输入等,完成数据采集。用于算法训练的手机共有5款,最后随机挑选一款手机的传感器数据用于评测定位方案的精度。
穿越“噪音”,实现最优定位效果
如何在充满“噪音”的信号组合中找到最佳融合方法,是本次赛事的最大挑战。
由于赛事限于室内环境,手机上唯一专用于定位的传感器——GNSS 无法正常使用,布设定位装置也不被允许,这就使一些专业的高精度定位方案(例如UWB、蓝牙AOA 等)被排除在外;联合团队唯有充分发掘手机内置传感器的定位能力,并利用建筑内自然条件下的信号特性进行定位。
此外,由于赛事任务在多层建筑内进行,定位过程不仅要确定平面位置,还要识别具体楼层。而过程中测试员使用手机的方式是未知的,这使手机传感器——尤其是惯性传感器的信号特性更加复杂,从而进一步增大了定位难度。
针对赛题任务,联合团队进行了深入分析研究。最终确定了解题关键:设计一套融合框架,将手机传感器能力充分利用,取长补短,从而实现最优定位效果。
其中,为了解决手机使用方式的多样性问题,联合团队开发了一套基于机器学习和行人航位推算算法,实现准确的相对位置推算;再结合磁场、蓝牙和Wifi 等多个信号源的匹配定位控制位置误差,最终用一个滤波器对各模块输出进行融合,从而实现精准的高频率实时定位输出。
而正是凭借该框架,武汉大学和高德地图联合团队将传统的网络定位、惯性定位与先进的地磁定位等技术充分融合,在本次大赛中以大幅优势成为了“基于智能手机的室内定位”赛道的全球冠军,进一步证明了联合团队在室内定位领域领先的技术水平。
在未来,这将为用户某些日常、但当前导航产品还无法完全覆盖的室内出行场景,如停车场找车、打车找上车点、商铺导航等,提供技术支撑。
据悉,高德在手机定位领域有长期且深厚的技术积累,不仅服务于高德地图APP用户,同时也为众多合作伙伴的移动应用提供定位技术支持:
在卫星定位方面,通过结合专业的几何计算与大数据挖掘能力,实现手机GNSS定位的抗干扰、防欺诈,保证用户在室外定位的准确性;在网络定位方面,通过充分挖掘基站、Wifi等无线信号提供的信息,建立机器学习模型,并通过精细的工程优化实现毫秒级的定位服务;在惯性定位方面,面向驾车和步行用户分别设计的VDR、PDR模型,保证了高楼、高架桥等复杂场景的定位稳定性;此外,高德地图在视觉定位、地磁定位等前瞻领域也展开了积极的探索。
未来,高德地图还将继续与各界合作伙伴通力合作,在定位技术上继续探索,为用户带来更加精准、便捷的出行体验。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。