首页>特约作者>追踪技术哪家强?深入浅出讲解6DoF四种流行方案

追踪技术哪家强?深入浅出讲解6DoF四种流行方案

2019-04-24 18:33:01 来源:87870作者:Rokid
阅读 2399 评论 0

好的增强现实体验首先要是一种互动体验,实现现实环境和虚拟世界的结合,而这种体验离不开6 DOF追踪(Six degrees of freedom tracking)的加入。

6DoF追踪为用户提供了前所未有的互动体验和对虚拟世界的控制,可以说,6DoF追踪是虚拟世界与现实世界建立联系的基础,是AR实现颠覆式体验的前提。近年来,随着技术的指数级的增长,这种新型的AR互动体验正在以超出我们想象的态势发展。

AR领域六自由度(6DoF)追踪的应用,最早可以追溯到2003年, 由ARToolKit所支持的首个移动端AR应用就出现在了WinCE平台上,但早期运体验并没有那么优秀。

早期的AR利用标识图来跟踪摄像机的位置和姿态,实现6DoF追踪。使用者必须将标识图保留在视野范围内,虚拟内容也只能覆盖在标识图上,使用者稍微移动便会失去对标识物的追踪,虚拟内容便无法对现实进行覆盖,虚拟与现实的融合停留在比较浅层的阶段,无法给予使用者沉浸式的体验。

AR,增强现实,ar技术

3DoF与6DoF技术对比图

随着SLAM (simultaneous localization and mapping)技术的普遍应用,6DoF追踪与SLAM相结合,沉浸式的AR体验时代终于来临了。使用者可以摆脱标识图的束缚,进行实时定位与地图构建,从而在虚拟内容上产生更加沉浸和逼真的体验。

AR,增强现实,ar技术

微软Holoens设备的SLAM功能演示

早期的AR眼镜,为了在任意场景下都能提供最为精确和可靠的追踪体验,需要装备由多个鱼眼摄像头、深度摄像头和其他传感器驱动的高性能追踪系统。不过这会让设备变得沉重且昂贵。即便是功能最为丰富且拥用商用前景的AR眼镜,也会因为其高昂的成本和糟糕的佩戴体验而遭到市场拒绝。

AR,增强现实,ar技术

2016年面世的Meta 2 AR眼镜

因此,想在轻量级AR设备领域取得成功,产品需要结合舒适性、经济性和技术可行性来进行研发。包括Rokid在内的很多AR眼镜研发公司,正在尝试通过有限的视觉设备和更少的算力来实现6DoF追踪。

在AR眼镜上实现6DoF追踪,这4种流行方案到底谁更好?

让我们从成本和性能出发,比较以下四种流行的6DoF追踪解决方案:

1、单摄像头

● 硬件成本低

● 易于集成到多种眼镜设计中

● 需要更专业的优化和定制

● 适用于偏静态场景

AR,增强现实,ar技术

单摄像头

视频摄像头是AR眼镜的常用组件,主要用于拍摄高分辨率的照片和视频。在外观和可用性方面,将单个相机安装在眼镜上相对简单。

但是,视频摄像机通常以低频率(<60fps,大多数<30fps)运行,无法在运动中捕捉的高质量图像。 “果冻效应”和其他扭曲使得位置追踪失败。

2、单眼鱼眼摄像头

● 为6DoF追踪所预留的传感器

● 持续高频刷新6DoF追踪结果

● 会出现尺度漂移,使得虚拟物体会在场景中意外移动

AR,增强现实,ar技术

单鱼眼摄像头

一些AR眼镜会配备用于6DOF追踪的单个鱼眼镜头。此解决方案会产生一些额外的功耗,但通常会为设备提供更好的6DOF追踪效果。鱼眼摄像头的高相机帧更新率(> 90fps)和全局快门功能,可以使得SLAM系统在运动场景中保持可靠的追踪位置。但单个鱼眼摄像机应放置在眼镜前面,这会产生一些设计限制。

单鱼眼摄像头比较不足的的地方在于它所支持的场景规模有限。一旦移动范围过大,SLAM系统就容易产生尺度漂移,导致虚拟对象在场景中意外移动。

3、双目鱼眼摄像头 

● 高功耗

● 追踪、尺度估算准确

● 眼镜的工业设计会面临挑战

基于双目鱼眼的6DoF追踪系统已被不同的AR / VR头戴式设备制造商证明是一种可以量产的解决方案,高通已经使用双目鱼眼视觉在其VR头盔上展示了高质量的6DoF位置追踪功能。

AR,增强现实,ar技术

双目鱼眼摄像头模组

由于它提供实时的地图初始化、强大的追踪和对环境尺度的准确测量,因此额外增加摄像机所产生的功耗和成本是值得的。与单眼解决方案相比,双目鱼眼摄像头可以更快地扩展场景,并能更准确的测量环境尺度从而防止漂移。即使传感器数量加倍,计算复杂度也不比单眼视觉系统高很多。但该方案的实现需要高质量优化和定制工作,并且功耗高、发热大,需要更强的系统和硬件支持。

4、运用边缘计算

● 成本高昂

● 能实现高质量的6DoF追踪

● 稳定性高,可兼容不同平台

AR,增强现实,ar技术

英特尔推的定位追踪实感摄像头T265  可在边缘执行计算任务

边缘计算在AR设备中变得越来越流行,例如,Hololens已经通过边缘计算来运行其SLAM功能,使CPU和OS在用户应用程序上更高效地工作。对于轻量级AR眼镜,通过边缘计算来运行SLAM不仅可以减少计算负荷,还可以使AR眼镜兼容不同类型的主机平台。

这个解决方案的最优之处就在于,它可以在任何主机平台上均衡性能,无需定制优化算法。然而,轻量级AR眼镜通过边缘计算运行6DoF并不容易。这些类型的AR眼镜上的芯片通常仅设计用于驱动显示器并传输传感器数据而无剩余资源用于其他计算工作。因此可行的解决方案是将成熟的6DoF追踪模块集成到AR眼镜板上。

目前还没有关于哪种解决方案对于轻型眼镜“完美”的结论。设计人员需要根据AR眼镜的应用场景,来定义其产品的功能和预期用途,以便做出最佳的软硬件选择。

随着轻量级AR眼镜的逐渐普及,具有6DoF追踪功能的产品是能够给消费者带去优质体验的基础,也是AR产品走向千家万户的关键技术之一。

作者:霍志宇,美国密苏里大学计算机和电子工程系博士毕业,研究机器人及人机交互方向。现就职于位于美国旧金山的Rokid R-Lab,担任研究科学家。


【文章为作者独立观点,不代表87870立场】

本文由 Rokid 授权 87870 发表。转载此文章须经作者同意,并须注明来源及链接,否则将追究其法律责任!


如果您也认同,打赏支持下作者吧
打赏
0人打赏
Rokid
Rokid
Rokid,一家专注人机交互技术探索的酷公司,AI、AR软硬件相关。核心技术包括语音唤醒、语音识别、自然语言处理、图像识别等,北京和美国硅谷均设有研发实验室,用于人工智能理论、算法研究,以及前瞻性技术的探索。
选择支付金额
1元 2元 5元
选择支付方式
金币 微信 支付宝
打赏成功
感谢您对87870的支持
87870微信公众号

我有话说:

最新评论

Rokid

Rokid 关注

 Rokid,一家专注人机交互技术探索的酷公司,AI、AR软硬件相关。核心技术包括语音唤醒、语音识别、自然语言处理、图像识别等,北京和美国硅谷均设有研发实验室,用于人工智能理论、算法研究,以及前瞻性技术的探索。

文章:2阅读:3995

最近文章
阅读更多文章

新闻排行