ZD至顶网CIO与应用频道 07月14日 北京消息:眼睛是人类接触外部世界的第一感官。而对计算机来说,它们的“眼睛”就是计算机视觉感知技术。正是由于这种技术,计算机才从只会执行命令的机器,走上了成为有智慧的人工智能的第一步。
一家来自硅谷的技术创新公司,xPerception,就希望能够赋予世界上的机器人这样的感知能力。他们开发的智能感知计算模块,集成了感知、定位、避障和导航技术。模块提供媲美Google Tango和英特尔RealSense的感知技术,为第三方手机、VR设备、机器人等提供包括定位、识别、3D重建等功能在内的软硬件一体化解决方案,引领下一代硬件产品进入智能时代。
xPerception的智能感知模块可帮助家用机器人设备实现定位功能
打造连接AI和人类、虚拟和现实的开放式智能感知平台
xPerception的概念很明确:他们要推出一个软硬一体式的模块,来为机器人提供感知能力,为AR、VR设备提供现实交互,连接AI和人类,虚拟与现实。
xPerception的创始人包英泽来自Magic Leap,拥有最强黑科技的硅谷神秘创业公司。正是Magic Leap的产品,让资本开始了对计算机感知技术的疯狂追逐,也让科技迷们对未来充满了向往。而很早就加入了Magic Leap的他,也一直在从事最核心的感知项目的研发。
但是在计算机感知方面研究得越深入,他就越了解计算机视觉感知技术的重要性,无论是对于可穿戴AR、VR设备来说,或者是对机器人来说,要真正实现“智能”,这类技术是不可或缺的。但是,对于大部分公司来说,他们却没有相关的技术积累。
从Magic Leap离职后,包英泽创办了xPerception,想要打造一个容易集成的智能感知计算模块,帮助机器人、智能硬件、AR、VR相关领域的公司,让他们无需投入大量时间和精力做研发,也能让旗下的产品拥有智能感知功能。
这款由xPerception开发的开放式智能感知计算模块,集成了感知、避障和导航技术,以特殊的硬件电路板为依托,通过重重优化的算法和全方位的感知方案,让上述全部功能都可以通过一个硬件实现。
“机器人市场和移动VR、AR设备市场很大很复杂,我们做的是感知、避障、导航这一垂直领域。现在中国厂商们主要把时间精力放在了市场应用上,我就希望我们的技术和产品能填补空白,帮助中国厂商们及早用上这个技术。”包英泽说。
xPerception的软硬结合方案可以给任何设备进行6自由度 的3D定位,准确重建周边环境,还可以识别物体,包括识别手、人、家具、车等,把真实环境映射到虚拟空间中,让机器人可以在真实空间中自由活动。
这项技术可以看做帮助机器人实现从0到1的突破。 现在市面上机器人分为两种:瞄准未来型的家庭用机器人和工厂机器人。但是无论是哪类机器人,目前几乎都没有将视觉解决方案完美地加进去。正是由于缺乏这样的“感知能力”,机器人往往不能自如行动,或者行动起来很笨拙,一点都不智能。
xPerception的出现,改变了这一切。
xPerception智能模块可以嵌入到扫地机器人等家用机器人中,实现环境三维扫描等智能功能
以家用机器人为例,它们原本只能做前方物体的测距,而没有办法对家庭环境有一个整体的理解;但是加入xPerception的产品,则可以让机器人重建整个家庭地图,更好地完成主人指令。
对于工厂型机器人来说,这项技术更是意义重大。现在国内每年仓储机器人的出货量已经达到了数十万台,但都只能按照设定的路线在无人环境下行驶运货,很难做到可靠避障。
xPerception的技术方案可以让仓储机器人加上“电子眼睛”,在人机混合的环境下,检测到死角和移动的人,并进行主动避障,适应更加复杂、动态的仓库环境,提高安全性。
不仅仅对于机器人,对AR、VR技术同样如此。要实现最佳的沉浸感 、要渲染虚拟的物体,同样要对用户自己在空间中的位置有一个测算。Xperception能以毫米级精度、毫秒级的系统延迟,为AR、VR设备提供这些底层技术。
xPerception智能模块还可以嵌入到VR头戴设备中,实现6自由度低延迟视角测算等功能
四大竞争优势,领先竞争对手两年时间
实际上,市面上已经有一些针对计算机视觉感知技术的解决方案。然而它们大部分都存在着致命的缺陷:
对于外置传感器的解决方案来说,只要机器人或者VR、AR用户在较大范围内的空间行走,这个方案就立刻失效,而且它需要部署的设备又多又昂贵,对于很多厂商来说都不是高效的选择;
而很多号称新型感知算法的公司,大部分却只是在开源软件的基础上做些小修小补,这样是无法开发出可以用在第三方设备上的成熟产品的。
对于xPerception来说,他们从头开始研发感知芯片,并结合领先同行的算法,还会根据行业反馈来进行改进,这也就决定了他们拥有强大的竞争优势。
首先,团队强大的技术实力和研发积累,已经让他们在软件算法上的研发进度,至少领先市场一年半到两年左右的时间。用包英泽的话说,现在很多开发类似技术的公司现在才遇到的“坑”,“我们早就已经遇到过并趟过去了。”正因为如此,他们才能在很多公司还在打磨算法的时候,就率先做出智能感知硬件模块,把市场铺开。
其次,他们一开始就定下的“算法+芯片”的软硬结合战略,也给他们带来了不少先发优势。
对于计算机视觉感知技术来说,只有软件是行不通的,它对硬件一定会有要求。“任何一套算法都会要提前知道它是跑在什么样的硬件上。如果只提供软件,合作伙伴会在每次部署的时候都要进行重新调试。”包英泽说,“计算机视觉感知算法对CPU的调用和电池要求都很高,没有制造商会愿意预留很多cpu运算资源给一套第三方算法。”
反过来说,光有硬件也没有用。例如在避障上,现在市面上有很多深度相机硬件,但是它们功能非常简单,而且十分昂贵,结果不尽人意,所以一直没有大规模普及。
xPerception“软硬结合”的做法,让客户买到的是特定问题的完整解决方案,不用再担心软硬件是否兼容的问题。而且它是市面上最低成本的方案,以扫地机器人为例,激光类导航模块成本在千元左右,而xPerception则可以用激光雷达的一半价格,实现更好的效果。
第三,它是快速能投入市场,用最小的整合代价,能让消费者用到的带有计算机视觉感知解决方案的新型产品。它已经针对不少行业,比如家用机器人、仓储机器人、VR、AR头盔等,开始了垂直化的实践,所以拥有很多创业公司难以获得的深度整合经验。
在某些关键技术指标上,比如包括定位误差、系统稳定性方面等,它甚至比大公司研发了很多年的项目,比如英特尔Real Sense技术,表现都要更好。
第四,从长远来说,xPperception努力打造一个共享多赢的智能生态系统,实现智能设备间“主动的”互动。
在包英泽看来,现在的所谓物联网其实只是被动的数据收集和统计,但是在未来,真正的物联网,会是以类似xPerception为代表的智能大脑,赋予万物人工智慧,让设备之间、设备和人类之间,实现“主动的互动”。
“我们把感知芯片应用于每一件未来的家居设备,把不同产品互相结合起来,发挥协同性的作用,才能打造实用的智能家居生态系统。家用智能生态链上的每一环,例如你的扫地机器人、电饭煲、洗衣机、冰箱、电视等,都会对你个人有很好的了解,提供个性化的家庭服务。必须所有的设备具有可以互联的人工智能,才能协同运作形成一个真正的智能生态系统。”包英泽说。这样的商业模式对于感知模块是可持续的,最终,人工智能的雪球会越滚越大,直至完全改变人们的生活,和这个世界运转的方式。
硅谷顶级团队,打造多赢生态系统
如果不是在计算机视觉感知这个领域有了十年的积累,包英泽也不会有底气从Magic Leap离职,创办xPperception,来填补这个对技术要求非常高的巨大市场空白。
包英泽此前以极优异成绩从清华大学电子系毕业,来到美国攻读博士学位,主攻的就是计算机视觉。他的导师Saverese也是在斯坦福的计算机视觉领域的大牛,获过很多学术的奖项,研究的项目还拿到了美国国防部的特批经费。
包英泽随导师进行计算机视觉研究, 一发不可收拾,一连在最顶级的学术期刊上发表了十几篇高质量论文,担任多本学术杂志审稿人,例如在整个计算机视觉和AI领域一直影响因子最高的IEEE学术性汇刊<<PAMI>>.
此外,他还获邀在多个顶级国际会议,比如由IEEE举办的计算机视觉和模式识别领域的顶级会议CVPR上做全体报告。CVPR一直有着极为严苛的录用标准, CVPR是全球人工智能领域公认的最顶级会议。
也正是因为如此,包英泽才在一毕业之后,就加入了备受关注的Magic Leap,并成为早期核心员工,负责感知项目的研发。
除了包英泽以外,xPerception团队的其他成员同样在硅谷顶级公司工作,团队实力即使在硅谷也称得上首屈一指。
现在,这个种子轮由国内知名基金真格基金投资的创业团队,正全周无休地工作,想要尽快优化硬件模组,把他们的计算机视觉技术推向尽可能多的用户。而他们的商业模式也很清晰,就是帮助智能手机、机器人或者AR、VR设备制造商解决核心问题。
“我们想做的是,让中国和全世界的厂商都能以尽可能简单和经济的方式,在自己的产品上加入智能感知技术,打造一个共享多赢的智能生态系统。”包英泽说。而他们的理想,就是让xPerception成为连接AI和人类、虚拟和现实的那座终极桥梁。
好文章,需要你的鼓励
回顾历史,大约十年前,苹果公司在其Mac电脑产品中采用了英伟达的高性能图形处理芯片。然而,在经历了一系列商业争议之后,苹果公
根据Capital One工程副总裁Terren Peterson的说法,IT领域的一切最终都会商品化。Peterson在该银行工作了超过24年,对于商品化如何影响IT业务有着第一手的经验。
澳大利亚新南威尔士州交通局首席创新和技术官Kurt Brissett最近和我们分享了如何为交通用户提供世界首创的技术,以及如何将很高的员工参与度转化为客户满意度。
当今最先进的AI视频模型Veo 2,还有AI绘图模型Imagen 3改进版。AI视频Veo 2的效果,真的让我有点想欢呼,甚至,有点像2月16号那个