早在2016年,猎豹移动董事长兼CEO、猎户星空董事长傅盛就认为工具的未来可能会呈现衰退的走势,在工具应用之外还要找到可以让用户停留时间更长的新业务引擎。
猎豹移动的业务有着三个非连续性曲线,第一个是PC时代,金山毒霸、CleanMaster等产品;第二个是智能手机时代的App;第三个是机器人时代。猎豹移动在第三个非连续性曲线中投资的就是一家智能服务机器人公司猎户星空(OrionStar)。
由于傅盛是中国最早一批互联网产品经理,也奠定了今天猎户星空所有的产品思路,即用互联网的思路去做人工智能项目,让用户体验更强,迭代周期更快。
而云也完美的托起了AI在更广泛领域中的运用,发挥更大的潜力,帮助猎户星空做“真有用”的机器人,让人们从重复的体力劳动中解放出来,让传统商业像互联网一样高效。
“AI全链条”与“软硬一体化”的竞争力
猎户星空(OrionStar)创立于2016年9月,目前已经发布了豹小秘、招财豹、豹小递Max、豹小秘mini、智咖大师、消毒豹等多款智能服务机器人产品,覆盖了全球二十多个国家和地区。
猎户星空并不是卖硬件的公司,而是一家解决方案公司。傅盛的机器人公式是,“AI+软件+硬件+服务”四项缺一不可,重要性各占25%。基于全链条AI技术基础能力,用标准化的硬件,通过软件定制,实现不同场景的数据服务。
“AI全链条和软硬一体化是列猎户星空在行业里提出的两个关键词。”猎户星空副总裁李婷说道。到今天为止,AI产品很多都需要定制,无法做到标准化,定制让软件和硬件全自研体现出了很多优势,包括成本低、性能好、场景进入快。
机器和人一样,拥有口、耳、眼、腿、手、脑,所以AI全链条也要围绕这些方面展开,口是全链条语音技术;耳是麦克风阵列语音转文字语义定义;眼是全感知智能识别;腿是室内自主导航平台;手是六轴消费级机械臂;脑是芯片+算法。
猎户星空全自研了操作系统Robot OS、语音OS系统和导航系统,并且已经拥有全栈硬件设计制造能力,以及服务机器人落地现场及云端的服务能力。
软硬一体化则实现了同样外形的机器人在不同场景的使用,在软件上拥有三大机器人操作系统应用开发能力:猎户星空全自研RobotOS系统实现标准化、开放、模块化;猎户星空全自研语音OS系统在75分贝环境下识别率达到94%,平均响应速度可以达到1~1.5秒,5米甚至接近10米的远场交互能力;猎户星空全自研导航系统满足多模态跨场景,多机协作,云端同步地图。同时在硬件上拥有全栈硬件设计制造能力。
针对各种不同的场景,猎户星空在技术上保证了一定的通用性,同时也兼具一定的定制化。比如泰国711工厂的递送机器人,机器的外形看似一样,但界面、递送频率,以及每天反馈的数据都是不同的。
猎户星空还参与了冬奥会,在冬残奥会筹备机器人评测评比中,猎户星空以5款机器人独挑大梁,在众多服务机器人企业中脱颖而出。分布于公寓入驻、点菜送餐、导览翻译等多个场景中,为冬奥会提供无接触保障服务。
AI模块的联动是云一手托起
机器人技术迭代的速度非常之快,猎户星空所面临的是对产品持续创新与迭代、保证低延迟的交互式应用、满足快捷的全球扩展、严格的安全技术合规要求等诸多挑战。
猎户星空和亚马逊云科技有很多业务上的合作来满足不同的业务需求。例如使用Amazon EC2实现高效计算,Amazon EKS是把服务做了容器化的部署,将数据存放到Amazon S3上,一部分用于数据处理,一部分做数据存放,例如存放语音数据,这些数据通过管道传输到Amazon OpenSearch保证用户高可靠、低延迟的搜索知识库等,通过Amazon CloudFormation服务可以把国内的架构快速地复制到不同的国家和地区,极大地提升了部署效率,降低了成本。
猎户星空对于业务的敏捷性有着非常高的要求,机器人业务访问量会根据时间产生巨大差别,语音交互有高峰期也有低谷期,需要根据流量变化弹性使用资源。最早猎户星空使用云上虚拟机一定程度满足了需求,但还存在较多资源冗余的情况,2020年开始,使用Amazon EKS实现容器化的改造,可以更细颗粒度的满足资源的分配,让相关服务运维成本节省50%以上,资源成本节省30%以上。
猎户星空的三万多台机器人,每分钟对知识库的搜索可以达到数十万次,为了保证海量的数据搜索,Amazon OpenSearch帮助猎户星空既能有效地达到AI层面的需求,在搜索响应时间方面最快能达到30毫秒的速度,用户在和机器人交互的时候几乎达到无感知延迟的状态,很好地提升用户体验。
猎户星空AI语音首席架构师韩堃指出,机器人在互动对话的过程中,背后是众多技术模块的联动,用户说一句指令,语音会发送到云端,云端通过众多AI模型进行语音识别和自然语言处理后,在知识库中进行搜索,之后再把答案返回给用户。
现在猎户星空从每天发布2-3个版本到现在每天可以发布几十个版本。而且能够以模板化的方式在新的区域部署和管理云资源,一套包含60-70个模块的新系统,部署时间从之前的10天缩短到2天。亚马逊云科技大中华区产品部机器学习产品负责人张洋表示,通过亚马逊云科技覆盖全球的基础设施以及成熟的服务,支持猎户星空在现代化应用和数据分析和交互两方面进行扩展,实现全球范围内的创新。
未来猎户星空与亚马逊云科技的合作仍具有更多想象空间。在高效开发上利用Amazon RoboMaker进行大规模机器人仿真,测试机器人导航算法。在人工智能上利用Amazon SageMaker提高机器学习算法训练效率,利用Amazon Transcribe、Amazon Lex、Amazon Polly等AI服务,支持小语种的机器人交互,在更多的海外国家赢得市场先机。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。