ZD至顶网CIO与应用频道 12月16日 北京消息:2016年是VR产业元年,包括硬件和内容,仍处于早期阶段。特别是硬件,VR产业的硬件种类型号繁多,有昂贵的PC VR、一体机,还有大部分用户手接受的市场价200元左右的VR眼镜,甚至更便宜的眼镜盒子。眼镜加上手机的配置,只能眼镜凝视的交互,都会给VR用户的体验带来进入门槛与各种不便。
为此,百度VR浏览器安卓1.3版本重点推出了两个功能,解决以上问题:
1、3D界面语音助手,可通过语音调节屏幕亮度、声音大小、视角校准以及在浏览网页时,通过语音录入关键词进行全网搜索;
2、2D界面片源预览,即使没有VR头显的用户,也可以先在2D环境下通过移动手机进行360度全景预览。
这两个功能,会给用户带来什么样的惊喜?
百度VR浏览器1.3安卓版
语音交互,给VR体验带来巨大提升
当手机放到VR眼镜中,人就失去了和手机的连接,无法用手和手机直接进行交互。因此在VR眼镜中,人机交互是极度影响用户体验的环节,没有任何用户能够忍受拿下来装上去的体验。此次百度VR浏览器推出的语音交互,正是百度近两年来深耕人工智能方面的积累。
目前市面上360度全景片源还是偏少,大部分用户接触到的VR片源为180度宽屏,在带上眼镜的瞬间经常会遇到“黑屏”的情况,虽然这只是大部分内容聚合平台为了实现360度全景效果拼接出的另外一部分屏幕。但是小则转动90度,多则需要转动180度,对用户来说,交互体验确实让人觉得有点“心累”。在百度VR浏览器安卓1.3版本中,你只需要喊出“重置视角”,屏幕会自动为你调整到最佳的观看角度。
除了“重置视角”之外,百度VR浏览器已经能实现调节音量、调节亮度、全网搜索等方向的语音识别。相比于之前拿下来装上去的用户体验,百度VR浏览器这次的功能升级,给VR眼镜用户体验带来了巨大的提升,让人机交互变得更加智能。
眼镜凝视“话筒”启动语音交互界面
语音交互,重置视角
语音交互,调节音量
VR搜索的新突破,通过语音搜索全网
如果说人工智能是百度近几年来深耕的领域,搜索就是百度的老本行。这次百度VR浏览器推出的新功能中,还有VR环境下的全网搜索。通过语音发出搜索需求和指令,在VR环境下直接搜索全网,在百度VR浏览器内呈现出全网的搜索结果。
初看百度VR浏览器结合百度的搜索技术,实现全网搜索的能力并没有太多技术上的要求和门槛,但殊不知,要实现VR环境下的搜索,至少要解决两个问题。一个是输入体验的问题,目前VR相关的内容聚合平台,大部分只能通过凝视的方式和应用进行交互,而在凝视的交互方式下进行信息的输入,需要摇头晃脑数次、花费数分钟,才能完成用手指几秒钟就能完成的信息输入;另外一个门槛,是需要在VR环境下展示搜索结果,让所有搜索结果内容的展示匹配VR环境,能做到这个技术的内容聚合平台为数不多。
百度VR浏览器此次借着语音交互功能上线,正式推出了VR环境下的全网搜索。利用语音交互的方式大大提高VR环境下的输入效率,再利用自身逐步完善的WebVR技术,在VR环境下展示全网的搜索结果。这样的技术,目前百度VR浏览器还是国内第一个。
眼镜凝视“话筒”或“放大镜tab”均可启动语音搜索界面
站内网页搜索结果显示
全网搜索结果展示
2D界面片源浏览,谁都可以体验VR
不得不说,这次推出的功能信息量太大,还有一个不可或缺的功能——2D界面片源预览。在此之前,大部分的VR内容聚合平台,都只匹配了VR眼镜的播放模式,因此在用户没有VR眼镜的情况下,用户是无法体验和观看VR内容的。此次百度VR浏览器新增的2D界面片源预览功能,就是让用户在没有VR眼镜的情况下,也可以直接通过肉眼观看手机上的VR内容,同时能够实现360度全景的观看效果。这对用户来说,是个极简单就可以入门的方式,即便没有VR眼镜,也可以通过百度VR浏览器体验VR。也许体验过一次,你可能就会路转粉,成为VR的忠实用户。
2D界面全景视频的普通预览
2016年年关之际,百度VR浏览器的这次升级意义可谓重大。语音交互实现VR环境下的全网搜索、2D界面即可预览VR片源,让国内首个VR浏览器迅速拉开了和后来者的距离,或许再有涉足VR浏览器的,就要花很长的一段时间钻研技术,才能追上百度VR浏览器的脚步。不过这一切都是相辅相成,VR全网搜索、浏览访问也都是基于最早推出的WebVR技术,以及百度积累的人工智能技术,才能让更多的内容更顺畅地接入百度VR浏览器。
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。