至顶网CIO与应用频道 09月18日 北京消息:作为计算机技术与思维科学相结合的产物,VR(虚拟现实)正在迅速拓展人类对世界的认知方式。三维空间的实时表现能力、人机交互式的操作环境以及身临其境逼真感受,令VR技术在视频游戏、电影影像、医疗卫生、电力能源乃至航空天领域都有着十分广阔应用前景。VR技术正在为传统行业及新兴产业带来革命性的变化。
为了培养中国VR技术研发和应用的创新人才,AMD与中国虚拟现实与可视化产业创新技术战略联盟,协助教育部科技发展中心,在2017年6月启动了“第四届全国高校云计算[注]应用创新大赛”。大赛设立了“大学生虚拟现实应用场景命题赛”,让参赛学生能动手发掘虚拟现实的应用场景,利用迅速兴起的VR技术解决实际问题,以创新的设计和先锋的理念为VR产业发展带来新的动力。在整个赛程中,AMD将全程支持和参与,包括硬件技术支持、决赛阶段团队的一对一技术辅导等。优胜团队的学生还将获得AMD实习乃至工作的宝贵机会。AMD将与有意愿开展VR项目合作的高校进一步接触交流,共同为VR产业的繁荣发展贡献力量。
本次命题赛已于9月1日正式启动报名,获得了全国各高校的积极响应。参赛学生需利用基于锐龙7、锐龙5处理器和Radeon RX580或RX480以上显卡的全系列配置PC或台式机,模拟现实环境中无法开展的高危险场景,进行模拟成本高、实施风险高、资源(包括能源和试验原材料)消耗大的教学与科研专题研究;学生还可开发具有创新性和实用性的作品。作品呈现的形式分为VR动画作品软件和VR全景视频类,以及VR设备与实验室工具和管理类软件,学生们可在技术科普、展览展示、职业培训、模拟教学、公众话题创意等众多应用场景中尽情发挥自身的创造力。
作为全球半导体领先厂商,AMD近年来一直在VR领域不断寻求突破。众所周知,高性能计算、图形及可视化技术的进步是实现VR的关键。VR技术的推广应用,需要性价比更高的技术产品支持。AMD推出创新性的LiquidVR™技术,通过简化和优化虚拟现实内容创作,借助兼容的Radeon显卡释放诸多与头戴式设备无缝协作的独特AMD硬件功能,让“身临其境”变为可能。AMD锐龙Threadripper、锐龙7、锐龙5和锐龙3处理器以超强的计算力满足甚至超出了一些高端头显的要求,助力提供卓越的虚拟体验。另外,AMD显卡品牌Radeon专为VR、图形计算设计的产品与AMD LiquidVR™技术紧密配合,相得益彰,全力打造逼真的VR体验。
除了技术方面的不断锐意创新,AMD还在VR领域积极寻求各类合作,着力扩展VR应用边界。例如,极具前瞻性地与美联社开启战略合作(+本站微信networkworldweixin),联合开创全新的虚拟现实体验频道;与HTC等行业领军企业携手成立了亚太虚拟现实产业联盟,进一步推动VR产业在亚洲的发展;与全球知名的VR头盔制造商如Oculus、HTC,以及游戏引擎开发商和内容创作者达成深度合作;为戴尔、华硕等品牌主机配置专为VR设计的AMD处理器产品,帮助打造“沉浸式”的使用体验。另外,在中国,AMD凭借为VR内容创作定制的Radeon Pro Duo显卡及技术与网易、清华大学等合作,共同发起成立VR领域实验室“VR Dream Lab”,打造连接平台、孵化VR内容,推动VR的普及和发展。
AMD中国公共事务部副总裁黄志强先生强调,“技术创新是 AMD 的灵魂、培育人才是AMD责任、合力共赢是AMD 的发展路线 ”,此次AMD支持“第四届全国高校云计算应用创新大赛”并主办大学生虚拟现实应用场景命题赛,正是看到了中国VR市场的良好发展前景,希望通过支持大学生们的创新创意,为VR产业的发展注入新鲜活力,共同推动实现技术创造美好工作生活的愿景。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。