至顶网CIO与应用频道 11月21日 北京消息:2015年10月启动的“埃及国际扫描金字塔”项目使用非侵入、非破坏检测方法扫描埃及金字塔,试图发现其中隐藏的秘密。经遗迹创新保护研究所(HIP)和开罗大学工程学院(Cairo Faculty of Engineering)设计和协调的这一项目是达索系统之前研究项目的延续。
在2016年10月发现横梁后的甬道起点后,“扫描金字塔项目”在著名科学杂志《自然》上撰文,揭示大金字塔(即胡夫金字塔)内存在巨大空洞并将其称为“扫描金字塔大空洞”。这个三十米长的密室在规模上与已知的“大走廊(Grand Gallery)”相似。这是一次重大发现,因为自中世纪(Middle Ages)以来就未曾在胡夫金字塔内发现过重大建筑结构。
达索系统基金会和Emissive为HIP研究所(HIP Institute)和开罗大学(Cairo University)提供技术支持和专业知识,后者借助虚拟现实体验规划和协调这一特别的多专业领域研究,栩栩如生地再现这些发现。
“扫描金字塔”是达索系统基金会选择的项目之一。基金会的目的是通过发挥3D技术和虚拟环境的强大学习与发现功能,让多专业领域团队开展共同协作,从而重新塑造未来的教育与研究。在Emissive构思和开发的精彩体验和设置的帮助下,身临其境的感觉赋予更逼真的现实感,在项目中犹如置身金字塔内。它实现协同并拓宽知识。人人(学生、研究者、公众、残疾人士等等)都能发现无法抵达的空间。
巴黎建筑设计与文化遗产博物馆(Cité de l’architecture et du patrimoine)内的虚拟现实研究实验室正在构思未来文化教育领域的协同沉浸式环境。
原型虚拟现实体验将研究小组置身大金字塔内,他们能在沉浸式环境中四处走动,探索这些发现。戴上虚拟现实头戴式设备,他们就进入大金字塔内部,进行一次全新的虚拟导游之旅。这是一种创新性沉浸式体验,通过前所未有的方式造访知名遗迹,它预示着文化教育活动的未来。
好文章,需要你的鼓励
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。
这篇研究论文揭示了多模态大语言模型(MLLMs)存在严重的模态偏差问题,即模型过度依赖文本信息而忽视图像等其他模态。研究团队通过理论分析和实验证明,这种偏差主要源于三个因素:数据集不平衡、模态骨干能力不对称以及训练目标设计不当。他们提出了系统的研究路线图和解决方案,包括增强视觉模态在数据集中的贡献、改变模型关注点和应用偏好优化策略。未来研究方向则包括开发更客观的评估指标、探索更多模态组合中的偏差问题以及应用可解释AI技术深入分析偏差机制。
ComfyMind是香港科技大学研究团队开发的一个协作式AI系统,旨在解决当前开源通用生成系统面临的稳定性和规划挑战。该系统基于ComfyUI平台,引入了两项关键创新:语义工作流接口(SWI)和带本地反馈执行的搜索树规划机制。SWI将低级节点图抽象为语义函数,而搜索树规划将生成过程视为分层决策任务。实验表明,ComfyMind在ComfyBench、GenEval和Reason-Edit三个基准测试中均大幅超越开源基线,并达到与GPT-Image-1相当的性能,为开源通用生成AI开辟了新路径。
这项研究介绍了一种名为"热带注意力"的新型注意力机制,专为解决神经网络在组合算法推理中的困境而设计。传统注意力机制使用softmax函数产生平滑的概率分布,无法精确捕捉组合算法所需的锐利决策边界。