至顶网CIO与应用频道 01月10日 编译:智慧城市是CES 2018上最热门的话题之一,几乎每一家主流的技术供应商都希望进入连接的生态系统。同样,全国各大都市区域都渴望实施可以将城市生活带入数字时代的技术。
在CES的CNET舞台上,TechRepublic的总编Jason Hiner与来自堪萨斯城、迈阿密和拉斯维加斯的技术负责人进行了讨论。在每个城市,首席信息官们都正在努力推进智慧城市的工作进程,并引领运输、安全、基础架构和连接系统的下一波创新浪潮。
迈阿密市的首席信息官Kevin Burns介绍了智能城市技术去年是如何应用于应对活跃的飓风季节的。该市与GIS地图绘制软件公司Esri合作进行三维建模,研究风暴是如何影响海平面上升。
迈阿密还将技术纳入新的警察总部的建设之中,并正在重建城市的网站,为其配备了针对听力障碍人士的功能。
在CES的主办城市拉斯维加斯,首席信息官Michael Sherwood已经把交通安全放在首位,并且设想了路上零死亡的现实。Sherwood表示:“正在构建从今天的汽车世界到完全自动驾驶汽车世界的桥梁。”
堪萨斯城的首席信息官Bob Bennett强调了该市是如何成为该国最大的连接车辆测试车队之一的实验室的。这一合作关系将为智慧城市数据收集和管理打下基础,并最终推动该市适应自动驾驶汽车的工作。
Bennet表示:“我们正在学习如何利用数据变成一个主动的城市,而不是一个被动的城市。”
首席信息官们一致认为,市长在推动智慧城市项目实现的过程中发挥着重要的作用,同时,在城市中创建整个技术生态系统也需要大量的技术合作伙伴。
Burns表示:“对于迈阿密市来说,市长理解技术,并有推动技术前进的愿景。”他表示:“因此,谈论技术,获得我为了扩展所需的资源以及我们在实现智慧城市区域所需要的技术就容易多了。”
Bennett补充表示:“与供应商和社区结成合作伙伴关系——在实施智慧城市的工作进程中,你需要这两者。”
首席信息官专家小组强调,社区教育也是其中的举措之一。
Bennett表示:“96%堪萨斯城居民的家门口都有光纤通道。”他表示,“但是在一半的地区中,居民因为思维障碍或者社会障碍而没有利用这一优势。我们希望聚焦在教育公众理解数字机遇上。”
好文章,需要你的鼓励
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。
这篇研究论文揭示了多模态大语言模型(MLLMs)存在严重的模态偏差问题,即模型过度依赖文本信息而忽视图像等其他模态。研究团队通过理论分析和实验证明,这种偏差主要源于三个因素:数据集不平衡、模态骨干能力不对称以及训练目标设计不当。他们提出了系统的研究路线图和解决方案,包括增强视觉模态在数据集中的贡献、改变模型关注点和应用偏好优化策略。未来研究方向则包括开发更客观的评估指标、探索更多模态组合中的偏差问题以及应用可解释AI技术深入分析偏差机制。
ComfyMind是香港科技大学研究团队开发的一个协作式AI系统,旨在解决当前开源通用生成系统面临的稳定性和规划挑战。该系统基于ComfyUI平台,引入了两项关键创新:语义工作流接口(SWI)和带本地反馈执行的搜索树规划机制。SWI将低级节点图抽象为语义函数,而搜索树规划将生成过程视为分层决策任务。实验表明,ComfyMind在ComfyBench、GenEval和Reason-Edit三个基准测试中均大幅超越开源基线,并达到与GPT-Image-1相当的性能,为开源通用生成AI开辟了新路径。
这项研究介绍了一种名为"热带注意力"的新型注意力机制,专为解决神经网络在组合算法推理中的困境而设计。传统注意力机制使用softmax函数产生平滑的概率分布,无法精确捕捉组合算法所需的锐利决策边界。