人工智能 关键字列表
浙江大学团队全球首创AI创新能力测试:让机器人也能当"发明家"

浙江大学团队全球首创AI创新能力测试:让机器人也能当"发明家"

浙江大学团队开发了全球首个AI创新能力测试框架InnoGym,首次提出用"性能突破"和"方法新颖"双维度评估AI创新。研究发现现有AI虽有创造力但稳健性不足,无法将新想法可靠实现。该框架包含18个真实竞赛任务,为评估AI科学发现能力建立了新标准。

斯坦福团队揭秘:AI大模型竟像学生一样也会"临时抱佛脚"?

斯坦福团队揭秘:AI大模型竟像学生一样也会"临时抱佛脚"?

这项由斯坦福大学和卡内基梅隆大学联合开展的研究,提出了一种创新的AI学习方法——可微归纳逻辑编程。该方法首次系统性地融合了经典逻辑学习与现代深度学习技术,使AI既能从数据中学习,又能掌握可解释的通用规则而非仅记忆具体案例。实验证明这种方法在泛化能力、可解释性和小样本学习上显著优于传统神经网络,在医疗诊断、法律推理等需要透明决策的领域展现出独特应用价值。

澳门大学团队突破实时人脸动画技术:让虚拟主播告别卡顿和延迟

澳门大学团队突破实时人脸动画技术:让虚拟主播告别卡顿和延迟

澳门大学等机构联合开发的PersonaLive技术实现了革命性突破,仅需一张静态照片即可实时生成高质量人物动画视频。该技术采用创新的三阶段训练策略和双重动作控制系统,生成速度比现有技术快7-22倍,延迟仅0.253秒,为虚拟主播、在线教育、远程会议等领域提供了强大的技术支持,标志着实时虚拟人物交互时代的到来。

清华大学团队推出SVG-T2I:不用VAE也能画出好图片的AI新方法

清华大学团队推出SVG-T2I:不用VAE也能画出好图片的AI新方法

清华大学研究团队提出SVG-T2I,这是首个无需VAE的大规模文本到图像扩散模型。该模型直接在视觉基础模型特征空间中训练,在GenEval和DPG-Bench基准测试中达到先进水平,验证了VFM在生成任务中的潜力。团队已完全开源项目,为构建统一视觉AI系统提供新思路。

当AI医生走进牙科诊所:中科大团队打造的智能牙医助手能看懂X光片

当AI医生走进牙科诊所:中科大团队打造的智能牙医助手能看懂X光片

这项由中科院深圳先进院、港中大深圳等机构联合完成的研究,开发了专门用于牙科诊断的AI助手DentalGPT。该系统通过12万张专业标注的牙科图像训练,采用分阶段学习策略,具备类似专业牙医的图像分析和复杂推理能力。尽管只有70亿参数,但在多项牙科诊断测试中表现优于大型通用AI模型,准确率超过60%,为医疗AI专业化发展提供了新思路。

浙江大学团队开发LEO-RobotAgent:让聊天机器人拥有"身体",一句话就能指挥无人机和机械臂

浙江大学团队开发LEO-RobotAgent:让聊天机器人拥有"身体",一句话就能指挥无人机和机械臂

浙江大学团队开发的LEO-RobotAgent是一个突破性的通用机器人智能代理框架,它让大型语言模型能够同时操控无人机、机械臂等多种机器人完成复杂任务。该系统采用简化的循环架构,具备人机协作能力,用户可用自然语言直接指挥机器人,大幅降低了人机交互门槛。实验验证了框架在不同机器人平台上的有效性和通用性。

大型语言模型也能"快速阅读"?俄勒冈州立大学发现让AI既快又好的神奇组合拳

大型语言模型也能"快速阅读"?俄勒冈州立大学发现让AI既快又好的神奇组合拳

俄勒冈州立大学研究团队开发出滑动窗口注意力适应技术,通过五种方法的巧妙组合,让大型语言模型在处理长文本时既快又好。该技术受人类"粗读细思"启发,结合保留关键信息、混合处理层、思维链推理和专门训练等策略,在保持90%性能的同时将处理速度提升2-8倍,为AI模型的实用化部署提供了切实可行的解决方案。

大语言模型的记忆难题:斯坦福团队让AI在处理长文本时边学边忘,速度提升却效果不减

大语言模型的记忆难题:斯坦福团队让AI在处理长文本时边学边忘,速度提升却效果不减

斯坦福大学研究团队提出TTT-E2E方法,让大语言模型在处理长文本时采用"边读边学"策略,将理解的信息压缩存储到模型参数中而非逐字记忆。该方法在处理12.8万字文本时速度比传统全注意力机制快2.7倍,同时保持相同理解能力,为AI长文本处理提供了效率与性能并重的新解决方案。

AI基础设施革命:2026年数据中心发展预测

AI基础设施革命:2026年数据中心发展预测

AI正成为数据中心行业最具颠覆性的力量。2025年AI加剧了电力危机,代理AI技术进一步推高了数据中心需求,AWS和Cloudflare等大型服务商的重大故障凸显了基础设施韧性的重要性。展望2026年,液冷系统将加速普及,AI基础设施监管将趋严,边缘AI部署增长,量子-AI融合准备启动,现场电源投资将增加,这些趋势将持续重塑数据中心行业格局。

巴林如何构建区域领先的数字经济体系

巴林如何构建区域领先的数字经济体系

巴林过去十年致力于构建具有竞争力的数字经济基础设施,将技术和数字化转型置于国家愿景核心。该国率先在中东地区建立超大规模云区域,AWS于2018年在此设立数据中心。金融科技领域的早期监管创新使该行业在2022年超越石油成为GDP最大贡献者。巴林实现全国5G覆盖,互联网普及率达100%。通过"巴林团队"模式,投资者可直接对接监管机构和决策者,加速市场准入。

阿联酋阿布扎比发布Falcon大语言模型,构建国家AI治理新模式

阿联酋阿布扎比发布Falcon大语言模型,构建国家AI治理新模式

阿布扎比通过技术创新研究院打造了结构化的AI发展体系,将研究、治理与部署紧密结合。其自主研发的大语言模型Falcon于2023年发布,以开源形式获得国际关注。新成立的猎鹰基金会进一步推动生成式AI模型开源化,汇聚开发者、学术界和政策制定者协作。该模式在保持技术主权的同时促进创新,为全球负责任的AI发展提供了独特范例。

2025年Q3全球云基础设施支出达1026亿美元,AI应用推动增长

2025年Q3全球云基础设施支出达1026亿美元,AI应用推动增长

2025年第三季度全球云基础设施服务支出达1026亿美元,同比增长25%,这是连续第五个季度增长超过20%。AWS、微软Azure和谷歌云三大巨头占据66%市场份额,合计增长29%。云服务商竞争重点从AI模型性能转向平台级能力建设,支持多模型部署和AI智能体实际应用。AWS以32%市场份额领跑,微软Azure占22%,谷歌云占11%。

苹果应该放弃自研模型,全面转向第三方AI服务

苹果应该放弃自研模型,全面转向第三方AI服务

最新报告显示,苹果可能放弃自研AI模型开发,转而采用谷歌Gemini等第三方模型作为Siri后端。经过两年等待,苹果AI进展缓慢,用户仍在期待更智能的Siri。分析认为,苹果应充分利用领先AI公司的最佳模型,在自家PCC服务器上运行以确保隐私保护。这种方法既能提供顶级AI性能,又能维持苹果的隐私承诺,比自研模型更具优势。

Thine推出iPhone智能记录应用挑战AI硬件设备

Thine推出iPhone智能记录应用挑战AI硬件设备

Thine公司在CES 2026上展示了基于iPhone的AI笔记应用,CEO认为无需开发专用硬件设备,直接利用手机现有的麦克风和Siri功能即可实现对话记录和转录。该应用训练AI模型分析对话记录,用户可询问特定对话内容。目前月费200美元,主要面向高管用户,但随着技术改进和规模扩大,价格有望大幅下降。公司不存储音频文件,正在开发提供完整转录文本的新版本,长期存储和安全保护是主要成本。

Unusual获得360万美元融资,专注AI模型品牌形象管理

Unusual获得360万美元融资,专注AI模型品牌形象管理

初创公司Unusual宣布完成360万美元早期融资,专注于改变人工智能模型对品牌的表述方式。该公司由Will Jack和Keller Maloney于2024年创立,帮助客户了解AI模型如何"谈论"他们的公司。公司通过大规模品牌属性探测、检查模型依赖的信息源,并将误解转化为内容策略。随着50%的谷歌搜索已包含AI摘要,预计2028年将达75%,品牌需要管理在AI对话中的形象表现。

谷歌在CES 2026展示Gemini TV新功能

谷歌在CES 2026展示Gemini TV新功能

谷歌在2026年消费电子展上展示了Google TV设备上Gemini AI的全新功能。用户可通过自然语言对话与电视交互,获取观看建议、剧情回顾等服务。新功能还支持深度学习模式,提供互动式教育内容;可搜索Google Photos照片库,用AI为照片视频添加艺术风格。最实用的功能是语音优化电视设置,用户只需说"屏幕太暗"等指令,Gemini即可自动调整相关参数,无需手动操作复杂菜单。

宠物健康监测AI模型Petsense AI在CES发布

宠物健康监测AI模型Petsense AI在CES发布

Satellai公司在CES展会上发布了Petsense AI多模态宠物数据模型,能将宠物生物指标转化为健康洞察。该AI系统可分析活动水平、睡眠质量、体温并进行早期疾病检测,支持用户通过对话提问了解宠物状况。同时推出的Satellai Collar Go智能项圈售价80美元,具备15天续航、防水和实时定位功能,相比竞品更具价格优势。

AI智能戒指问世,可录制会议并生成转录

AI智能戒指问世,可录制会议并生成转录

Vocci AI推出的智能戒指在CES 2025展出,专为职场应用设计。该戒指通过手动按压侧面按钮开始录音,会议结束后自动生成转录文本。用户可在重要时刻再次按压按钮进行标记,AI会在转录中用红色标注并提供洞察分析。戒指厚2.8毫米,宽6.8毫米,支持100多种语言,可录制约8小时内容。录音数据保存在云端,预计2月开启预订,4月首批发货。

Plaud为NotePin添加实体按键升级版本

Plaud为NotePin添加实体按键升级版本

Plaud推出了NotePin AI录音设备的升级版NotePin S,主要改进是增加了实体按钮,取代了原版的触觉控制方式。新设备保持了相同的设计和功能,包括录音、转录和摘要生成。同时推出免费的Plaud Desktop应用,可自动检测并录制在线会议音频,支持Zoom、Meet和Teams等平台。该应用免费提供给Plaud硬件设备用户。NotePin S售价179美元,比原版贵20美元。

2026年企业AI预测:CIO面临碎片化、商品化与智能体推进挑战

2026年企业AI预测:CIO面临碎片化、商品化与智能体推进挑战

ChatGPT掀起AI投资热潮三年后,企业焦点从改进大语言模型转向构建代理系统。专家预测2026年四大趋势:LAM模型面临竞争,代理原语走向标准化,物理AI转向云端经济模式,数据质量问题阻碍代理AI发展。尽管供应商积极集成代理功能到工作流程中,但概念验证与现实碰撞,面临代理失控、数据质量差距和合规风险等挑战。企业需重新审视AI架构和投资策略。