浙江大学团队开发的LEO-RobotAgent是一个突破性的通用机器人智能代理框架,它让大型语言模型能够同时操控无人机、机械臂等多种机器人完成复杂任务。该系统采用简化的循环架构,具备人机协作能力,用户可用自然语言直接指挥机器人,大幅降低了人机交互门槛。实验验证了框架在不同机器人平台上的有效性和通用性。
俄勒冈州立大学研究团队开发出滑动窗口注意力适应技术,通过五种方法的巧妙组合,让大型语言模型在处理长文本时既快又好。该技术受人类"粗读细思"启发,结合保留关键信息、混合处理层、思维链推理和专门训练等策略,在保持90%性能的同时将处理速度提升2-8倍,为AI模型的实用化部署提供了切实可行的解决方案。
斯坦福大学研究团队提出TTT-E2E方法,让大语言模型在处理长文本时采用"边读边学"策略,将理解的信息压缩存储到模型参数中而非逐字记忆。该方法在处理12.8万字文本时速度比传统全注意力机制快2.7倍,同时保持相同理解能力,为AI长文本处理提供了效率与性能并重的新解决方案。
AI正成为数据中心行业最具颠覆性的力量。2025年AI加剧了电力危机,代理AI技术进一步推高了数据中心需求,AWS和Cloudflare等大型服务商的重大故障凸显了基础设施韧性的重要性。展望2026年,液冷系统将加速普及,AI基础设施监管将趋严,边缘AI部署增长,量子-AI融合准备启动,现场电源投资将增加,这些趋势将持续重塑数据中心行业格局。
巴林过去十年致力于构建具有竞争力的数字经济基础设施,将技术和数字化转型置于国家愿景核心。该国率先在中东地区建立超大规模云区域,AWS于2018年在此设立数据中心。金融科技领域的早期监管创新使该行业在2022年超越石油成为GDP最大贡献者。巴林实现全国5G覆盖,互联网普及率达100%。通过"巴林团队"模式,投资者可直接对接监管机构和决策者,加速市场准入。
阿布扎比通过技术创新研究院打造了结构化的AI发展体系,将研究、治理与部署紧密结合。其自主研发的大语言模型Falcon于2023年发布,以开源形式获得国际关注。新成立的猎鹰基金会进一步推动生成式AI模型开源化,汇聚开发者、学术界和政策制定者协作。该模式在保持技术主权的同时促进创新,为全球负责任的AI发展提供了独特范例。
2025年第三季度全球云基础设施服务支出达1026亿美元,同比增长25%,这是连续第五个季度增长超过20%。AWS、微软Azure和谷歌云三大巨头占据66%市场份额,合计增长29%。云服务商竞争重点从AI模型性能转向平台级能力建设,支持多模型部署和AI智能体实际应用。AWS以32%市场份额领跑,微软Azure占22%,谷歌云占11%。
最新报告显示,苹果可能放弃自研AI模型开发,转而采用谷歌Gemini等第三方模型作为Siri后端。经过两年等待,苹果AI进展缓慢,用户仍在期待更智能的Siri。分析认为,苹果应充分利用领先AI公司的最佳模型,在自家PCC服务器上运行以确保隐私保护。这种方法既能提供顶级AI性能,又能维持苹果的隐私承诺,比自研模型更具优势。
Thine公司在CES 2026上展示了基于iPhone的AI笔记应用,CEO认为无需开发专用硬件设备,直接利用手机现有的麦克风和Siri功能即可实现对话记录和转录。该应用训练AI模型分析对话记录,用户可询问特定对话内容。目前月费200美元,主要面向高管用户,但随着技术改进和规模扩大,价格有望大幅下降。公司不存储音频文件,正在开发提供完整转录文本的新版本,长期存储和安全保护是主要成本。
初创公司Unusual宣布完成360万美元早期融资,专注于改变人工智能模型对品牌的表述方式。该公司由Will Jack和Keller Maloney于2024年创立,帮助客户了解AI模型如何"谈论"他们的公司。公司通过大规模品牌属性探测、检查模型依赖的信息源,并将误解转化为内容策略。随着50%的谷歌搜索已包含AI摘要,预计2028年将达75%,品牌需要管理在AI对话中的形象表现。
谷歌在2026年消费电子展上展示了Google TV设备上Gemini AI的全新功能。用户可通过自然语言对话与电视交互,获取观看建议、剧情回顾等服务。新功能还支持深度学习模式,提供互动式教育内容;可搜索Google Photos照片库,用AI为照片视频添加艺术风格。最实用的功能是语音优化电视设置,用户只需说"屏幕太暗"等指令,Gemini即可自动调整相关参数,无需手动操作复杂菜单。
Satellai公司在CES展会上发布了Petsense AI多模态宠物数据模型,能将宠物生物指标转化为健康洞察。该AI系统可分析活动水平、睡眠质量、体温并进行早期疾病检测,支持用户通过对话提问了解宠物状况。同时推出的Satellai Collar Go智能项圈售价80美元,具备15天续航、防水和实时定位功能,相比竞品更具价格优势。
Plaud推出了NotePin AI录音设备的升级版NotePin S,主要改进是增加了实体按钮,取代了原版的触觉控制方式。新设备保持了相同的设计和功能,包括录音、转录和摘要生成。同时推出免费的Plaud Desktop应用,可自动检测并录制在线会议音频,支持Zoom、Meet和Teams等平台。该应用免费提供给Plaud硬件设备用户。NotePin S售价179美元,比原版贵20美元。
ChatGPT掀起AI投资热潮三年后,企业焦点从改进大语言模型转向构建代理系统。专家预测2026年四大趋势:LAM模型面临竞争,代理原语走向标准化,物理AI转向云端经济模式,数据质量问题阻碍代理AI发展。尽管供应商积极集成代理功能到工作流程中,但概念验证与现实碰撞,面临代理失控、数据质量差距和合规风险等挑战。企业需重新审视AI架构和投资策略。
除了头条新闻外,更深层的力量正在重塑权力、风险和经济格局。明年,低质量的"工作垃圾"将悄然涌入各组织,网络犯罪将发展为跨国特许经营模式,量子计算将从实验室试点跃升至政策强制要求,机器身份数量将以数量级超越人类。AI本身将面临严峻限制,包括能源上限、平台封锁以及对每瓦性能的突然关注。与此同时,劳动力、安全和基础设施领域的非AI变革正在重塑实际工作方式。
CIO们正在为新的一年制定大胆目标,旨在变革组织并展现IT价值。不出所料,许多目标都与人工智能相关。本文调研了多位CIO的抱负,包括:提升AI成果质量、扩展智能代理应用、管理新兴智能工作团队、确保AI真正帮助员工、平衡创新与人性化、更好地沟通IT价值、提升全员技术和AI素养、向其他CIO学习经验,以及积极参与未来技术变革。这些目标反映了IT领导者在AI时代的战略重点。
英矽智能在去年底IPO后新增重要合作伙伴,与法国塞维尔公司签署总价值高达8.88亿美元的合作协议,首付款3200万美元。双方将利用英矽智能的Pharma.AI平台开发癌症新疗法。该公司CEO表示,传统药物发现需要2.5-4年,而其AI平台可将时间缩短至12-18个月,仅需合成测试60-200个分子即可完成候选药物筛选。
硬件制造商Plaud在CES展会前发布了新款AI记录设备NotePin S和桌面应用程序。新款别针售价179美元,配备物理按钮控制录制,支持点击标记重点,包含夹子、挂绳、磁性别针和腕带等多种佩戴方式,并支持苹果查找功能。设备拥有64GB存储和20小时续航,双MEMS麦克风可在3米范围内清晰录音。
DoorDash确认了一起司机使用AI生成图片伪造配送记录的事件。奥斯汀居民Byrne Hobart在社交媒体上曝光,称司机接单后立即标记为已配送,并提交了一张AI生成的配送照片。该司机疑似使用破解账户,通过DoorDash的历史配送照片功能获取了客户门前的图片。DoorDash发言人表示,经调查后已永久封禁该司机账户,并对客户进行了赔偿,强调公司对欺诈行为零容忍。
Vocci AI推出的智能戒指在CES 2025展出,专为职场应用设计。该戒指通过手动按压侧面按钮开始录音,会议结束后自动生成转录文本。用户可在重要时刻再次按压按钮进行标记,AI会在转录中用红色标注并提供洞察分析。戒指厚2.8毫米,宽6.8毫米,支持100多种语言,可录制约8小时内容。录音数据保存在云端,预计2月开启预订,4月首批发货。