麻省理工学院与微软研究人员联合开发了一套名为Murakkab的智能系统,可自动优化AI智能体工作流的设计与部署。开发者只需用自然语言描述需求,系统便能自动选择最优模型、工具及硬件配置,并根据用户对速度或成本的优先级实时调整。测试结果显示,与传统方法相比,该系统仅需约35%的计算量、27%的能耗和不足25%的成本,同时保持相当性能表现。
Agentic AI正在深刻改变半导体芯片的设计与验证流程。多位EDA领域CEO在行业峰会上探讨了其应用前景:AI可提升工程师生产力、缩短设计周期、自动化重复性工作,有望将芯片开发周期从18个月压缩至6个月。但挑战同样突出——芯片设计容错率极低,AI输出质量难以快速验证,人机协作仍是必要机制。业界正着手建立统一基准测试标准,以确保AI输出可信可量化。
随着AI应用从通用人工智能到药物研发的广泛普及,数据中心和HPC集群的I/O设计面临前所未有的挑战。设计师需要在互连协议、散热、机架设计和功耗之间寻求平衡。多芯粒封装、3D集成等先进封装技术使接口数量激增,加剧了信号完整性与热管理难题。可靠性至关重要,OCP发布的多路径可靠连接协议(MRC)等创新技术正在推动行业应对这些复杂挑战。
本研究由德国IU国际应用科学大学团队完成,测试GPT-4o在自制跑酷游戏中执行重构和功能生成任务的表现,发现重构成功率优于功能生成,并揭示单元测试不足以验证游戏功能正确性。
加州大学伯克利分校的Libretto框架将音乐转化为LLM可读写的文本格式,并用29个结构指标诊断生成质量,让AI代理能真正理解并修改音乐结构。
研究团队通过引入TuneJury人类偏好评委、专家迭代和CRPO微调三阶段流水线,在1.2亿参数模型上将文生音乐的FAD-CLAP从0.60降至0.42,其中专家迭代贡献最大。
Meta于4月启动的"模型能力计划"因员工数据意外对全公司可见而被叫停。该项目通过记录员工键盘输入、鼠标操作及截图来训练AI模型,遭到逾1600名员工联署请愿反对。据报道,私人对话、绩效评估等敏感信息遭到泄露。Meta发言人表示已暂停该计划并启动调查。电子前哨基金会批评此举是对员工隐私权的滥用,呼吁立法保护工人隐私。
Argentum AI由Andrew Sobko领导、Supermicro支持,已签署约78亿美元协议,涉及约4.7万块英伟达GB300 GPU及300兆瓦数据中心建设。但多位业内人士透露,其实际合同总额可能超过100亿美元。该公司模式的独特之处在于:先锁定客户长期承诺,再融资部署基础设施,类似电力项目融资逻辑。这一"需求优先"策略正吸引华尔街和大型基础设施投资机构的高度关注。
你是否总在劳动节才意识到夏天虚度了?作者今年尝试将整个夏季日程交给AI助手打理。使用Claude AI生成了包含健身计划、海滩日、音乐会推荐的互动日历;用ChatGPT制定暑期阅读计划;还尝试了Suno生成专属夏日神曲。实测发现Claude表现更出色,而ChatGPT生成地图效果欠佳,Suno生成歌曲则闹出笑话——歌词直接把提示词唱了出来。
OpenAI发布首款自研推理芯片"Jalapeno",由其与博通合作设计制造,专为OpenAI推理系统的独特需求而打造。早期测试结果显示,该芯片每瓦性能显著优于现有主流方案。此举旨在降低对英伟达GPU的依赖,谷歌和亚马逊此前已有类似布局。Jalapeno专注于推理任务,有助于降低实时AI模型的运营成本,OpenAI正逐步向全栈基础设施延伸,覆盖芯片架构、内存系统、网络及部署系统等层面。
Meta与依视路联合推出全新AI智能眼镜系列,起售价299美元,较上一代降低约80美元。新品搭载Meta超级智能实验室首款多模态推理模型Muse Spark,支持语音问答、实时翻译(含中文、日语等14种语言)、免提导航及日程管理。眼镜配备高品质开放式扬声器、多麦克风阵列及摄像头,续航8小时,配合充电盒可达40小时。此外,Meta还推出与Kylie Jenner联名等三款风格设计。
HelloTwin.ai GmbH发布名为"数字权威"的AI治理平台,通过专利待审的编译器构建确定性AI孪生体,将业务智能与目标整合为单一可信数据源。该平台分两层架构:语义数字孪生层负责统一业务定义、指标与关系;数字权威层则运行可问责AI,指挥智能体并验证答案以消除幻觉。平台无需数据专家即可部署,支持财务、营销、销售等多角色,多个孪生体可跨边界协同治理。
Figma发布重大更新,新增代码层功能,支持团队在协作画布中克隆代码库并将代码流提取为设计层。此次更新还带来动画、过渡效果及3D变换支持,设计师可直接在Figma中集成动画,无需借助第三方工具。AI能力也得到强化,用户可通过文本提示创建可复用技能,并连接Notion、GitHub等外部工具。此外,Figma还将整合旗下收购的Weavy工作流工具,并支持用户通过提示词生成自定义插件。
AWS推出Bedrock托管知识库服务,旨在解决企业AI应用中RAG(检索增强生成)的运维难题。该服务可自动管理嵌入模型、重排模型及基础模型,并内置亚马逊S3、SharePoint、Confluence、Google Drive、OneDrive等六大企业数据源连接器。服务还提供智能解析和代理检索等功能以提升检索准确性,同时与Bedrock AgentCore集成,支持智能体应用开发。分析师指出,该服务有助于加速部署、降低维护成本,但也存在厂商锁定风险。
AI工程师与前沿部署工程师(FDE)的职业价值之争正引发业界广泛讨论。数据显示,2025年FDE职位发布量同比激增1165%。DeepLearning.AI创始人吴恩达认为,AI工程师才是职业发展的主赛道,而FDE可能使企业锁定单一供应商。业内专家普遍认为,两类角色各有侧重:AI工程师技术根基更深,FDE更擅长连接技术与业务成果。随着AI持续演进,"人机协作架构师"等第三类角色或将成为更高价值的新兴方向。
Facebook宣布将Creator Studio工具升级为独立AI伴侣应用,帮助创作者在平台上扩大受众。该应用内置AI创作助手,可根据内容风格、受众互动和目标提供个性化建议,支持创作者通过对话形式快速获取发布时机、评论分析等信息。新应用还配备AI评论工具,可筛选重要评论并以创作者语气起草回复。此举是Meta近期密集推出新应用浪潮的一部分,旨在与TikTok、YouTube竞争创作者资源。
Dollar General近日宣布多项高层人事变动。Travis Nixon由SVP AI优化职位转任首席数据与AI官,负责统筹AI战略及数据工程工作,推动商品、供应链与门店运营的效率提升。Tom Hutchins晋升为SVP兼CTO,扩大其在核心技术领域的职责。此外,Zak Brining转任SVP房地产,Nick Snow接任SVP企业运营。公司还晋升多位副总裁,分别负责门店运营、决策科学与分析、流程改进及人力资源等职能。
清华大学团队提出OpenRath框架,以Session为核心流动值,将AI智能体系统的对话、工具调用、沙箱操作、分支谱系和记忆事件统一收纳,解决多智能体协作中运行状态碎片化难以审查复现的问题。
新加坡南洋理工大学与UNIST联合提出VESFLOW,通过直接修改流匹配模型的速度场来实现安全生图,在4步极速模型上将色情内容攻击成功率压低至6%,同时不影响正常图片质量。
根据Gartner周三发布的报告,随着Token价格持续上涨,AI编程成本预计将在2028年超过普通开发者的平均薪资。消费计费模式正逐步取代订阅制,使企业AI支出难以预测和管控。研究发现,大量未受治理的自主Agent在后台运行,导致Token超支问题突出。KPMG报告显示,仅四分之一的企业高管对AI运营成本拥有实时可见性,CIO需建立完整的用量追踪机制以应对失控风险。