ChatGPT仅推出2个月,月活跃用户就已达1亿,半年时间ChatGPT就成为了生成式AI的现象级产品。
在生成式AI的发展中,算力的存在可以说举足轻重。可以看到大模型正在带动AI算力需求超越摩尔定律增长,据统计AI训练任务中的算力增长,每 3.5个月就会翻一倍。
以GhatGPT为例,在预训练算力上,训练一次1,746亿参数的GPT-3模型需要的算力约为 3,640 PFlop/s-day,对应的单次训练成本高达460万美元;日常运营算力上,GhatGPT根据访问量与内容量测算,单月运营算力约4,800PFlop/s-day;调优迭代算力上,每月模型调优带来的算力需求为82.5~137.5 PFlop/s-day。
现阶段,算力作为数字经济时代新的生产力,已成为经济社会高质量发展的重要支撑。工业和信息化部数据显示,我国近年来算力产业年增长率近30%,算力总规模位居全球第二。截至2022年底,我国算力总规模达到180EFLOPS(每秒18000京次浮点运算),算力核心产业规模达到1.8万亿元。
工业和信息化部新闻发言人、总工程师赵志国近日表示,近期通用人工智能的发展对算力提出了更高要求,工业和信息化部将重点从三方面着手:一是持续推动算力基础设施建设;二是聚力推进关键核心技术攻关和产业升级;三是激发算力应用赋能价值。
而且在“百模”大赛下,全球算力需求呈指数级增加,带动了国内AI服务器市场快速增长。本期《数字化转型方略》将和大家聊聊什么样的算力,才能满足大模型千亿数量级的训练需求?AI算力还有哪些发展方向?
总的来说,AI算力的发展已经成为数字经济时代的重要驱动力,无论是芯片厂商、服务器厂商、还是云厂商,他们都在不断地满足着AI算力的需求,推动着AI技术的发展。而对于我们来说,未来是如何用好AI算力,产生创新洞见。
《数字化转型方略》2023年第7期:http://www.zhiding.cn/dxinsight/2307
好文章,需要你的鼓励
RiOSWorld是一项开创性研究,评估多模态计算机使用代理在真实环境中的安全风险。由上海人工智能实验室团队开发的这个基准测试包含492个风险任务,涵盖网页浏览、社交媒体、操作系统等多种应用场景。研究将风险分为环境源和用户源两大类,通过风险目标意图和完成两个维度进行评估。对十个代表性MLLM代理的测试结果表明,当前代理在风险目标意图上的不安全率高达84.93%,在风险目标完成上达59.64%,揭示了AI代理在计算机使用安全性方面存在的严重隐患,为未来可信AI系统的开发提供了重要参考。
牛津大学林元泽及其国际合作团队开发的IllumiCraft是一种创新的视频重光照技术,它首次将几何和光照引导统一到一个扩散模型中。通过同时处理HDR环境图、合成重光照帧和3D点轨迹,该技术能生成与用户提示一致的时间连贯视频。研究团队还构建了包含20,170个视频对的高质量数据集,实验表明IllumiCraft在视觉质量、提示对齐和时间一致性方面显著优于现有方法,开创了可控视频生成的新可能。
中国人民大学物理学院研究团队开发了HTSC-2025,这是一个专为AI预测超导临界温度而设计的常压高温超导体基准数据集。该数据集包含140个样本,涵盖了2023-2025年基于BCS理论预测的超导材料,平均Tc为27.3K,最高达160K。研究不仅提供了公开的评估框架,还总结了提高超导温度的物理策略,如空穴掺杂和轻元素引入。该基准已在GitHub开源,为AI驱动的超导材料发现提供了重要支持。
MBZUAI研究团队开发了FinChain,这是金融领域首个可验证的符号化思维链推理基准测试。该基准涵盖12个金融领域的54个主题,每个主题包含5个不同难度的参数化模板,配有可执行的Python代码验证每一步推理。研究者还提出了ChainEval评估指标,同时评估最终答案正确性和中间推理步骤一致性。对30个大语言模型的测试表明,即使最先进模型在处理复杂金融推理时仍有很大提升空间,且模型规模是决定推理能力的关键因素。