生成式AI的发展让算力迎来了高光时刻,但不能忽视存储在其中的作用。
在经历了两年的下滑后,存储市场在2024年开始重新回到正轨。生成式AI为存储行业带来了一些机会,也带来一些挑战。
由于AI应用与传统数据处理方式有着显著区别,传统的存储架构已无法应对这些要求。更大容量、更高带宽、更低延迟,更低功耗,促使存储也要做出一些变革。
首先,速度是个老大难问题,当AI模型需要迅速生成创意时,却因为数据存取缓慢而“卡壳”,这无疑是一个令人沮丧的体验;
其次,存储容量的问题也不容小觑,生成式AI需要海量数据进行训练,传统存储在面对这些庞大的数据集时,往往感到无能为力;
最后,存储系统的可扩展性也让许多企业感到困惑,面对不断增长的数据需求,怎样迅速调整以跟上步伐,成为一大挑战。
大家也是八仙过海,各显其能。
SSD凭借其超快的速度和可靠性,由于生成式AI需要迅速访问和处理大量数据,SSD减少了数据存取过程中可能出现的瓶颈。云存储的灵活性也让企业能够根据需求动态扩展存储资源。当然传统的机械硬盘也有一席之地,在大模型的训练过程中,机械硬盘也可以在多个环节提供相应的支撑,其性价比仍然具有优势。
存储系统与生成式AI之间的协作将更加紧密,高效的存储解决方案将直接影响AI模型的训练和运行效率,确保海量数据能够快速存取、处理与分析,并能应对大模型时代的复杂需求。本期《数字化转型方略》我们将从芯片技术、硬盘选择、企业级存储产品以及云平台的应用,深入探讨生成式AI时代存储架构的变革。
未来随着生成式AI在各个行业的广泛应用,存储将不再是一个孤立的环节,而是成为了推动AI发展的核心组成部分。
《数字化转型方略》2024年第9期:http://www.zhiding.cn/dxinsight/2409
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。