Pure Storage AI基础设施副总裁Par Botes强调,成功应对AI工作负载不仅需要足够的计算和存储资源,更关键的是确保AI训练数据的质量。企业需要捕获、组织、准备和对齐数据,因为数据往往不完整或不适合AI要解决的问题。他建议企业思考数据工程流程,利用数据湖仓对数据进行清理和准备,并建立持续的数据管理discipline。
优质数据对AI项目成功至关重要。研究显示,具备数据成熟度的企业更容易在生产环境中成功部署生成式AI解决方案。多家企业CIO分享了构建数据湖仓、数据仓库等统一数据平台的实践经验。Skyworks通过Databricks构建数据湖仓,建立青铜、白银、黄金三层数据质量体系。Gallo利用生成式AI识别数据偏差并填补数据缺口。这些实践证明,强大的数据治理和统一的数据基础是实现AI转型价值的关键。