近日,可信的企业人工智能数据公司肯睿Cloudera宣布进一步扩大其与NVIDIA的合作。Cloudera Powered by NVIDIA将把NVIDIA AI Enterprise软件平台中的企业级NVIDIA NIM微服务集成到Cloudera Data Platform上的AI/ML工作流程服务Cloudera Machine Learning中,为客户提供快速、安全和精简化的生产级端到端生成式AI工作流程。
结合专为大语言模型(LLM)优化的综合全栈平台后,企业数据在推动企业生成式AI应用从试点到生产的过程中,发挥了至关重要的作用。借助NVIDIA NIM和NeMo Retriever微服务,开发人员能够将AI模型与他们的业务数据(包括文本、图像和各种可视化图,如条形图、折线图和饼图等)相关联,生成高度准确且符合上下文语境的回答。NVIDIA AI Enterprise提供专为构建、自定义和部署企业级LLM而优化的运行时,使用上述微服务的开发人员可以通过它部署应用。Cloudera Machine Learning充分利用NVIDIA微服务,将高性能AI工作流程、AI平台软件和加速计算应用于数据,使客户能够从他们委托Cloudera管理的企业数据中挖掘出价值。
肯睿Cloudera 将推出多项集成NVIDIA微服务的功能。Cloudera Machine Learning 将通过集成NVIDIA微服务支持的模型和应用服务,提升所有工作负载的模型推理性能。借助这项全新的AI模型服务功能,客户部署在公有云和私有云上的模型都能实现容错、低延迟服务和自动扩展。此外,Cloudera Machine Learning 还将提供集成式 NVIDIA NeMo Retriever 微服务,简化自定义 LLM 与企业数据的连接。用户可通过这项功能构建基于检索增强生成(RAG)的生产级应用。
Cloudera此前曾与NVIDIA合作,通过将NVIDIA RAPIDS Accelerator for Apache Spark集成到Cloudera Data Platform,利用GPU优化数据处理。现在,随着NVIDIA微服务计划的加入以及与NVIDIA AI Enterprise 的集成,Cloudera Data Platform 将成为可提供精简化端到端混合 AI 管道的平台。
肯睿Cloudera亚太区高级副总裁Remus Lim表示:“NVIDIA在人工智能计算领域的领先地位与Cloudera在数据管理领域深厚的专业积累相得益彰。通过这次合作,我们将赋能客户创建出能够产出高度精确数据和见解的模型。这些模型得到企业的信赖,并能在一个安全的机器学习(ML)环境下运作,满足日新月异的需求。我们很高兴能够助力客户加速其人工智能之旅,无缝地从AI的探索和实验阶段过渡到在整个组织内的大规模部署。”
未来,各个行业的企业都将能够更加快速、直观地构建、自定义和部署支持变革性生成式AI的 LLM,包括加快开发时间的编码协作机器人、自动执行客户互动和服务的聊天机器人、快速处理文档的文本摘要应用、精简化的上下文搜索等各种应用。这些创新技术使整个企业的数据和高级AI流程变得更加简单和快捷,最大程度地缩短了实现业务价值的时间,增加了收入来源并优化了成本。
肯睿Cloudera AI/ML产品副总裁Priyank Patel表示:“Cloudera正在通过集成NVIDIA NIM和CUDA-X微服务,为Cloudera Machine Learning提供助力,帮助客户将AI热潮转化为实实在在的业务成果。除了为客户提供强大的生成式AI功能和性能外,此次集成的成果还将助力企业做出更加准确且及时的决策,同时减少预测中的不准确性、幻觉和错误。这些都是适应当今数据环境的关键因素。”
NVIDIA企业产品副总裁 Justin Boitano 表示:“企业迫切希望将其海量数据运用于生成式AI,创造出定制化的辅助系统和生产力工具。通过将NVIDIA NIM微服务集成到Cloudera Data Platform,开发人员能够更加轻松且灵活地部署推动业务转型的LLM。”
Cloudera将在AI时代的开发者峰会NVIDIA GTC上展示全新的AI功能。本届GTC于3月18日至21日在加利福尼亚州圣何塞市的圣何塞麦克内里会展中心举行,参加者包括影响AI和加速计算领域下一步发展方向的企业与创新者。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。