混合数据公司肯睿(Cloudera)近日概述了企业大规模运用安全、可信和负责任的人工智能(AI)的途径。全新的现成大型语言模型(LLM)蓝图将帮助客户基于自身数据和企业环境,安全可控地使用生成式AI。
Cloudera使客户能够在私有云和公有云环境中管理并挖掘数据的价值。Cloudera开放式湖仓一体将数据仓库和数据湖的功能相结合,为商业智能、人工智能和机器学习解决方案赋能。企业可以灵活地在其选择的私有云和公有云中部署这些解决方案,并获得相同的体验。
The Futurum Group首席执行官兼首席分析师Daniel Newman表示:“Cloudera开发了一流的混合开放式湖仓一体解决方案,目前为客户管理2500万兆字节(TB)的数据,这与超大规模服务商不相上下。无论数据位于何处,Cloudera都可以凭借其得天独厚的优势,帮助企业挖掘数据价值。同时,这些数据能够用于AI,让企业从当前和未来的AI发展中获益。”
Cloudera大中华区副总裁王刚表示:“管理这些海量数据使 Cloudera 处于无与伦比的地位,能够在企业环境中基于开放式湖仓一体驱动生成式 AI 应用。生成式 AI 和大型语言模型的效果取决于它们所接受的训练数据,并且它们需要正确的语境。这些模型和AI要取得成功,就需要得到信任,而信任 AI 始于信任数据。”
在各行业的大型跨国企业中,平均有90%的企业选择Cloudera管理他们的数据资产。目前, Cloudera解决方案管理的数据量突破了2500万TB。
企业数据加持的大型语言模型助力实现AI普及
为了进一步挖掘客户数据的价值并实现可信、安全和负责任的企业级AI,Cloudera的企业数据增强大型语言模型聊天机器人(LLM Chatbot Augmented with Enterprise Data)为企业带来了基于大型语言模型的生成式AI蓝图。虽然公开可用的AI服务对企业很有吸引力,但他们需要在合适的情境中基于自身专有数据构建交互体验,并且不与外部服务共享他们的数据。借助Cloudera的解决方案,企业可以通过由他们所选择的开源大型语言模型(LLM),使用内部数据构建AI应用,为数据科学家、机器学习团队以及所有开发人员和业务线提供支持,真正实现AI普及。
最近,Cloudera帮助东南亚第二大金融服务集团华侨银行在整个企业内大规模整合AI应用,从而推动客户创新并提高运营效率。华侨银行能够通过分析与销售、服务等相关客户对话中的实时情境数据增加营收。
此外,上海浦东发展银行通过运用大数据、云计算、机器学习(ML)、人工智能(AI)等金融科技手段为其经营管理和商业模式的转变夯实技术基础。通过建立一个由Cloudera支持的现代化数据平台,浦发银行提升了数据处理能力和效率。
Cloudera继续投资于推动AI应用的创新
王刚表示:“人工智能市场瞬息万变,然而不变的是任何大型语言模型或AI模型的成功都需要数据和企业情境。多年来,Cloudera一直在帮助企业挖掘AI/ML中的价值。我们将继续创新并大力投资于我们的整个产品套件,让客户能够从可信、安全和负责任的AI应用中受益。”
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
延世大学研究团队通过分析AI推理过程中的信息密度模式,发现成功的AI推理遵循特定规律:局部信息分布平稳但全局可以不均匀。这一发现颠覆了传统的均匀信息密度假说在AI领域的应用,为构建更可靠的AI推理系统提供了新思路,在数学竞赛等高难度任务中显著提升了AI的推理准确率。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
蒙特利尔大学团队发现让AI"分段思考"的革命性方法Delethink,通过模仿人类推理模式将长篇思考分解为固定长度块,仅保留关键信息摘要。1.5B小模型击败传统大模型,训练成本降至四分之一,计算复杂度从平方级降为线性级,能处理十万词汇超长推理,为高效AI推理开辟新道路。