混合数据公司肯睿(Cloudera)近日概述了企业大规模运用安全、可信和负责任的人工智能(AI)的途径。全新的现成大型语言模型(LLM)蓝图将帮助客户基于自身数据和企业环境,安全可控地使用生成式AI。
Cloudera使客户能够在私有云和公有云环境中管理并挖掘数据的价值。Cloudera开放式湖仓一体将数据仓库和数据湖的功能相结合,为商业智能、人工智能和机器学习解决方案赋能。企业可以灵活地在其选择的私有云和公有云中部署这些解决方案,并获得相同的体验。
The Futurum Group首席执行官兼首席分析师Daniel Newman表示:“Cloudera开发了一流的混合开放式湖仓一体解决方案,目前为客户管理2500万兆字节(TB)的数据,这与超大规模服务商不相上下。无论数据位于何处,Cloudera都可以凭借其得天独厚的优势,帮助企业挖掘数据价值。同时,这些数据能够用于AI,让企业从当前和未来的AI发展中获益。”
Cloudera大中华区副总裁王刚表示:“管理这些海量数据使 Cloudera 处于无与伦比的地位,能够在企业环境中基于开放式湖仓一体驱动生成式 AI 应用。生成式 AI 和大型语言模型的效果取决于它们所接受的训练数据,并且它们需要正确的语境。这些模型和AI要取得成功,就需要得到信任,而信任 AI 始于信任数据。”
在各行业的大型跨国企业中,平均有90%的企业选择Cloudera管理他们的数据资产。目前, Cloudera解决方案管理的数据量突破了2500万TB。
企业数据加持的大型语言模型助力实现AI普及
为了进一步挖掘客户数据的价值并实现可信、安全和负责任的企业级AI,Cloudera的企业数据增强大型语言模型聊天机器人(LLM Chatbot Augmented with Enterprise Data)为企业带来了基于大型语言模型的生成式AI蓝图。虽然公开可用的AI服务对企业很有吸引力,但他们需要在合适的情境中基于自身专有数据构建交互体验,并且不与外部服务共享他们的数据。借助Cloudera的解决方案,企业可以通过由他们所选择的开源大型语言模型(LLM),使用内部数据构建AI应用,为数据科学家、机器学习团队以及所有开发人员和业务线提供支持,真正实现AI普及。
最近,Cloudera帮助东南亚第二大金融服务集团华侨银行在整个企业内大规模整合AI应用,从而推动客户创新并提高运营效率。华侨银行能够通过分析与销售、服务等相关客户对话中的实时情境数据增加营收。
此外,上海浦东发展银行通过运用大数据、云计算、机器学习(ML)、人工智能(AI)等金融科技手段为其经营管理和商业模式的转变夯实技术基础。通过建立一个由Cloudera支持的现代化数据平台,浦发银行提升了数据处理能力和效率。
Cloudera继续投资于推动AI应用的创新
王刚表示:“人工智能市场瞬息万变,然而不变的是任何大型语言模型或AI模型的成功都需要数据和企业情境。多年来,Cloudera一直在帮助企业挖掘AI/ML中的价值。我们将继续创新并大力投资于我们的整个产品套件,让客户能够从可信、安全和负责任的AI应用中受益。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。