新技术的出现要回答的问题不是技术本身,而是技术可以给用户带来什么,这是甲骨文一直所倡导的。
所以今年甲骨文全球云大会2023(Oracle CloudWorld 2023)在数据库和云的双引擎基础上,甲骨文又加入了“人工智能”这个新成员,将三者结合在一起提供给客户,成为甲骨文独有的特色。
甲骨文公司副总裁及中国区董事总经理吴承杨表示,只有把云、数据、人工智能融合在一起,才能给用户提供改变生活、工作的能力,帮助企业进行变现。
甲骨文公司副总裁及中国区董事总经理吴承杨
独一无二的优势“向量数据库”
Oracle Database 23c的代码名称为“App Simple”,今年23c的更新也延续了这一愿景,简化了所有应用和分析的生成与运行。
今年更加强调“生成”的重要性,让数据库借助生成式AI,进一步简化开发者的开发,能够做到低代码、无代码开发的模式,可以让Oracle数据库自动地生成应用以及SQL。
今年Oracle Database 23c推出了超过300项新功能,像True Cache、JSON关系二元性 (JSON Duality)的能力,Globally Distributed Database用Raft协议做分布式数据库。
其中AI相关的更新,不能不提到集成向量数据库,把集成式AI的能力转换成向量搜索的能力加载在Oracle数据库里。这个功能集合称为 AI 向量的语义搜索功能(AI Vector Search),包括新的向量数据类型、向量索引和向量搜索 SQL 运算符,使Oracle数据库能够将文档、图像和其他非结构化数据的语义内容储存为向量,并以此快速运行相似性查询。
这些新功能还支持创新性的生成式AI技术Retrieval Augmented Generation (RAG),将大型语言模型 (LLM) 和私有商业数据相结合,以回答自然语言问题。RAG提供更高的准确性,并通过将私有数据包含在LLM培训数据中来避免泄露私有数据。
随着生成式AI的火爆,向量数据库作为处理非结构化数据的关键工具也受到了关注。因为模型在处理非结构化数据和进行复杂的机器学习任务时,需要大量的向量数据。
“Oracle向量数据库达成了整个企业级数据的能力,其可以利用Oracle整个数据库。”甲骨文公司中国区技术咨询部高级总监李珈说,整合是非常重要的一件事,因为通过私有数据训练能够达到更好的安全性,这也是甲骨文独一无二的优势。
甲骨文公司中国区技术咨询部高级总监李珈
比如在Oracle 向量数据库里面有非常多的向量数据,想要在这些数据中快速找出跟你所拍房屋图片比较近似的图片,我们需要关注距离、价格、城市等,这些内容都存在Oracle向量数据库中。
“五行代码就可以得出来有商业价值的数据,这就是Oracle向量数据库所独有的能力。”李珈说。
构建更智能的云未来
2022年,一年一度的Oracle OpenWorld改成Oracle CloudWorld,可以看出云已经成为Oracle的创新底座,Oracle Cloud Infrastructure (OCI) 到今天已经有七个年头,走入成熟期。
到2023年10月份为止,Oracle OCI在全球已有46个公有云区域,有12个是与Azure直接连在一起的。应用程序可以运行在Azure上,数据库可以运行在Oracle OCI上,通过高速链接实现业务跨云运行,这也是其最具特色的一点。
吴承杨看到企业对公有云主要有三个需求,第一,安全性;第二,性价比;第三,自由、多云策略,这些都是OCI所能提供的。
OCI是通过统一的架构支撑基础设施,基础设施支撑整个云原生应用,也支撑Oracle Fusion Cloud ERP, Oracle Fusion Cloud HCM等企业级应用,以及各种行业应用。
此次OCW,Oracle还宣布推出OCI Generative AI(生成式AI服务),OCI Generative AI服务是一个由OCI与知名企业AI平台Cohere合作构建的托管服务,可帮助用户通过可用的API将LLM集成到自己的应用中去。
OCI Generative AI服务和Cohere模型可与AI Vector Search无缝运行。同时服务还将为嵌入到Oracle SaaS应用套件中的生成式AI功能奠定基础,其中包括Oracle Fusion Cloud Applications Suite、Oracle NetSuite和Oracle Cerner等行业应用。
“OCI运行AI工作负载方面拥有独特的优势。”吴承杨说,OCI可以提供高性能和低成本的 GPU集群,每个集群的规模可以达到16000颗 NVIDIA H100 GPU,基于RDMA的超级集群,充分保证低延迟和高带宽。
甲骨文公司中国区技术咨询部高级总监嵇小峰也谈到了ARM机型的推广,现在已发布的是基于Ampere Altra的A1机型,ARM的好处是成本相比X86更低,指令集能耗更低,颗粒密度较高,占地面积和机架消耗量较小。
甲骨文公司中国区技术咨询部高级总监嵇小峰
目前很多OCI服务以及Oracle Fusion应用是基于ARM进行提供。嵇小峰介绍,基于AmpereOne芯片的OCI A2机型即将上线,其相比X86的性价比提升44%,VM达到156 core,如果是裸金属(Bare Metal)的机器,会达到320 core。
“不管是向量数据库还是大语言模型,甲骨文想的是怎么把这些新技术融合起来给最终用户带来价值,这是我们想做的事情。”吴承杨说。
好文章,需要你的鼓励
自2022年底生成式AI革命爆发以来,服务器支出也存在类似的态势。一旦企业发现自己必须投资购置或者租用搭载GPU加速器的设备,往往会选择扩展现有服务器机群,被用于投资新设备的支出则自然随之下降。英特尔正在加大对其“Sapphire Rapids”至强SP的投入,AMD在其“Genoa”Epyc 9004处理器上也采取了同样的做法。
生成式人工智能在企业中的一个突出用例就是客户服务和支持。大多数读者可能都曾作为客户经历过与传统自动客服系统打交道的沮丧。但这种情况正在发生变化,这要归功于时下强大的大型语言模型和自然语言聊天机器人。虽然有报告显示,我们在处理复杂或敏感的咨询时仍然更愿意与人类交谈,但在提供简单的帮助时,机器人的能力已经越来越强了。
从电子商务到非营利组织,利用企业数据资产可能是组织成败的关键。机器学习和生成式AI是其中的一个组成部分,但要成功地应用这些技术则评估AI对业务的实际影响。
在对生成式AI进行了近两年的试验之后,许多IT领导者已经准备好扩大规模了。然而,在此之前,他们需要重新考虑数据管理问题。