Oracle 宣布推出 Oracle 云基础设施远程软件服务(Oracle Cloud Infrastructure,OCI)Generative AI 服务 以及其它创新功能,助力企业更轻松地利用生成式 AI 方面的新技术。OCI Generative AI 服务是一项全面托管服务,可无缝集成 Cohere 和 Meta Llama 2 的大型语言模型 (LLM),有效解决各种业务用例。OCI Generative AI 服务如今包括了可支持超过 100 种语言的多语言功能、升级版 GPU 集群管理体验以及灵活的微调选项。客户可以在 Oracle Cloud 和本地环境中通过 OCI Dedicated Region使用 OCI Generative AI 服务。

甲骨文公司云基础设施 AI 和数据管理高级副总裁 Greg Pavlik 表示:“Oracle 的 AI 重点专注于解决现实世界的业务用例,推动企业广泛采用 AI 技术。为此,我们正在将生成式 AI 集成到我们的应用和融合数据库中,并提供新的 LLM 和托管服务,从而将 AI 嵌入到技术堆栈的每一层,这些都由快速且经济高效的 AI 基础设施提供支持。不同于提供需要组装的工具包,我们选择提供一整套强大的预构建生成式 AI 服务和功能,这些服务和功能可以协同工作,帮助客户更智能、更快地解决业务问题。”
简化生成式 AI 模型的定制
为了帮助客户解决文本生成、汇总和语义相似性任务方面的业务问题, Cohere 和 Meta Llama 2 的新模型将通过托管服务提供,并支持 API 调用。此外,客户将能够轻松、安全地将生成式 AI 嵌入到技术堆栈中,并实现严格的数据安全保护和治理。
客户可以使用自己的数据和检索增强生成 (RAG) 技术进一步完善这些模型,从而确保模型能够适应相关企业的内部运作需求。现在,OCI Generative AI Agents 服务测试版自带 RAG agent,结合了基于 OCI OpenSearch 的 LLM 和企业搜索的双重功能,可根据企业数据提供情境化结果。借助agent,用户能够使用自然语言与各种企业数据源交互,而无需掌握相关的专业技能。检索结果显示的是当前信息(即使是基于动态数据存储也一样),并提供原始源数据的参考资料。
初始测试版支持 OCI OpenSearch。未来即将推出的其它版本将支持更多数据搜索和整合工具,并支持通过 AI Vector Search 访问 Oracle Database 23c 以及通过 Vector Store 访问 MySQL HeatWave。Oracle 还将在 SaaS 应用套件(包括 Oracle Fusion Cloud Applications Suite、Oracle NetSuite 以及 Oracle Health 等其它行业应用)中提供预构建的agent操作。
IDC 全球 AI 和自动化研究实践团队副总裁兼全球 AI 研究主管 Ritu Jyoti 表示:“Oracle 会将生成式 AI 引入客户工作负载及其数据,而不是要求客户将数据迁移到单独的向量数据库。从自治数据库(Autonomous Database) 到 Fusion SaaS 应用,整个 Oracle 生态系统都集成了通用的生成式 AI 架构,Oracle 正在将生成式 AI 引入云数据中心和本地环境中,而 EB 级的客户数据正是存放在这些环境中。这将大大简化企业在现有业务运营中部署生成式 AI 的流程。”
在 Oracle 堆栈的每一层嵌入生成式 AI
Oracle 的 AI 基础设施和全面的云技术应用组合形成了值得客户信赖的强大组合。Oracle 将生成式 AI 集成到云技术应用组合(包括 ERP、HCM、SCM 和 CX)中,帮助客户在现有业务流程中充分利用新创新。此外,Oracle 还将生成式 AI 功能嵌入到数据库组合中,帮助客户构建自己的 AI 应用。借助 Autonomous Database Select AI,客户可以将私有企业数据与生成式 AI 的生产力和创造力相结合,从而加速应用开发或创建新的业务解决方案。
Oracle 也在积极扩展 OCI Data Science 的功能,让客户能够使用开源库(例如 Hugging Face 的 Transformers 或 PyTorch)构建、训练、部署和管理 LLM。全新的 OCI Data Science AI Quick Actions 功能测试版将于下个月发布,支持对各种开源 LLM(包括 Meta 或 Mistral AI 等主流提供商)进行无代码访问。
好文章,需要你的鼓励
随着AI广泛应用推动数据中心建设热潮,运营商面临可持续发展挑战。2024年底美国已建成或批准1240个数据中心,能耗激增引发争议。除能源问题外,服务器和GPU更新换代产生的电子废物同样严重。通过采用模块化可修复系统、AI驱动资产跟踪、标准化数据清理技术以及与认证ITAD合作伙伴合作,数据中心可实现循环经济模式,在确保数据安全的同时减少环境影响。
剑桥大学研究团队首次系统探索AI在多轮对话中的信心判断问题。研究发现当前AI系统在评估自己答案可靠性方面存在严重缺陷,容易被对话长度而非信息质量误导。团队提出P(SUFFICIENT)等新方法,但整体问题仍待解决。该研究为AI在医疗、法律等关键领域的安全应用提供重要指导,强调了开发更可信AI系统的紧迫性。
超大规模云数据中心是数字经济的支柱,2026年将继续保持核心地位。AWS、微软、谷歌、Meta、甲骨文和阿里巴巴等主要运营商正积极扩张以满足AI和云服务需求激增,预计2026年资本支出将超过6000亿美元。然而增长受到电力供应、设备交付和当地阻力制约。截至2025年末,全球运营中的超大规模数据中心达1297个,总容量预计在12个季度内翻倍。
威斯康星大学研究团队开发出Prithvi-CAFE洪水监测系统,通过"双视觉协作"机制解决了AI地理基础模型在洪水识别上的局限性。该系统巧妙融合全局理解和局部细节能力,在国际标准数据集上创造最佳成绩,参数效率提升93%,为全球洪水预警和防灾减灾提供了更准确可靠的技术方案。