Oracle 宣布推出 Oracle 云基础设施远程软件服务(Oracle Cloud Infrastructure,OCI)Generative AI 服务 以及其它创新功能,助力企业更轻松地利用生成式 AI 方面的新技术。OCI Generative AI 服务是一项全面托管服务,可无缝集成 Cohere 和 Meta Llama 2 的大型语言模型 (LLM),有效解决各种业务用例。OCI Generative AI 服务如今包括了可支持超过 100 种语言的多语言功能、升级版 GPU 集群管理体验以及灵活的微调选项。客户可以在 Oracle Cloud 和本地环境中通过 OCI Dedicated Region使用 OCI Generative AI 服务。
甲骨文公司云基础设施 AI 和数据管理高级副总裁 Greg Pavlik 表示:“Oracle 的 AI 重点专注于解决现实世界的业务用例,推动企业广泛采用 AI 技术。为此,我们正在将生成式 AI 集成到我们的应用和融合数据库中,并提供新的 LLM 和托管服务,从而将 AI 嵌入到技术堆栈的每一层,这些都由快速且经济高效的 AI 基础设施提供支持。不同于提供需要组装的工具包,我们选择提供一整套强大的预构建生成式 AI 服务和功能,这些服务和功能可以协同工作,帮助客户更智能、更快地解决业务问题。”
简化生成式 AI 模型的定制
为了帮助客户解决文本生成、汇总和语义相似性任务方面的业务问题, Cohere 和 Meta Llama 2 的新模型将通过托管服务提供,并支持 API 调用。此外,客户将能够轻松、安全地将生成式 AI 嵌入到技术堆栈中,并实现严格的数据安全保护和治理。
客户可以使用自己的数据和检索增强生成 (RAG) 技术进一步完善这些模型,从而确保模型能够适应相关企业的内部运作需求。现在,OCI Generative AI Agents 服务测试版自带 RAG agent,结合了基于 OCI OpenSearch 的 LLM 和企业搜索的双重功能,可根据企业数据提供情境化结果。借助agent,用户能够使用自然语言与各种企业数据源交互,而无需掌握相关的专业技能。检索结果显示的是当前信息(即使是基于动态数据存储也一样),并提供原始源数据的参考资料。
初始测试版支持 OCI OpenSearch。未来即将推出的其它版本将支持更多数据搜索和整合工具,并支持通过 AI Vector Search 访问 Oracle Database 23c 以及通过 Vector Store 访问 MySQL HeatWave。Oracle 还将在 SaaS 应用套件(包括 Oracle Fusion Cloud Applications Suite、Oracle NetSuite 以及 Oracle Health 等其它行业应用)中提供预构建的agent操作。
IDC 全球 AI 和自动化研究实践团队副总裁兼全球 AI 研究主管 Ritu Jyoti 表示:“Oracle 会将生成式 AI 引入客户工作负载及其数据,而不是要求客户将数据迁移到单独的向量数据库。从自治数据库(Autonomous Database) 到 Fusion SaaS 应用,整个 Oracle 生态系统都集成了通用的生成式 AI 架构,Oracle 正在将生成式 AI 引入云数据中心和本地环境中,而 EB 级的客户数据正是存放在这些环境中。这将大大简化企业在现有业务运营中部署生成式 AI 的流程。”
在 Oracle 堆栈的每一层嵌入生成式 AI
Oracle 的 AI 基础设施和全面的云技术应用组合形成了值得客户信赖的强大组合。Oracle 将生成式 AI 集成到云技术应用组合(包括 ERP、HCM、SCM 和 CX)中,帮助客户在现有业务流程中充分利用新创新。此外,Oracle 还将生成式 AI 功能嵌入到数据库组合中,帮助客户构建自己的 AI 应用。借助 Autonomous Database Select AI,客户可以将私有企业数据与生成式 AI 的生产力和创造力相结合,从而加速应用开发或创建新的业务解决方案。
Oracle 也在积极扩展 OCI Data Science 的功能,让客户能够使用开源库(例如 Hugging Face 的 Transformers 或 PyTorch)构建、训练、部署和管理 LLM。全新的 OCI Data Science AI Quick Actions 功能测试版将于下个月发布,支持对各种开源 LLM(包括 Meta 或 Mistral AI 等主流提供商)进行无代码访问。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。