最近,腾讯元宝豪掷3亿,让元宝成为“满血版DeepSeek”代言人,在iOS App Store 免费榜排名迅速跃升至第2名,仅次于DeepSeek。一时间,一场DeepSeek运动正在兴起,所有产品都纷纷接入,企业级也不例外,软件、一体机、云等等。
由于企业场景不像普通人问问题,所以在部署上还需要整体考虑,云端采用全托管式部署可能是一个好的选择。因为在云端企业不需要任何复杂的技术设置、也不用担心算力够不够、更不用对数据是否安全及合规产生顾虑。
在之前,亚马逊云科技的用户就已经可以在Amazon Bedrock和Amazon SageMaker AI中,通过4种模式轻松部署DeepSeek-R1系列模型。3月11日,亚马逊云科技在Amazon Bedrock又上线了,完全托管的满血版DeepSeek-R1,企业部署将更加简单。
云上完全托管的满血版DeepSeek-R1已就位
亚马逊云科技率先推出完全托管的满血版DeepSeek-R1模型服务,成为首家提供该服务的云服务提供商。这进一步扩展了客户在Amazon Bedrock平台上使用DeepSeek-R1模型及其蒸馏版本的方式。
无论企业规模大小或技术能力高低,均可在Amazon Bedrock中无缝接入完全托管、无服务器的DeepSeek-R1模型,轻松实现企业级部署。
云端部署的优势在Amazon Bedrock中得到了充分体现。Amazon Bedrock不仅能够处理复杂问题、编写代码、处理和分析数据,还消除了复杂的设置和运维负担,使企业能够专注于核心业务。
此外,Amazon Bedrock还提供了强大的安全保障,包括数据加密和严格的访问控制,确保数据隐私与合规性。企业可以完全掌控自身数据,并通过设置Amazon Bedrock Guardrails等保护措施,有效检测和防止模型生成错误内容,进一步提升数据安全性。
亚马逊云科技生成式AI副总裁Vasi Philomin表示,借助完全托管的实现方式,客户能够以无服务器按token付费的模式使用该模型,帮助他们无需管理任何基础设施即可实现从实验到生产的规模扩展。
所以如果你还没有行动起来,那就来试试亚马逊云科技提供的DeepSeek-R1最佳,也是最省心的打开方式。
Amazon Bedrock中全托管的DeepSeek-R1
幻觉对抗、安全合规一切都不在话下
当然,我们知道企业级AI是不能容忍幻觉存在,但DeepSeek-R1的幻觉率却高达14.3%,Amazon Bedrock的Guardrails安全防护栏功能将扫清这一问题。
Amazon Bedrock Guardrails提供了多种配置防护策略,包括内容过滤、主题过滤、词汇过滤、敏感信息过滤,以及上下文基础检查等多个方面,可调节有害内容的过滤强度类别,限制特定主题以防止查询和响应中出现未经授权的主题,屏蔽特定的词汇,阻止个人信息查询等。
除了安全防护栏,Amazon Bedrock Guardrails还提供自动推理功能,进一步检查因模型幻觉而导致的事实性错误,通过运用数学逻辑方法来验证内容的正确性。尤其在主题广泛且复杂、并有一套明确定义的业务规则或知识体系的领域,自动推理检查功能表现出色。
“事实性错误通过人工不难发现,因为它是明确的对错问题。“亚马逊云科技大中华区产品部总经理陈晓建谈到,以前大模型缺乏可证明事实的逻辑,导致出现幻觉时难以纠正,但有了自动推理技术,我们能够通过数学验证方式严密证明事实性错误是否会发生,从而有效改善幻觉问题。
生成式AI的安全问题可不止有害内容和幻觉,亚马逊云科技还将广泛的安全、合规服务与Amazon Bedrock进行集成,提供全面的安全防护,包括静态数据和传输中数据加密、细粒度访问控制、安全连接选项以及各种合规认证。例如:通过Amazon KMS密钥管理服务对静态数据和传输中数据进行加密;通过Amazon IAM进行细粒度的身份与访问管理;通过Amazon Network Firewall网络防火墙服务来实现网络安全;提供包括HIPAA、ISO、GDPR在内的国际主流合规认证;通过Amazon CloudWatch和Amazon CloudTrail进行监控和日志记录等。
有了Amazon Bedrock,部署生成式AI你还愁什么
虽然DeepSeek帮企业把成本给打下来,但企业级仅依赖单一模型是远远不够的。Amazon Bedrock不仅支持DeepSeek,同时还可以提供业内最领先的模型。
亚马逊云科技始终认为 “一个基础模型(FM)无法满足所有需求”,不同的模型有不同的用途。随着新模型的持续涌现,亚马逊云科技希望在新模型可用时,能让客户尽快切换过去,并能够针对特定用例进行实验和比较模型性能,选择最适合其应用场景的模型。
通过API调用,Amazon Bedrock提供了来自如AI21 Labs、亚马逊、Anthropic、Cohere、Luma AI、Meta、Mistral AI、Stability AI、DeepSeek的高性能基础模型可供企业选择。
同时,在2024 re:Invent上,亚马逊云科技还推出了全新的Amazon Bedrock Marketplace功能,这里提供了100多个热门、新兴及专业模型的访问权限,客户可根据自身用例找到最合适的模型组合。此外,客户还可以通过自定义模型导入功能将其专有模型引入Amazon Bedrock。
此外,Amazon Bedrock的模型评估功能,使客户可以更快为其应用场景选择最合适的模型,让评估模型的时间从几个星期缩短到几个小时,更快地推出新的应用程序并改善用户体验。
Amazon Bedrock还拥有多智能Agents协作功能,让企业能够轻松构建和协调专业智能体来执行更加复杂的工作流程。用户可以为不同的特定任务创建专用智能体,还可以创建一个主管智能体来管理整个项目。
随着Amazon Bedrock的能力逐步扩展,客户构建生成式AI的速度也正在被不断加快。,Amazon Bedrock正为企业提供一个强大且全面的平台,助力其在AI驱动的未来中保持竞争力并实现持续创新。
所以你还不快来试试吗?
好文章,需要你的鼓励
华中科技大学与利哈伊大学研究团队开发的MMMR基准是首个专门评估多模态大语言模型推理思考过程的综合工具。通过1,083个跨六大领域的高难度推理任务和创新的推理过程评估管道,研究发现即使最先进的模型在推理任务上也与人类存在约10%的差距。研究揭示了答案准确性与推理质量间的脱节:模型常出现思考不一致(41.5%)、过度思考(20.5%)等问题。这一基准不仅评估答案正确性,更深入分析思考质量,为提升AI系统的可靠性和透明度提供了重要方向。
UI-Genie是一个创新的自我改进框架,解决了GUI智能体面临的两大挑战:轨迹验证困难和高质量训练数据缺乏。研究团队开发了专用奖励模型UI-Genie-RM,采用图像-文本交错架构有效处理历史上下文,并统一了步骤级和任务级奖励评估。通过精心设计的数据生成策略和迭代自我改进,该框架无需人工标注即可创建高质量合成轨迹。实验结果显示,经过三轮数据-模型自我改进后,UI-Genie在多个基准测试上达到了最先进水平。该研究已开源全部实现和数据集,为GUI智能体研究提供重要资源。
浙江大学和蚂蚁集团的研究团队开发了ACTIVE-O3,一种创新框架,赋予多模态大语言模型"主动感知"能力,使AI能够智能地决定"看哪里"和"怎么看"。基于群体相对策略优化(GRPO)构建,该系统采用两阶段策略,先选择关注区域,再执行任务。实验表明,ACTIVE-O3在小物体检测、密集物体定位和交互式分割等任务上显著优于现有方法,并展示出强大的零样本推理能力。该研究为AI系统提供了更接近人类认知的视觉探索能力,对自动驾驶、医疗诊断等领域具有重要应用价值。
ImgEdit是北京大学与兔小贝AI联合推出的图像编辑框架,解决了开源编辑模型落后于商业产品的问题。该框架包含120万对高质量编辑图像对,涵盖13种编辑类型和11万个多轮交互样本。通过融合视觉语言模型、检测模型和分割模型的多阶段流程,ImgEdit确保了数据的高质量性。研究团队基于此数据集训练了ImgEdit-E1模型,并提出ImgEdit-Bench评估基准,从指令遵循、编辑质量和细节保留三个维度全面评估模型性能。实验结果显示,ImgEdit-E1在多个任务上超越现有开源模型,推动了图像编辑技术的进步。