过去一年,生成式人工智能(GenAI)的采用率呈爆炸式增长。2023年Gartner企业机构AI调研发现,GenAI是受访企业部署最广泛的AI技术之一。企业机构在多个业务部门的多种用例中部署了GenAI。尽管这一快速部署前景广阔,但也带来了由于过度聚焦于GenAI而导致AI领域其他应用被忽视的风险。而实际上,GenAI仅占AI版图的一小部分。与此同时,GenAI也不是万灵丹,对于大多数AI用例来说,往往并不适用。此外,许多业务问题需要结合使用不同的AI技术来解决。
因此,企业IT领导者应当充分评估GenAI是否适用于企业用例、何时应考虑其他AI技术,以及何时应将其他AI技术与GenAI结合使用。
评估GenAI是否适用于企业用例
是否应使用GenAI模型,需要具体情况具体分析。无论考虑使用哪种AI技术,第一步都要确定用例本身具备的价值和可行性。目前,GenAI模型并不适合单独用于预测和预报、规划和优化、决策智能和自治系统等类别中的用例。GenAI可能不适合企业用例的更主要的原因是,GenAI带来的风险是不可接受的,并且无法有效缓解。GenAI的特定风险包括输出不可靠、数据隐私、知识产权、责任、网络安全和监管合规。每个用例都需要考虑这些因素。
IT领导者可以在使用Gartner的AI棱镜等优先级排序工具对用例进行优先级排序后,将这些用例与图1中的相关用例类别相对应,对每个类别可使用的GenAI模型目前的实用性进行评级。
图1:用例类别与生成式模型的相对实用性
考虑可替代GenAI的其他AI技术
现有和成熟AI技术的注意力被GenAI分散;而实际上,其他AI技术或技术组合,可能才最适合用于支持特定用例。
企业IT领导者可以使用图2判断企业用例的相关类别,并且了解当前最适用于此类用例的替代AI技术。图2介绍了一些应用最为广泛的AI技术(包括非生成式机器学习、优化、模拟、基于规则的系统和图谱等),就给定用例中用作主要技术的各种AI替代方案的潜在实用性提供了指导意见。
图2:AI技术热图
对于许多用例来说,这些替代技术比GenAI模型更有效、更可靠、更易于理解。对于特定用例来说,考虑可解释性、性能和可靠性方面的需要十分重要。GenAI模型往往比其他技术更不可靠、更难以解释。一开始先尝试使用更简单的替代AI技术可能是个好主意,因为风险和成本更低,且更容易理解。
结合使用GenAI模型与其他AI技术
AI技术并非互不兼容;这些技术往往可以结合使用,构成更为强大的整体系统。一方面,与更稳定可靠的技术相结合,有助于应对GenAI模型的一些局限性——缺乏鲁棒性、信息不准确和产生幻觉等。另一方面,GenAI模型可以成为成熟技术的额外补充。GenAI模型发挥作用的普遍方式是作为与其他AI/软件系统的自然语言接口。与此类似,GenAI可用于开发之后可在非生成式机器学习模型中使用的功能。
AI技术的潜在组合方式不胜枚举。能够结合使用合适AI技术的企业具有独特优势,可构建更精确、更透明、性能更好的AI系统,同时还能降低成本和减少对数据的需求。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。