Gartner于近日最新发布2024年中国数据、分析和人工智能技术成熟度曲线,该曲线显示,未来两到五年,大量具有颠覆性或较高影响力的创新技术可能会实现主流采用。其中AI相关的创新包括复合型AI、决策智能、国产AI芯片、LLM和多模态GenAI。
Gartner研究总监闫斌表示:“到2027年,超过60%的企业机构将把AI素养纳入数据和分析战略,而目前这一比例还不到 5%。到2028年,50%构建于2023年之前的中国数据和分析平台,将因为与生态系统脱钩而过时。 到2028年,30%的企业机构将把数据变现或数据入表纳入其数据战略。”
(图一、2024年中国数据、分析和人工智能技术成熟度曲线)
与AI相关的几项创新技术
复合型AI
复合型AI是指组合利用(或融合)不同AI技术来提高学习效率、生成层次更丰富的知识表示。复合型AI提供了更丰富的AI抽象机制,并最终提供了一个能够以更有效方式解决更广泛业务问题的平台。复合型AI可为中国企业带来两大益处。第一,将AI的力量推广至无法访问大量历史或标签数据、但拥有大量人类专业知识的企业机构。第二,扩大AI应用的范围,提升此类应用的质量,这也意味着能够应对更多类型的推理挑战。根据所应用的具体技术,还可产生其他一系列益处,包括提高可解释性、韧性,以及支持增强智能。
国产AI芯片
由于美国对高性能AI芯片的限制,中国企业不得不自行研发AI芯片,以满足本土AI快速发展的需求。
最新的生成式人工智能(GenAI)技术需要使用数千个AI加速器来训练基础模型和支持推理工作负载。由于先进制造工艺的限制,国产AI芯片的性能落后于全球领先供应商产品的性能。因此,中国企业需要对AI基础设施进行更多投资。IT领导者应将重点放在AI应用上,而不是使用针对推理工作负载优化的国产AI芯片来训练基础模型上。
LLM
大语言模型(LLM)是一种使用大量无标签文本数据进行训练的AI基础模型。借助大语言模型,应用可以完成一系列任务,包括回答问题、内容生成、内容摘要、检索增强生成 (RAG)、代码生成、语言翻译和会话聊天。
此类模型拥有广泛的应用场景,包括文本生成、问答系统构建、文档总结和分类、文本翻译和编辑等。
多模态GenAI
多模态生成式人工智能(GenAI)能够在生成式模型中组合利用多种类型的数据输入和输出,例如图像、视频、音频、文本和数值型数据。多模态功能允许模型与不同模态下的输出进行交互,并生成相应的输出,有效提升了GenAI的可用性。
多模态GenAI支持添加以往难以实现的新特性和功能,将对企业应用产生颠覆性影响。目前,多模态模型通常仅限于两种或三种模态,但未来几年内,将涵盖数量更多 的模态。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。