Gartner于近日最新发布2024年中国数据、分析和人工智能技术成熟度曲线,该曲线显示,未来两到五年,大量具有颠覆性或较高影响力的创新技术可能会实现主流采用。其中AI相关的创新包括复合型AI、决策智能、国产AI芯片、LLM和多模态GenAI。
Gartner研究总监闫斌表示:“到2027年,超过60%的企业机构将把AI素养纳入数据和分析战略,而目前这一比例还不到 5%。到2028年,50%构建于2023年之前的中国数据和分析平台,将因为与生态系统脱钩而过时。 到2028年,30%的企业机构将把数据变现或数据入表纳入其数据战略。”
(图一、2024年中国数据、分析和人工智能技术成熟度曲线)
与AI相关的几项创新技术
复合型AI
复合型AI是指组合利用(或融合)不同AI技术来提高学习效率、生成层次更丰富的知识表示。复合型AI提供了更丰富的AI抽象机制,并最终提供了一个能够以更有效方式解决更广泛业务问题的平台。复合型AI可为中国企业带来两大益处。第一,将AI的力量推广至无法访问大量历史或标签数据、但拥有大量人类专业知识的企业机构。第二,扩大AI应用的范围,提升此类应用的质量,这也意味着能够应对更多类型的推理挑战。根据所应用的具体技术,还可产生其他一系列益处,包括提高可解释性、韧性,以及支持增强智能。
国产AI芯片
由于美国对高性能AI芯片的限制,中国企业不得不自行研发AI芯片,以满足本土AI快速发展的需求。
最新的生成式人工智能(GenAI)技术需要使用数千个AI加速器来训练基础模型和支持推理工作负载。由于先进制造工艺的限制,国产AI芯片的性能落后于全球领先供应商产品的性能。因此,中国企业需要对AI基础设施进行更多投资。IT领导者应将重点放在AI应用上,而不是使用针对推理工作负载优化的国产AI芯片来训练基础模型上。
LLM
大语言模型(LLM)是一种使用大量无标签文本数据进行训练的AI基础模型。借助大语言模型,应用可以完成一系列任务,包括回答问题、内容生成、内容摘要、检索增强生成 (RAG)、代码生成、语言翻译和会话聊天。
此类模型拥有广泛的应用场景,包括文本生成、问答系统构建、文档总结和分类、文本翻译和编辑等。
多模态GenAI
多模态生成式人工智能(GenAI)能够在生成式模型中组合利用多种类型的数据输入和输出,例如图像、视频、音频、文本和数值型数据。多模态功能允许模型与不同模态下的输出进行交互,并生成相应的输出,有效提升了GenAI的可用性。
多模态GenAI支持添加以往难以实现的新特性和功能,将对企业应用产生颠覆性影响。目前,多模态模型通常仅限于两种或三种模态,但未来几年内,将涵盖数量更多 的模态。
好文章,需要你的鼓励
随着AI模型参数达到数十亿甚至万亿级别,工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题:输入和数据压缩技术可将模型压缩50-60%;稀疏性方法通过关注重要区域节省资源;调整上下文窗口减少系统资源消耗;动态模型和强推理系统通过自学习优化性能;扩散模型通过噪声分析生成新结果;边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。
清华大学团队开发了CAMS智能框架,这是首个将城市知识大模型与智能体技术结合的人类移动模拟系统。该系统仅需用户基本信息就能在真实城市中生成逼真的日常轨迹,通过三个核心模块实现了个体行为模式提取、城市空间知识生成和轨迹优化。实验表明CAMS在多项指标上显著优于现有方法,为城市规划、交通管理等领域提供了强大工具。
Meta以143亿美元投资Scale AI,获得49%股份,这是该公司在AI竞赛中最重要的战略举措。该交易解决了Meta在AI发展中面临的核心挑战:获取高质量训练数据。Scale AI创始人王亚历山大将加入Meta领导新的超级智能研究实验室。此次投资使Meta获得了Scale AI在全球的数据标注服务,包括图像、文本和视频处理能力,同时限制了竞争对手的数据获取渠道。
MIT研究团队发现了一个颠覆性的AI训练方法:那些通常被丢弃的模糊、失真的"垃圾"图片,竟然能够训练出比传统方法更优秀的AI模型。他们开发的Ambient Diffusion Omni框架通过智能识别何时使用何种质量的数据,不仅在ImageNet等权威测试中创造新纪录,还为解决AI发展的数据瓶颈问题开辟了全新道路。