Gartner于近日最新发布2024年中国数据、分析和人工智能技术成熟度曲线,该曲线显示,未来两到五年,大量具有颠覆性或较高影响力的创新技术可能会实现主流采用。其中AI相关的创新包括复合型AI、决策智能、国产AI芯片、LLM和多模态GenAI。
Gartner研究总监闫斌表示:“到2027年,超过60%的企业机构将把AI素养纳入数据和分析战略,而目前这一比例还不到 5%。到2028年,50%构建于2023年之前的中国数据和分析平台,将因为与生态系统脱钩而过时。 到2028年,30%的企业机构将把数据变现或数据入表纳入其数据战略。”
(图一、2024年中国数据、分析和人工智能技术成熟度曲线)
与AI相关的几项创新技术
复合型AI
复合型AI是指组合利用(或融合)不同AI技术来提高学习效率、生成层次更丰富的知识表示。复合型AI提供了更丰富的AI抽象机制,并最终提供了一个能够以更有效方式解决更广泛业务问题的平台。复合型AI可为中国企业带来两大益处。第一,将AI的力量推广至无法访问大量历史或标签数据、但拥有大量人类专业知识的企业机构。第二,扩大AI应用的范围,提升此类应用的质量,这也意味着能够应对更多类型的推理挑战。根据所应用的具体技术,还可产生其他一系列益处,包括提高可解释性、韧性,以及支持增强智能。
国产AI芯片
由于美国对高性能AI芯片的限制,中国企业不得不自行研发AI芯片,以满足本土AI快速发展的需求。
最新的生成式人工智能(GenAI)技术需要使用数千个AI加速器来训练基础模型和支持推理工作负载。由于先进制造工艺的限制,国产AI芯片的性能落后于全球领先供应商产品的性能。因此,中国企业需要对AI基础设施进行更多投资。IT领导者应将重点放在AI应用上,而不是使用针对推理工作负载优化的国产AI芯片来训练基础模型上。
LLM
大语言模型(LLM)是一种使用大量无标签文本数据进行训练的AI基础模型。借助大语言模型,应用可以完成一系列任务,包括回答问题、内容生成、内容摘要、检索增强生成 (RAG)、代码生成、语言翻译和会话聊天。
此类模型拥有广泛的应用场景,包括文本生成、问答系统构建、文档总结和分类、文本翻译和编辑等。
多模态GenAI
多模态生成式人工智能(GenAI)能够在生成式模型中组合利用多种类型的数据输入和输出,例如图像、视频、音频、文本和数值型数据。多模态功能允许模型与不同模态下的输出进行交互,并生成相应的输出,有效提升了GenAI的可用性。
多模态GenAI支持添加以往难以实现的新特性和功能,将对企业应用产生颠覆性影响。目前,多模态模型通常仅限于两种或三种模态,但未来几年内,将涵盖数量更多 的模态。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。