人工智能(AI)软件是中国企业投资和关注的重点。中国的AI软件市场在持续快速增长,竞争非常激烈。AI软件企业使用一种或多种AI技术(见图1),帮助企业解读事件、完成决策支持和自动化,以及采取相应行动。这些厂商的解决方案,可以解决AI价值链部分或整个生命周期的需求,包括构思、用例发现、数据收集、数据增强、AI开发,以及AI部署、监控和校准。
图1:Gartner人工智能技术框架
从图2可见,中国AI软件市场的未来受到三种关键力量的影响:
图2:影响中国AI软件市场未来的三种关键力量
相关法规会推动市场的可持续发展
AI已成为中国的一项国家战略,其目的在于促进经济发展、增强社会治理。考虑到监管环境,做好数据隐私、AI伦理和可解释型AI是成功的要点。相关法规也会推动整个AI行业的变化,使其以可持续、更健康的方式发展。
中国政府制定的一项指导方针指出,数据是继土地、劳动力、资本和技术之后的第五生产要素。为支持国家层面的AI发展计划,数据和分析领导者需要优先改善数据交换、数据质量和数据治理,加快培育数据市场。对专注于数据集成、数据标注和注记的厂商而言,这一指导方针意味着AI价值链上会产生更多的机会。
2022年2月正式启动的东数西算工程,会大幅提升算力的使用效率,满足AI的发展需求。
“本地化”需求会推动AI软件市场的差异化
多种细分业务应用开始嵌入AI功能,导致市场中发展出两类智能应用。其中,一类智能应用来自于国内传统软件厂商,这些厂商会受益于本地化。另一类智能应用,来自于专注特定领域或垂直行业的厂商。随着使用软件本地化程度的提高,预计未来会有更多中国客户使用上述解决方案,这些方案在各垂直行业中会逐渐成熟。
多样化企业需求会催生出更丰富的AI交付方式
在数字化转型中,企业机构逐渐成熟,需要借助更多的数据和背景信息来做出有益的成果驱动决策。越来越多的中国企业机构,希望AI投入能快速创造价值。业务环境日益复杂,意味着中国企业机构需要使用多种传统和先进AI技术,调整决策流程、获取竞争优势。
中国的AI软件市场增长迅速、竞争激烈
中国的AI软件市场仍将保持快速增长。Gartner预测,该市场未来五年营收将从47.67亿美元增长到138.58亿美元,年复合增长率(CAGR)将达到28%。
中国的AI软件市场中有3,000余家厂商,其中大部分属于AI多面手型厂商,可向客户独立提供自然语言处理(NLP)、计算机视觉(CV)和机器学习(ML)技术。这些厂商提供端到端个性化增强服务、咨询服务和运营服务,解决客户的具体业务问题。随着市场的持续扩张,中国AI软件公司的数量也会增长。
市场主体从AI多面手转变为AI技术专业软件提供商
图3展示了中国AI软件市场的变化趋势:该市场供应商以往面向通用需求,现在逐渐转变为面向细分需求。
图3:中国AI软件市场变化趋势
数据和分析领导者需要将热炒的“AI中台”概念转化为策略性解决方案
目前而言,AI价值的发挥,大多源自一次性的点对点解决方案。在2022年CIO和技术高管调研中,只有4%的中国受访者部署了MLOps。
中台的热度很高,不同厂商在营销中使用的定义五花八门。“AI中台”即是很多解决方案推销中产生的概念。中国的数据和分析领导者需要以清醒的眼光看待AI中台,在实验和运营中专注于可复用的AI工件,包括数据、模型和实施管道。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。