Gartner《2022年中国信息和通信技术成熟度曲线》报告称,为了创造数字收入和提高运营可持续性,中国企业的首席信息官应该重视以下四个步骤:通过赋能数字业务发现新的机会、利用可组合架构获得以业务为导向的信息和通信技术(ICT)解决方案、提高安全和数据隐私保护以及通过对应用和基础设施进行现代化改造来提高业务敏捷性。
自2021年3月发布“十四五”计划(2021-2025年)以来,中国政府已经出台了多项旨在实现可持续经济增长的新法规和举措。这些举措必将影响到信息和通信技术领域。新技术与实践已成为助推中国企业通过可组合架构实现数字化转型的重要创新引擎。
生产成熟期重点关注实际效益已得到证明和公认的技术。随着越来越多的企业机构对风险下降程度感到满意,技术的采用开始进入到快速增长阶段(见图一)。
图一、2022年中国信息和通信技术成熟度曲线
来源:Gartner(2022年7月)
元宇宙
元宇宙及其基础技术将通过赋能跨行业的用户体验和用例并提供新的创收机会,打破阻碍下一个创新时代到来的瓶颈。
当前互联网的发展正遭遇瓶颈——由于长期缺乏内容、互动、参与和互操作性方面的突破,因此互联网“在增长的过程中无法取得突破性的进展”。元宇宙及其基础技术将通过赋能跨行业的新用户体验、各种不同的用例以及提供新的投资机会,打破阻碍下一个创新时代到来的瓶颈。它们还能让残障人士在数字世界享有平等。
云安全
在中国,云采用率的不断提高给保护企业位于云端的关键数字业务和资产带来了挑战。云安全不同于重视边界的传统保护技术,它要求企业机构与云服务商携手对云资源采取安全控制措施。有效且易管理的云安全在帮助企业安全、合规地使用云方面发挥着重要的作用。
隐私保护
中国根据2021年11月生效的《个人信息保护法》(PIPL)对隐私进行监管,并且目前正在制定相关的跨行业法规。《个人信息保护法》(PIPL)虽然与欧盟的《通用数据保护条例》(GDPR)等隐私法有相似之处,但也存在明显不同的要求,并且在多家监管机构的指导下执行。
《个人信息保护法》大大改变了中国的法律和监管环境。之前的执法依据主要是网络安全法和个人信息安全标准。《个人信息保护法》为中国公民提供了一个更加全面的个人数据保护框架并加入了严厉的经济制裁措施——违法者将被处以前一年年收入的5%或5000万人民币(以较高者为准)罚款。
云原生计算
云原生可以带来速度和敏捷性。业务系统正在从赋能业务能力向加快业务速度和增长的战略性数字化转型演变。企业越来越需要将产品上市速度、创新功能、微服务/共享服务架构转型和零停机加入到数字化举措中。云原生能够加快产品上市时间,而且云原生功能和产品在扩展和运行时的运营开销较少。
边缘计算
去中心化的边缘计算将与高度中心化的超大规模公有云形成互补。边缘计算解决了许多迫在眉睫的问题,例如由于位于边缘的数据大量增加而产生不可接受的延迟和带宽要求。中国正在建设大量边缘设施,包括铺设全国性的5G网络,以便借边缘计算之力赋能各个层面的超大型数字化转型应用场景。
机密计算
机密计算是一种在基于硬件的可信执行环境(TEE,也被称为飞地)中执行代码的安全机制。这些飞地不仅可以将代码和数据与主机系统及主机系统的所有者隔离并提供保护,还可以确保代码完整性和认证。
为了通过数据交换和处理来盘活数据价值,中国在2020年将数据指定为生产要素。中国《数据安全法》(DSL)和《个人信息保护法》(PIPL)的生效促使企业寻求数据保护。
受到高度监管的企业担心公有云上的数据会被未经授权的第三方访问,而机密计算可以减轻阻碍这些企业采用云的主要障碍。面对竞争对手、数据处理者和数据分析者,企业能够通过机密计算以传统密码技术无法实现的方式在硬件层面加强对正在使用的数据的保护。而当应用于物联网(IoT)/边缘服务器或节点时,机密计算可以保护更加接近数据源的数据和企业应用。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。