Gartner预测,到2024年,全球开发人员数量将达到2870万人,比2020年增加320万人。其中大部分增加的人数会在中国,根据目前的趋势,2023年中国的开发人员增长率将在6%到8%之间。
应用编程接口(API)可用于支持应用程序之间的集成,提供现代化的多渠道用户体验,以及创建客户和合作伙伴生态系统。而如果没有足够的API标准和技能支撑,软件开发团队会很难设计出能够满足开发人员期望的API。欠佳的API设计会导致繁琐的开发人员体验,导致更少的消费者会采用API。因此,改进API设计应该是中国IT领导者的首要任务。
为了设计出符合消费者需求的高效、可靠API,IT领导者应确保其团队了解API用例,运用标准化的API设计实践,以完成API最佳性能设计并对团队进行培训(参见图1)。
图1:API设计四部曲
API用例识别和互动
要设计出色的API,软件开发团队必须清楚地了解它能为业务端和消费者所提供的价值。不同的企业机构和API消费者有不同的需求和期望。为了满足这些要求,软件开发团队必须确定API使用者是谁以及他们将如何使用API。
明确用途。IT领导者必须确保其团队清晰了解API的用途——简而言之,就是API消费者如何使用API的功能并与其服务交互。了解API的用途后,解决方案架构师才能够做出最适合API消费者需求的设计决策,比如符合业务用例和预期的功能。
创建并遵守API标准
随着时间的推移,IT团队将扩充API组合,以满足特定产品、服务和应用程序的需求。如果没有标准化和明确的API设计指南,API设计将多种多样,缺乏一致性。因此,API使用者必须花时间去学习每种方法,而且更容易出错。为了降低这种复杂性并提高开发人员的生产力,软件开发团队必须建立统一的API设计方法,以保持清晰的代码的部署逻辑和功能实现。以下三个方式将帮助IT领导者实现此目标。
通过限制有效负载大小、启用可缓存性和使用异步请求模式来提高API性能
一个经过深思熟虑的API设计,还需要考虑性能。API的性能,在很大程度上取决于它对不同请求类型和请求数量波动的响应程度。例如,中国的电商市场在过去几年发展迅速,网购交易规模迅速扩大,网购用户数量同比增加了一倍。
自2020年新冠肺炎疫情席卷全球以来,线下消费向线上消费的大规模转变进一步刺激了中国电商行业的快速增长。显示用户的当前订单是一个典型的电商用例场景。应用程序可通过API获取订单的详细信息,但如果用户想在一个界面查看所有订单,API要返回的数据就会比以前多,后端也将产生更高的负载。IT领导者必须确保其团队考虑使用哪些模式来提高性能,将其纳入API指南。例如:
长期培训团队成员,以持续地设计优秀的API
在2022年Gartner3月热门话题调查中,43%的IT领导者将缺乏技能列为API战略面临的最大挑战之一。随着API技术的不断发展,它能够提供比以往更丰富、更复杂的功能。
所有IT团队成员都应积极参与有关API和开发的长期培训。只有当API使用者与设计者预期的场景一致时,API才会以最佳方式执行。在API设计、开发和使用的整个生命周期中,IT领导者必须安排持续的辅导教育,提高团队对API技术的掌握程度,确保API始终符合并有效满足业务需求。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。