至顶网CIO与CTO频道 09月29日 北京消息:Gartner最新发布的2019年区块链业务技术成熟度曲线(Hype Cycle for Blockchain Business)表明,区块链将在未来五至十年内极大地改变大多数行业的业务。
Gartner杰出研究副总裁David Furlonger表示:“在Gartner的2019年首席信息官议程调查中,有60%的首席信息官预计,在未来三年,区块链技术的采纳度会达到一定的水平,不过他们还不确定区块链会给他们的业务带来什么样的影响。目前,首席信息官正在因企业机构现有的数字化基础设施以及缺乏明确的区块链治理而无法挖掘区块链的全部价值。”
Gartner区块链业务技术成熟度曲线从业务的角度概括区块链能力的发展并展现出区块链在不同行业的成熟度(参见图一)。
图一、Gartner 2019年区块链业务技术成熟度曲线 来源:Gartner(2019年9月)
关键行业
银行和投资服务行业对于希望改进古老运营模式和流程的创新者而言依然具有很大的吸引力。而在此次首席信息官调查中,只有7.6%的受访者表示区块链是一项能够改变行业格局的技术。也就是说,18%的银行和投资服务首席信息官认为,他们已采纳或者将在未来十二个月内采纳某种区块链技术,另有近15%的首席信息官表示将在两年内这么做。
Furlonger表示:“区块链已在多个关键领域尝试,目前的主要用途是许可型帐本(permissioned ledger)。据我们预测,数字代币仍将继续被创建和接受,但在标准、监管框架和区块链能力组织架构等非技术活动层面仍有大量工作有待完成。只有完成了这些工作,这项技术才能进入生产成熟期,开始迅速成为该行业的一项主流技术。”
游戏行业中的区块链。在快速发展的电子竞技行业,区块链原住民正在发布使用户能够创建自己代币的解决方案。这些解决方案能够为比赛的设计以及虚拟商品的交易提供支持。代币能够增加玩家对游戏内商品的控制,从而获得更便捷的跨游戏平台体验。
Gartner研究副总裁Christophe Uzureau表示:“由于游戏行业用户数量大,创新速度快,因此该行业是区块链创新应用的理想测试平台。在这个行业,可以非常好地观察到用户如何促进区块链两大核心组成部分:去中心化(decentralization)和通证化(tokenization)的适应性。游戏行业的初创企业是Amazon、Google或Apple生态的理想替代品,而且这些企业可以成为其他行业公司开发数字战略的示范。”
在零售行业,区块链被用于“跟踪与追踪”服务、打假、库存管理和审计。这些用途都能改进产品质量、食品安全等。虽然这些用途十分重要,但区块链对零售行业的真正影响取决于对新理念的支持,比如使用区块链改变或增强客户忠诚度计划等。当与物联网和人工智能相结合时,区块链可能会永久改变零售业务模式,对数据和资金流产生影响并避免市场权力的集中化。
因此,Gartner认为区块链具有改变所有行业业务模式的潜力,但企业必须采纳整个区块链生态才能把握这些机会。只有实现了通证化和去中心化,大部分行业才能了解区块链真正的业务价值。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。