至顶网CIO与应用频道 05月09日 编译:Gartner的2018年CIO调查显示,只有1%的CIO称其组织内采用了某种形式的区块链,只有8%的CIO正在进行短期规划或者正在积极尝试区块链。此外,接受调查的CIO中有77%表示,他们的企业组织对区块链技术不感兴趣,或者没有进行调查或者开发方面的行动计划。
Gartner副总裁兼研究员David Furlonger说:“今年Gartner的CIO调查提供了围绕区块链采用和部署的炒作情况的事实证据(见图1)。这对于了解区块链是什么、今天区块链能做什么、未来如何变革企业、行业以及社会与社会,是至关重要的。”
Furlonger补充说,急于部署区块链可能会让组织面临严重的创新失败、投资浪费、轻率决策甚至拒绝那些改变游戏规则的技术等问题。
图1 - 全球区块链采用情况
资料来源:Gartner(2018年5月)
通往区块链的崎岖之路
短期规划投资区块链或者已经投资区块链的293名CIO中,有23%的CIO表示区块链需要最新的技能来实现任何技术上的实施,而18%的CIO认为区块链技能是最缺乏的。另外14%的CIO表示,区块链需要IT部门文化发生巨大变化,13%的CIO认为必须改变IT部门的结构才能实施区块链。
“对于CIO来说,挑战不仅仅在于找到并留住合格的工程师,还有要随着区块链的发展找到足够的资源来适应资源的增长。合格的工程师可能会持谨慎态度,这主要是由于区块链开发者社区历来的自由主义和独特本质。”
CIO们也意识到,区块链的实施将改变企业组织的运营模式和业务模式,他们表示在为满足这一要求做好准备的过程中面临挑战。“区块链技术需要我们从根本上了解安全、法律、价值交换、分散治理、流程和商业架构等方面。因此,这意味着传统业务线和组织孤岛无法在历史遗留的结构下继续运转。”
金融服务和保险公司走在前沿
从行业角度来看,电信、保险和金融服务行业的CIO比其他行业的CIO在参与区块链规划和试水方面更加积极一些。
金融服务和保险公司走在区块链领域前沿的同时,交通、政府和公用事业现在也加大参与力度,因为这些行业高度重视流程效率、供应链和物流方面的机会。对于电信公司而言,他们感兴趣是因为他们希望“拥有基础设施这条线”并抓住消费者支付方面的机会。
“区块链仍然处于Gartner技术成熟度曲线的期望膨胀期顶峰。不同行业参与者如何渡过幻灭低谷,这更多地取决于他们对区块链技术本身带来创新的接受度,”Furlonger说。
业务、治理和运营模式,设计和实施预数字化业务都需要时间进行重新设计。这是因为区块链的影响与经济有关。“虽然很多行业都表示对区块链有初步兴趣,但是他们是否会接受分散的、分布式的、标志性的网络,或者试图将区块链引入传统价值流和系统,这些仍有待观察,”Furlonger总结道。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。