至顶网CIO与CTO频道 10月24日 编译:每一位供应链管理者都在努力改善运营、集成新技术,并设法从浩如烟海的来源处获取并使用数据。为什么要这般费力?因为我们如今已掌握有分析知识与技术能力,足以建立起能够激发客户需求并最大程度降低实现成本的数字供应链体系。虽然不同企业的解决方案也有所差别,同时因所在行业而异,但每家公司都有必要解决一系列共通性问题。下面,我们将共同了解成功实现数字供应链转型的八大关键性举措。
1.推动收入提升的效能指标。任何企业都拥有自己的一套用于衡量成本与交付效能的复杂方法。然而,很少有人能够找到可以准确反映供应链在刺激需求与提升收入方面重要意义的量化指标。这种衡量能力的缺失,导致我们很难提升客户满意度、增加收入乃至开发出新的商业模式。从另一个角度来看,如果能够采取正确措施,我们将找到市场与客户数据的强大管理方式,真正利用供应链为客户创造独特体验人,最终帮助企业高管突破限制创新与增长的原有孤岛、实现业务体系的重大转变。我们建议各位CEO与CFO协助建立这种行之有效的指标,并据此严格审查业务进度。
2.以“有目的的协作”为目标。大家还记得上一次企业CIO、销售与营销负责人以及运营负责人坐在一起讨论构建强大客户体验方案是在什么时候吗?上一次感受到数据能够在不同部门之间自由流动,又是在什么时候?事实上,这种跨职能协作应该成为将客户与运营体系联系起来,同时提高客户忠诚度的主要手段与灵感来源。因此,请确保各位主管、经理以及员工积极参与到这种有目的的协作中来。
3.如果无法让客户满意,坏消息将接踵而至。Uber公司用实际行动向出租车市场展示,在通过供应链把客户与产品/服务匹配起来之后,能够迸发出怎样的能量。客户喜欢这种透明的定价与服务交付方式。另一方面,传统出租车行业则长期满足于缓慢的服务交付途径,并导致其市场份额迅速流失、盈利能力急剧下降。像Uber这样以客户为中心的数字供应链方案也将进入您的行业,并彻底颠覆现有商业模式。
4.从“数据交换”起步以获取必要信息。大多数供应链负责人并没能真正理解实现业务增长需要哪些数据。因此,锐意进取的供应链管理者不仅应当擅长使用现有数据,同时也需要关于收集新型数据。这可能意味着安装传感器或者使用物联网设备,也可能意味着需要与其他企业(例如分销商)合作并交换业务数据。数字供应链要求我们采用新的数据模型,而数据交换通常是最好的信息获取渠道。我们应采取相关步骤以识别并评估所需数据,同时深入剖析现有数据中蕴含的价值。
5.利用区块链创造更高客户价值。不用理会关于区块链技术中不可变性与分布式分类账的炒作之声;相反,我们不妨以务实的态度将区块链引入供应链体系,从而快速提升客户的使用体验与满意度。同时,在借此消除了供应链中的非增值部分并显著减少文书工作与验证成本之后,投资回报也将快速显现。
6.让算法管理成为职业发展的前提。每个人都很清楚,算法代表着商业发展的未来。我们需要由软件开发人员创建这些算法,但更重要的是,我们也需要让在职管理者如何这些算法的工作原理,从而确定人工智能/机器学习资源的分配优先级并实现跨界工作人。如果缺少算法管理能力,您将无法在职业生涯中更进一步。
7.通过人员更迭以及员工再培训推动数字化转型。现有管理团队很难在短时间内转型为具有强大分析技能的数据驱动型决策者。因此,大家可能不得不引入更精通统计分析专业且了解分析与算法管理技能的新成员,用以替换原有管理团队成员。但与此同时,我们也可以通过内部培训逐步提升管理团队与员工的技能水平。简单来讲:聘请技术人士,再由他们负责培训其他老员工。
8.设定看似不可能的目标,并帮助人们实现这些目标。曾有一位客户告诉我,“组织”这个概念的存在,就是为了防止人们把事情做好……可能有点极端,但我亲眼见到过很多人在拥有自主行动能力与决策空间时所爆发出的强大能量。因此,请为供应链转型以及客户满意度驱动下的收入增长设定成长目标,而后改变企业文化,鼓励人们用更多灵活的方法在运用数据赚取利润的同时取悦客户。虽然看似不可能,但这一切其实完全可以实现。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。