Ameren是一家收入规模近60亿美元的能源公司,位于美国圣路易斯,在覆盖密苏里州和伊利诺伊州的6.4万平方英里区域内,拥有240万个电力客户和超过90万个天然气客户。该公司的数字化负责人Bhavani Amirthalingam,自2018年初以来一直担任首席数字信息官,其中在CIO职责方面,她主要负责公司的应用、基础设施、数据中心、最终用户计算等方面;在数字化职责方面,她负责确立如何利用数字技术提供差异化的客户体验。此外,她还负责新兴技术,帮助实现可持续的、安全的且可靠的未来能源网络。
Amirthalingam指出,Ameren拥有数百万个联网设备接入电网,为客户提供更高的可靠性和更好的服务。她说:“我的团队提供适当水平的自动化和分析,获取来自联网设备中的数据,为扩展和发展未来电网提供所需的通信基础设施,而且有一点需要重点强调,当前信息技术[IT]和运营技术[OT]正在融合,随着未来电网不断发展,针对关键基础设施的网络安全[包括IT和OT]是很重要的。”
当人们想到全球一流客户体验的时候,可能会联想到那些B2C的企业。Amirthalingam以此作为类比,用客户体验去影响Ameren的客户。“现在数字渠道已经成为首选的渠道,我们有超过四分之三的客户互动是通过数字渠道进行的。我们的客户战略核心,就是提供无缝的、安全的、无摩擦的数字客户体验。随着电网的不断发展,我们需要有更多围绕太阳能和风能的分布式资源加入进来,以打造新的产品和服务。而通过我们的数字渠道为客户提供更多选择,是一个关键的因素。”Ameren的目标,是到2050年前实现净零碳,而利用数字开发更智能、更可持续的电网,将对实现这一目标发挥重要的作用,Amirthalingam强调说。
Amirthalingam举例提到了她的团队在推动智能电表技术方面所做的努力。目前她的团队已经在整个美国伊利诺伊州部署了该系统,而且正在密苏里州进行部署,他们的目标为客户提供更好的能源可见性和更好的选择,与此同时,也可以为电网提供更高的可靠性。
另一个方面,是促进与客户的沟通,在他们需要的时候与之互动。请记住,有多达四分之三的客户互动是从数字化开始的,这意味着,让客服具备通过多渠道与客户展开互动的能力,同时也为他们提供关于每个客户的全方位画像,可以消除客服与客户互动过程中可能产生的摩擦。而且,双方的互动可以是电话或线上聊天的方式,让客服了解每个客户与该企业的互动情况、历史沟通记录、账单信息等等,这样让客服能够更容易地解决客户的问题。
通过这些不同的触点,Ameren高管们已经了解到客户最看重的是能源可靠性和可负担性。 Amirthalingam说:“在我们思考、想象和构建未来电网时,我们始终把这一点放在首位。这就需要借助数字化和强大的自动化,为我们的客户提供适当水平的弹性和可靠性。”
可靠性还意味着通过提供数据并应用人工智能来了解资产的健康状况和性能,同时还要考虑植被管理和电压优化等重要因素,所有这些都有助于推动客户很看重的可负担性目标。
提及联网设备的扩展,Amirthalingam指出,每增加一台设备,威胁面就会扩大。因此,网络安全仍然是一个重点领域。她指出,网络安全不仅仅是流程和技术,还必须是一种文化属性。此外,她还提到了零信任以及利用AI挖掘数据以发现可能预示着新型网络安全问题的模式,这些都是很重要的。
Amirthalingam代表了CIO和CDO角色的未来方向,在推动顶层和底层的同时改进客户体验方面,她为其他人提供了一个可以效仿的模型。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。