随着自2017年以来平均每年约10次收购活动,The Access Group在将不同系统整合到其IT架构方面积累了丰富经验。
然而,这也导致了存储基础设施的高度分散化,以及维护方面的诸多困难。
在本次专访中,我们与The Access Group亚太区技术总监Rolf Krolke进行了深入交流。The Access Group是英国最大的软件公司,估值近100亿英镑,拥有7500名员工,为全球10万家组织提供商业应用解决方案。
我们在Krolke启动存储更新项目时与他进行了对话。该项目将用Pure Storage全闪存阵列替换众多传统存储供应商的硬件,采用即服务模式采购,并计划使用该公司的企业数据云管理平台以及Portworx容器管理环境。
该项目将在全球10个数据中心整合存储,总容量达到数十PB级别。
我们在上周拉斯维加斯Pure公司Accelerate活动现场采访了Krolke,了解了以下内容:
作为技术总监面临的主要挑战;
像The Access Group这样的公司如何在频繁的并购活动中整合多个分散系统;
公司新的Access Evo平台;
存储更新项目的驱动因素;
迁移至现代化单一供应商存储环境对组织技能的影响。
**作为技术总监,您面临的最大挑战是什么?**
由于我们通过并购实现增长,最终拥有了许多不同的基础设施、不同规模的公司,处于不同的成熟度水平。
这意味着我们的数据分布在各处,挑战在于如何将这些数据整合在一起?如何将其纳入我们的参考架构,同时不影响公司的性能、收入、稳定性和可用性?
到目前为止,我们已经部署了FlashArray X和XL系列。现在我们正在考虑Portworx,因为我们正在最终确定容器策略和想要使用的容器平台。
我认为另一个挑战是不同平台的整合,这些平台同样是通过并购获得的。通常情况下,你会构建某些东西然后有机地成长,但我们的增长方式非常无机化。我们的并购活动非常活跃。
我们是一家非常好奇的公司,这很酷,但整合方面有大量工作要做。所以,关键是跟上我们需要做的事情,确保平滑过渡,不影响整个流程,同时考虑如何将其纳入我们的标准化参考架构。
我们非常密切地管理整合过程,因为我们不想说:"恭喜,我们现在收购了你们。我们要移动所有东西,因为显然我们不能破坏它。"
**您在这些并购中整合IT的模板是什么?**
它们规模各不相同。我想我们有一个需要做的最低要求模板。
这包括简单的事情,比如将他们的公有云账户迁移到我们的公有云账户下,这样我们就能获得与AWS和微软承诺支出的好处。我们推出安全工具,确保一切都是安全的。这可能是我们做的最基本的事情。
然后,每个都是基于具体情况处理,取决于架构方式、开发周期、管道和使用的平台。
我们还会进行评估,看是否有我们不想使用的平台,比如如果我们收购使用阿里巴巴或其他被禁用平台的公司。
但我们有一个简单的标准模板来处理最基本的事情,然后我们花接下来的18个月与他们合作,或最多18个月,取决于规模,将他们整合进来。
**您能告诉我们更多关于Access Evo的信息吗?新基础设施将如何促进您在Evo层面的能力?**
它将允许我们做的是,特别是随着Pure Fusion的推出,将AI更靠近数据。因此,我们可以开始考虑在数据所在的数据中心内放置AI Pod,并从那里运行查询,而不是依赖分散的系统。
这是将其放在这个数据层的一个潜在好处。我认为这是主要好处,以及管理数据及其大小和规模,因为随着客户开始使用它,他们将产生更多数据,他们将在其中放入更多数据。
我们有一些非常有趣的用例,特别是在澳大利亚,我们正在其中一个薪资平台上推出它,这将是我们第一次与客户互动。也就是说,与他们的数据互动,因为他们在本地运行。所以,它可能位于传统服务器或笔记本电脑上,然后通过Evo,他们现在将把它连接到我们的环境中,他们将能够通过Evo内的copilot对其数据进行分析。
**是什么驱动了存储更新项目?您现有场景中是否存在一些限制?**
是的,存在限制。
除了集中管理之外,关键驱动因素之一是缺乏非中断性升级。每月补丁,每个人都害怕执行。没有人想要打补丁,因为你永远不知道会发现什么。
很多次我们试图为基础设施打补丁,都遇到问题并导致中断。但我们喜欢的,真正让我们选择Pure的,是我们可以进行非中断性升级的事实。我们已经充分测试了这一点。我在周一生产环境中间进行了非中断性升级,没有人知道。
我们存储更新的关键驱动因素之一是缺乏非中断性升级。我们喜欢Pure的是我们可以进行非中断性升级的事实。
以前,进行基础设施升级是一个漫长的过程。即使只是标准固件和补丁,也必须是一个计划练习,使用大量人力,持续很长时间。
这是由于混合基础设施造成的——存储和计算的许多供应商并不总是让事情变得容易。
由于我们需要做的关键补丁的重要性,我们总是落后两到三个版本。根据你什么时候做,有时你需要先做第一个,然后下一个,再下一个。我们真的不能关闭我们的SAN。
我们正在推出Pure的过程中。我们在这个旅程上已经有大约12个月了,在接下来的几年里,我们将安装Pure,同时取出我们多年前购买或通过并购获得的现有存储。我们不能只是撕掉重换,因为我们需要让资产正常运行。
到目前为止,我们已经部署了FlashArray X和XL系列。现在我们正在考虑Portworx,因为我们正在最终确定容器策略和想要使用的容器平台。
我们还在研究Cloud Block Store,特别是对于我们的Azure和AWS环境,看看我们如何将那里的数据带入我们的Pure 1环境来管理。然后我对Fusion非常感兴趣,以及我们如何使用它根据我们试图实现的结果来移动工作负载。
**到目前为止您能够衡量任何好处吗?**
我们显著减少了中断次数。我们降低了总拥有成本。不过我没有具体数字。我们看到影响服务的事件减少了。
**随着存储更新的进展,如果有的话,从存储人员现在做的事情到他们将来要做的事情之间的技能重塑是什么样的?**
部署Pure的一个好处是存储人员可以去做其他事情,因为总管理开销更低。
我们过去有这些孤岛,比如平台或基础设施团队。这正在打破这些孤岛。
我们将拥有多管理员。所以,他们将管理存储、计算、整个平台、数据中心内的一切。他们将覆盖整个范围。他们中的很多人现在就是这样。所以我不认为我们需要那个存储人员。
但我认为我们传统的基础设施团队需要跟上现在拥有的技能,就像CloudOps或DevOps团队会知道的那样。他们需要了解网络、存储、计算和数据库。他们需要了解任何在公有云中构建的人,那些基础设施团队需要的所有东西。
我认为这就是需要的技能提升组件。
好文章,需要你的鼓励
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
香港大学研究团队提出LightReasoner框架,通过让小型"业余"模型与大型"专家"模型对比,识别关键推理步骤并转化为训练信号。该方法在数学推理任务上实现28.1%性能提升,同时将训练时间、样本需求和词元使用量分别减少90%、80%和99%,完全无需人工标注。研究颠覆了传统训练思路,证明通过模型间行为差异可以实现高效的自监督学习,为资源受限环境下的AI能力提升提供了新路径。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
马里兰大学研究团队开发了MONKEY适配器,一种无需额外训练的AI绘画控制技术。该方法通过"两步走"策略解决了个性化AI绘画中主体保真与背景控制难以兼得的问题:先让AI识别主体区域生成"透明胶片",再在第二次生成中让主体区域听从参考图片、背景区域听从文字描述。实验证明该方法在保持主体特征和响应文字要求两方面均表现出色,为AI绘画的精细化控制提供了新思路。