2020年初疫情爆发的时候,消费者开始把购物方式转向数字渠道,大型零售商Target感受到了对自身的影响,Target首席信息官Mike McNamara说,“三周之内我们数字业务实现的增长相当于三年”。
为了满足市场的需求,“我们采取了‘网购星期一’(Cyber Monday)的模式,我们只需要启动这个模式,全年保持不变就行了。”
值得注意的是,由于McNamara和他的团队早在几年前就会在技术上有所投资,所以这次扩展的过程是相当顺利无缝的。
近日,McNamara在云未来峰会上畅谈了关于Target的云战略、如何实现创新和业务敏捷性的。
关于把技术作为差异化因素:
Mike McNamara:五六年前,大家就都意识到,未来零售业的赢家将是那些拥有最好的技术和最好的供应链的企业。在零售业,很明显,位置、产品、价格和服务,这些因素都是同等重要的。但是当世界开始转向数字化的时候,真正与众不同的,是最好的供应链和最好的技术。
所以很明显,技术将成为Target未来发展的一个重要组成部分,事实也证明,技术是如此重要,而不应该进行外包。所以我们的战略实际上就是我们自主开发技术,那么我就必须建立一支优秀的工程团队,并且要有出色的工作方式。最终,我们必须为未来打造一个伟大的架构和平台,策略就是我们自己组建团队,自己构建架构,最终这对技术团队来说,是一次非常成功的转型。
关于Target的云架构:
我们的业务性质是经常遇到“顶峰”,也就是季节性趋势很明显。从历史数据来看,“网购星期一”一直是交易井喷的日子。例如:在网购星期一,我们的业务量是周二正常运行情况下的20倍。所以,如果要自主开发技术、构建基础设施以支撑“网购星期一”的话,你就会发现,实际情况是全年其他90%的时间你的技术资产都是闲置的。因此对于零售商来说,云一直都是极具吸引力的,我们需要顶峰期的爆发能力,也需要弹性,这与其他任何行业都是不同的。
就出色的客户体验而言,这也是很重要的。很明显,美国国内到处都有大型云提供商的网络接入点,可以降低延迟并提高网络速度、性能、移动和应用性能等等。
所以,云对于我们来说是一件显而易见的事情。我们从2016年开始云端之旅,大约一年之后完成。今天,谷歌承担了我们大部分面向顾客的流量,包括我们的网站和应用,不过仍然有很多处理是在我们自己的数据中心内完成的。所以,我们所做的,就是创建了自己的部署平台,称之为TAP(目标应用平台),让我们能够将工作负载推入Google Cloud Platform或者我们自己的数据中心,或者推向我们在全球各个国家/地区大约1900个门店,以及我们所有小型数据中心。
关于拥抱混合云:
我希望能够将工作负载部署到最匹配的位置,无论是我们自己的数据中心、还是Azure、GCP……我认为这就是真正的“混合”,就是你可以根据自己的需要、以天或者季度为单位来决定把工作负载放在哪里。
现实中,我们可以在自己的数据中心运行稳定的工作负载,比在云端便宜得多。如果你只是有一个简单的、稳定的工作负载,并且全天候24小时运行的话,实际上拥有自己的数据中心从财务角度上来说是更好的选择,特别是我们有一些数据中心是很久很久以前就开始支出成本的了。因此,这对于我们拥有的稳定工作负载是非常有意义的。但是,对于弹性工作负载来说,就要把它们放在最需要的地方,我认为这就是混合云的真正本质。
展望未来
在我们自己的数据中心里启用新的实例,可不像刷下信用卡就可以使用AWS那样简单,但这就是我们眼下正在做的事情,我们当然也有相同的工具集来管理内部数据中心和所有集群,就像是在公有云中一样。所以,我们是有一套工具可以让我们两者兼得的。不过,我们仍在在为我们自己的数据中心内自动配置可扩展存储、内存和处理能力而努力,我们正在一部一步实现这个目标,这就是我们未来几年将要走上的旅程。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。