至顶网CIO与CTO频道 04月29日 北京消息:新型冠状病毒(COVID-19)引发的疫情已蔓延至全球并已成为全球性流行病(pandemic)。随着全球各国公共卫生部门通过整顿资源限制人力成本,许多企业开始评估疫情对业务运营的影响。
疫情常常会导致大量员工不得不远程工作,尤其是当疫情上升到流行病或全球性流行病时,而且疫区的出行限制还将引发运营人员短缺。这些因素都会增加对远程支持的需求,但此时可提供这一支持的员工人数却日益减少。那么基础设施和运营负责人到底该如何应对流行病或大流行病对运营的冲击?
建立弹性工作队伍应对策略
由于新冠病毒疫情的爆发,多个国家/地区的政府开始限制出行,这使得员工无法上班。同时,需求的激增造成电信通讯中断,从而影响员工之间的远程通信交流。
此类情况在流行病和全球性流行病期间十分普遍,并且仅建立企业私有云仍不足以确保业务连续性。为在这种情况下减少业务中断,基础设施和运营负责人应使员工能够使用云桌面DaaS(包括公有云厂商提供的Desktop as a Service服务或者 电信运营商提供的云桌面)进行远程工作。DaaS的快速可扩展性和按需付费模式可在短时间内为工作队伍建立起弹性应对能力,而且在大规模部署,且短期使用的时候,整体成本比扩展VPN方案更低。不过为所有员工提供远程工作安排的费用很高,因此需要合理安排人员的访问权限,确保成本可控。
在此之前应确定安全的远程访问用例支持模式,如有些客户使用前置堡垒机方式或账号绑定方式等。为了控制层成本,可以先期为需要DaaS的员工提前安排配置信息,只是在他们需要进行远程工作期间激活相关服务。
制定基础设施紧急情况应对计划
如果在您的办公室中发现感染者,那么您的工作地点大概率会被隔离,禁止人员随意出入。基础设施和运营负责人应通过建立数据中心响应计划做好这方面的准备。该计划应包括 创建数据中心现场工作人员核准名单,确认已将访问权限授予相应的人员,并确保名单中以外人员不能访问关键基础设施。另外需要在运营支持层面一个A角应该安排多个B角。至少应安排三名员工为关键任务IT服务的每一个支持层面提供服务,并准备最坏的可能性。有很多用户反馈,在系统真正出状况时,实际情况可能会与当时计划的场景差别很大。
使用可扩展的架构支持业务运营
由于人们的出行受到限制并且在流行病或全球性流行病期间不敢前往公共场所,因此原先线下业务交易不得不在网络上完成。基础设施和运营负责人必须增加企业机构的网络流量处理能力,尤其是有些业务因为人们应对突发疫情导致,需求快速增加,如医疗,快递等。在全球性流行病期间,此类企业必须在相对较短的时间内提高自己的处理能力,而相应的基础设施和运营负责人必须 规划通过利用公有云服务的弹性扩展本地工作负载容量。基于实时工作负载和性能监控构建功能,并使用云原生架构自动扩展或重新构建工作负载,确保运营的连续性。本地数据中心容量通常不足以支持此类突发需求。为了满足在关键时刻业务的重要需求,需要建立需求优先级管理委员会以及授权委派机构,使IT部门能够确保开发与支持疫情服务场景相关的应用来帮助满足受影响地区的需求并支持业务的稳定运行。
在全球性流行病得到控制且风险水平降低之后,上述保护措施还使传统行业的IT运营水平能够达到互联网企业机构的IT运营水平。
好文章,需要你的鼓励
随着AI策略成熟,CIO开始重新考虑对公有云的依赖,私有云和本地环境重新受到关注。调查显示,67%的企业领导计划在未来12个月内将部分AI数据迁移至非云环境。主要原因包括成本可预测性、数据隐私保护、安全问题和云集成挑战。对于持续的AI工作负载,购买自有GPU比租用公有云更经济。私有云支出增长更快,预计2025年将有54%的组织在私有云上投入超过1000万美元。
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
本文深入分析了从传统AI发展到AGI过程中可能出现的智能爆发现象。基于AI专家共识的2040年AGI实现预期,文章探讨了七种主要发展路径,重点关注突破性的"登月路径"。智能爆发理论认为,智能可以像原子链式反应一样相互促进,快速产生大量新智能。文章预测2038-2039年可能发生智能爆发,随后在2040年实现AGI,但也指出了关于智能爆发的启动、控制和潜在风险等争议问题。
奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了2-6个百分点的性能提升,为医学AI发展开辟了新方向。