扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNET至顶网CIO与应用频道 06月17日 北京消息:在信息社会,每个业务的处理几乎都离不开IT系统的支撑。系统稳定运行意味着什么?它意味着每天反复庞大的业务处理和数据传输中,需要持续保证连续性与规律,保证整个企业的运行秩序与效率。
而系统是不可能永无宕机的,宕机则意味着中断业务,产生混乱,丢失数据。员工无法接入电子邮件、电话或关键业务应用,业务流程无法更新,客户的业务受到阻断和影响,可能去寻求新的合作伙伴。企业中高级管理者称他们对网络故障中断的容忍度越来越低。相关机构做过的调查显示,系统故障中断的负面影响不仅限于经济损失,公司形象受损是最担心的问题。
影响到系统稳定性的因素非常多,硬件稳定性和软件质量,人为因素等,有些是无法避免的:
硬件稳定性
越是大型的企业,基础设施的构成越是复杂,即使最大程度避免了系统缺陷或配置不当的隐患,超长时间的运行和复杂应用,还是会影响其稳定性。
软件质量和性能分析
大型企业采用的开发平台、应用软件较多。运行在上的业务也较为关键。IT系统响应时间、资源利用率和吞吐量等指标的利用状态难以统一的监控和管理。一旦发生故障对生产和工作产生的影响又会非常大。
工作人员的专业性和工作效率
人的因素永远是最难以预测的危机存在是无法产生预期的隐患,但在复杂的系统环境中,出现人为错误的原因往往不是能力欠缺。因此需要更完备的解决方案和措施,才能减少系统的不稳定对业务造成的影响和危害。
小问题可快速演变成重大问题。抢先发现轻微错误,防止它们演变成重大错误是复杂系统的主要特征之一。对系统进行实时的监测和备份非常重要,最好能够在错误实际发生之前对其实施先行处理和备案,如果系统可以实施早期警告系统,检测问题当然最好,但是实际上还是需要采取适当措施来避免问题激化,并使系统快速恢复正常运行。比如,对数据和应用进行备份来包装业务数据和系统状态的安全。采用灾备解决方案防止重大的事故产生的故障和损失。
采用高可用和灾难恢复软件则是提供了最广泛的解决方案,它能够快速的恢复关键应用和数据的连续保护。它可以减少因为硬件,软件和站点故障导致的计划外宕机,缓解因为停机对周期性的硬件和软件维护的任务,迅速迁移到新的系统以保持业务连续性。
它们摆脱简单的被动响应机制,被特定条件触发后,软件将对其他的状态指示器和变量进行评估、向操作人员发送高级通知、甚至采取适当行动。如果系统1无法恢复和运行,则可以迅速迁移到备用系统,保证连续性。
总结:最完美的系统并不是永无事故的系统,而是可以掌控可以恢复的系统。在正常运行的时候,防患于未然,遇到事故时候,主动把控局面,最快速度恢复业务。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者