互联网业灾备迫在眉睫

2018-06-11    来源:

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

5月28日中午,携程网网站和App无法登录,网上也传出携程全线酒店数据库遭遇物理删除的消息。携程官方则发布声明称,因遭到不明攻击,网站和App陷入瘫痪,无法正常使用。此前,支付宝也于5月27日下午出现大面积访问故障。当晚10时25分,阿里技术保障部门发布微博承认,拥有将近3亿活跃用户的支付宝出现网络故障,故障原因为光缆被挖掘机挖断。虽然目前支付宝的各项业务都已经恢复,但业内人士对支付宝在故障倒换能力和应急反应速度上并不满意,普遍认为互联金融系统的运行稳定性并不如此前所宣称的那样完善。

同时,我们也不由得想起2015年年初facebook的宕机事件,2014年paypal的服务中断……构架在各种物理连接,如网络、数据中心之上的互联网世界真这么脆弱吗?一旦发生类似“挂了”的严重事故,是否有力回天?

互联网业的备份与恢复,离不开灾备中心的运营管理。灾备中心对环境要求很高,比如必须远离强地震带,周围没有重大军事目标和重大工程设施等。机房标准需要全面达到或超过国家A级机房的标准,机房主体结构要求达到8级以上抗震标准,UPS机房称重要求达到1000kg/m2。此外,一个安全稳定的灾备中心对于网络通信、综合布线、消防安保、空调等多方面都有极其严苛的要求。

除了部署相应的硬件设施外,应急预案和灾备演练也必不可少。

应急预案的制订,除了普适性预案,如应急响应预案、IT恢复预案、业务恢复预案外,还应该根据实际,增加特定场景及特定系统预案。

灾备演练则是培养政府、企业的应急管理意识,检验应急预案的适用性,发现并持续改进问题的重要手段。桌面演练和模拟演练是一般性的常规演练,可以比较真实地检验灾备系统的可用性、有效性,但在政府、银行、保险、电信、航空等关键业务领域,往往还需要进行实际切换演练。实际切换演练可以最大限度地检验灾备系统和灾难恢复预案的有效性和灾难恢复能力。

在上周连续发生的两起事故中,异地多活的系统架构成为业界另一个重要的关注点。支付宝采用的是异地双活系统,但业界普遍对长达两个小时的业务恢复时间表示不满,质疑其究竟是出于资金安全考虑而主动放缓速度还是支付宝应急预案出现漏洞。与此相反,银行业采用的异地多活系统架构则更为稳定。有大型银行内部从业人员向媒体表示,传统金融机构对涉及用户资金的重要系统采用了十分完备的灾备方案,一般会部署“两地三中心”的云备份方案,保证“同城灾备结合异地灾备”,以具备应对重大灾难或战争等极端情况的能力。

标签: 安全 标准 互联网 机房 金融 漏洞 媒体 企业 数据库 通信 网络 网站 问题 行业 用户

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:闪存是否会随着其价格的下降大举进军企业市场?

下一篇:看免费的虚拟化技术如何快速实现数据备份