当数据危机来袭

来源:IPA 时间:2025-01-22 作者:IPA编辑:无忧草
打印 RSS |

编者按:

近期,CrowdStrike的IT故障和NHS Synnovis的网络攻击事件让全球企业意识到,技术灾难的准备工作至关重要。这些事件不仅造成了大规模的设备瘫痪,还直接影响了数百万人的业务和生活。专家指出,除了IT部门,企业的财务高层同样需要确保公司具备应对各种系统中断和网络攻击的能力。

阅读本文,了解财务高管应如何与信息安全团队紧密合作,确保企业在面对技术故障时,能快速恢复并最大程度减少损失。了解这些关键策略,帮助你为企业的财务稳定和运营连续性提供有力保障。

当数据危机来袭

去年7 月份CrowdStrike IT 公司的设备故障所导致的全球范围性著名的微软“蓝屏死机”事件,以及6月份NHS Synnovis公司的网络攻击事件,让我们清醒地意识到计算机故障的预备措施极其重要。CrowdStrike的失误使得850万台计算机死机,并给500家公司造成约54亿美元的损失。这还不包括微软系统崩溃所带来的大范围混乱。

并且,Synnovis公司,这家负责为英国国家医疗服务系统信托基金和全科医生管理实验室的机构,所遭受的极具破坏性的网络袭击主要影响到了7家医院,并造成了几千个手术和预约的延迟。

当计算机行业的领导者们还在为公司管理系统的技术问题忙碌时,财务行业的领导者和他的团队们只要求确保公司能应对潜在的系统中断危机。

NETSCOUT公司的艾琳·哈格蒂(Eileen Haggerty)解释说:“防范恶意网络攻击的首要步骤与防范IT故障的步骤类似。建立并发布操作流程,制定强有力的可审核性策略,这对应对勒索软件和其他网络威胁至关重要。”测试,测试,测试

历史上最大的宕机事件持续时间长达72小时。这次事件是由于网络安全公司CrowdStrike向其客户推送了一个更新,但却与微软公司的操作系统冲突。这一事件花费了好几周时间最终完全修复。事件暴露出许多机构组织缺乏相应的应急措施来应对某一方面的失误。例如,IT系统、重要的软件系统或停工期间。

“这件事凸显了许多组织机构能够测试正常的备份情况为网络事故或数据中心的火灾做准备。但是仍不能考虑并测试这种令人头疼的大范围计算机故障。” S-RM公司网络安全顾问奥利弗·普莱斯(Oliver Price)提到。

首席财务官们应询问他们的信息安全团队做好了那些准备,并且越具体越好。并且以叙事的方式说明企业已做好哪些应对事件以及是怎样测试的。

“当你得到了不错的答案,你就可以很好的了解到这是一个精心制作的计划。因为它试图解决实质性问题,而不是毫无关联的几点解决方案” 普莱斯补充说。

周期性地运行灾难恢复模拟操作来测试公司是否能积极应对不同的情况,例如网络袭击、硬件问题或自然灾害,能帮助找出公司规划里的潜在弱点并让团队可以迅速应对突发情况。

“这也需要我们从技术角度演练如何恢复受到故障影响的系统,” 普莱斯补说,“实体操作可以让我们演练如何召集团队找出问题所在并管理这些事件”。

灵活的应对方案

CrowdStrike公司自从这次事件后说,我们不再会全球性向全体客户在同一时间推广他们的软件,并且将允许客户们在接收到推广后允许他们选择更新或推迟进行。

盖伊·沃伦,FTSE集团前首席运营官,如今作为计算机监控和可观察性公司ITRS的运行负责人说到,企业保护自己的最佳方式就是防止软件自行决定何时更新。

“企业应小心应对自动更新程序,尤其是当你还不能完全有把握的情况下。当你确实准备更新软件时,请分批进行。不要盲目更新。”

企业还需灵活的应对方案,一旦主要业务的某一模块出现问题,另一模块可替补工作。

“当涉及到系统损坏后的基础数据恢复问题,热备份系统就要上线了,” 普莱斯说到,“你可能不必马上运行他们,但是你应该时刻准备着运行。”

终端至终端的可视性

为了避免系统中断造成的停机问题,以及随之而来的混乱和业务中断,企业 “需要对其网络所面临的威胁有完整的端到端可视性”,哈格蒂(Haggerty) 说。这样,企业就可以监控网络和应用程序,不管企业在哪里托管或用户在哪里访问。

哈格蒂还提到:“持续系统化地对网络系统进行监控,可以查看趋势,设置提醒和重要性标志。因此当半夜有异常发生时,你就可以在内部系统注意到,在某一地区出了问题。这可以让系统有时间来追踪问题并有可能在用户第二天开始工作前解决问题。”

与此同时,监控解决方案中的大量低优先级预警经常会使得注意力被分散,不再专注于影响业务的问题。

沃伦认为,不同的操作流程,不同的工具搭配组合以及不同的IT设施所产生的信息堆栈,会引起大量的干扰噪音,或者叫“预警风暴”,这会使我们难以辨认这是正常的良性波动还是紧急的严重问题。

例如,出入网站的流量激增可能是分布式拒绝服务攻击(DDoS:是一种网络攻击。在此类攻击中,攻击者通过发送大量恶意流量造成网站、服务器或网络资源不堪重负,从而导致目标无法工作或崩溃,拒绝向合法用户提供服务,使得合法流量无法到达其目的地)或数据外漏的表现,而频繁重启可能是恶意软件篡改 IT 基础设施造成的,沃伦提到。

用 IT 运营的人工智能或 AIOps(利用机器学习和分析实现 IT 运营自动化的平台)可帮助剔除无关数据和低优先级通知。

“因此,你就可以更好地识别问题并确定优先顺序,从而集中精力解决关键问题。有了更全面的了解,你就能将运营问题和安全风险联系起来。”

理查德·克伦普是一名会计和法律记者

文章来源:财务会计师公会会刊《财务会计师》(Financial Accountant)2024年11月-12月刊,第12 - 14页

沪公网安备 31011802001002号