由于保密协议或商誉的考虑, 企业通常不愿意公开有关数据中心火灾的详细信息。因此, 除非企业主动向当地消防部门或媒体报告, 或者发生了重大事故, 否则数据中心火灾的详细情况很难被追踪。
尽管隐瞒火灾事件可以保护公司的声誉, 但这也使得其他数据中心运营商很难从事故中吸取教训。2021 年, 在法国 OVHcloud 数据中心被火灾摧毁后, 知名的数据中心标准组织和第三方认证机构 ——Uptime Institute 发表了一篇关于数据中心火灾频率的文章显示, 自 1994 年开始记录以来, 其成员总共报告了 11 起数据中心火灾, 平均每年发生 0.5 起火灾。
看起来数据中心火灾属于偶发事件? 其实不然。
Uptime Institute 最近表示, 他们调查发现, 从 2020 年到 2023 年初, 至少有 14 起因火灾或灭火系统引起的“重大数据中心中断事件”, 平均每年达到 4 起。
从每年 0.5 起到每年 4 起的显著差异说明了两个问题:
第一, 许多数据中心火灾事件未被公开;
第二, 数据中心火灾问题需要被高度重视。
下面分享几个过去十年中发生的几起重大数据中心火灾事件, 尽管所知的细节很少, 但可以为预防未来事故提供借鉴。
知名的数据中心火灾事故
美国爱荷华州谷歌数据中心火灾
2022 年 8 月 8 日, 位于爱荷华州康瑟尔布拉夫斯的谷歌大型数据中心发生火灾。该事件最初被描述为“电气事故”, 是由电弧闪光引起主数据中心大楼附近变电站的爆炸而触发。
火灾导致三名工人受伤。火灾当天, 谷歌的地图和搜索服务出现了中断, 但谷歌表示这两起事件无关。
法国 OVHcloud 数据中心火灾
2021 年 3 月 10 日,OVHcloud 位于斯特拉斯堡的一个数据中心发生火灾, 摧毁了整个 SBG2 数据中心, 并损毁了 SBG1 的四个房间。这场火灾影响了约 65000 名客户, 其中许多人在火灾中丢失了数据。
韩国 SK Inc. C&C 数据中心火灾
2021 年 10 月 15 日, 韩国板桥的 SK C&C 数据中心因锂电池产生火花并引发了火灾, 导致了韩国网络大面积瘫痪。
受影响的两家韩国主要科技公司 Kakao 和 Naver。虽然 Naver 迅速恢复了服务器, 但 Kakao 却经历了长时间中断, 其消息平台、支付应用和打车服务一度中断数小时。尽管有灾难恢复计划, 但由于计划未能应对火灾期间的断电,Kakao 的恢复工作受阻。随后, 该公司成立了“预防再发委员会”以避免类似事件再度发生。
新加坡罗央大道数据中心的火灾
2024 年 9 月 10 日上午, 一起由锂电池爆炸引发的火灾在 Digital Realty 的 SIN11 数据中心发生。据报道, 截至 9 月 11 日晚上 8 点, 火灾已持续 36 小时, 仍未完全扑灭。这起事件也导致多家全球知名公司托管的服务严重中断。
当心锂电池的安全风险
到目前为止, 我们已经看到有 2 起因锂电池起火引起的重大数据中心事故, 这点尤为值得警惕。这是因为锂电池的材料与结构决定了, 其在燃烧时会释放大量的氧气, 加剧火势, 从而导致严重的热失控事件, 使得火灾很难扑灭。
而根据 Uptime 的调查显示, 锂离子电池在数据中心和工业应用中的采用率很高: 一些供应商报告称, 其主要三相 UPS 系统中, 超过一半的运营商都配备了锂电池。而且许多运营商都认为锂离子电池的风险回报状况 (就其更小的占地面积和更长的使用寿命而言) 是可以接受的。
根据 Uptime Institute 2021 年全球数据中心调查, 近一半的运营商已在其集中式 UPS 工厂中采用了锂电池技术, 而三年前这一比例约为四分之一。Uptime Institute 2022 年全球数据中心调查发现, 锂电池的采用水平还在进一步提高。
数据中心采用锂电池正在快速上升
构建弹性: 预防数据中心火灾
上述事例告诉我们, 数据中心火灾已不能当成偶发事件来看待, 特别是锂电池在数据中心得到广泛应用的今天。不过, 这并不意味着电力故障和电气火灾是难以预防的。为了降低数据中心发生火灾的风险,Uptime Institute 提供了以下三条建议:
1、检测: 使用 VESDA (非常早期的烟雾探测设备) 系统。在火灾隐患产生的初期尽早地发现火情, 从而避免火灾损失的发生或把损失减低到最小限度。
2、灭火: 确保适当的防火屏障和系统隔离, 并始终保持灭火系统得到良好的维护。
3、缓解: 进行定期风险评估, 以识别和解决这些系统的任何问题。
在采取了必要的检测、灭火和缓解措施之外, 持续提升基础设施弹性同样是应对数据中心灾难的关键。因为弹性能够确保在突发事件中, 数据和服务得以持续, 最大程度地减少对业务运营的影响。为此, 企业需要完善备份、复制和恢复流程, 同时建立快速响应和恢复机制, 确保服务和运营能够迅速恢复到正常状态。
作为全球领先的 IT 解决方案供应商, 戴尔科技在数据安全领域推出了创新的“三位一体”架构, 旨在为企业提供全面、多层次的数据保护方案。该架构由备份 (BR)、容灾 (DR) 和数据避风港 (CR) 三部分组成, 对基本数据做备份, 重要数据做容灾, 核心数据避风港里待, 共同构建了一个立体化的数据安全防御体系。
该安全防御体系之所以能够做到“三位一体”, 关键在于其方案并不是彼此孤立的, 无论是备份、容灾还是数据避风港等环境,Dell PowerProtect DD 都在其中发挥着关键作用, 是戴尔数据保护解决方案的基础。
在备份设备领域,Dell PowerProtect DD 系列长期稳居前列, 其技术历经严格验证与持续优化, 展现出卓越的性能与可靠性。无论企业面对的是本地数据保护挑战, 还是复杂的多云环境数据防护需求,PowerProtect DD 都有助于实现全面的网络弹性, 确保数据安全无虞。
新一代 PowerProtect DD 可将备份速度加快多达 38%, 还原速度加快多达 44%, 复制速度加快多达 58%。不仅如此, 它的效率也再攀新高, 不仅能实现高达 65:1 的数据缩减, 而且所需电力减少多达 11%, 占用空间减少多达 50%, 这一切都将为企业节省更多保护成本。
针对当下许多企业面临的多云环境, 戴尔也已经与 AWS、Azure、谷歌云、阿里云等多个公有云厂商建立了合作, 既能将本地的数据归档和备份到云, 也能在公有云上提供云内备份, 构建云端的备份容灾方案。当需要满足合规要求时, 也可以将备份放到本地环境。
结语
数据中心火灾已成为不可忽视的风险, 尤其是在锂电池广泛应用的背景下。通过采用烟雾探测设备 (VESDA)、完善的灭火措施以及定期的风险评估, 可有效降低火灾发生的可能性。除此之外, 通过构建强大的弹性基础架构, 确保灾难发生时数据和业务能够迅速恢复至关重要, 戴尔科技提供“三位一体”数据保护策略, 通过备份、容灾和数据避风港的多层次防御体系, 可为企业构建全面的数据安全保障。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。