近日,《The Stack》報(bào)道稱,2024年7月,英格蘭銀行支付系統(tǒng)——CHAPS系統(tǒng)因“銀行基礎(chǔ)設(shè)施中的SSL/TLS證書過(guò)期”而發(fā)生故障。
CHAPS系統(tǒng)在2024年8月處理了6.9萬(wàn)億英鎊的支付交易。但在此前一個(gè)月,CHAPS和銀行的零售結(jié)算系統(tǒng)因宕機(jī)停止了這些交易,導(dǎo)致IT員工不得不緊急實(shí)施修復(fù)方案。(CHAPS系統(tǒng)在91分鐘內(nèi)恢復(fù)運(yùn)行。)
導(dǎo)致這次故障的原因是一張過(guò)期的SSL/TLS證書。
根據(jù)英格蘭銀行發(fā)布的年度結(jié)算系統(tǒng)現(xiàn)代化報(bào)告,該故障的原因與證書過(guò)期有關(guān),盡管報(bào)告中沒(méi)有具體說(shuō)明是哪類證書,但通常這類問(wèn)題與SSL/TLS證書有關(guān),該證書用于驗(yàn)證系統(tǒng)身份并允許其與其他系統(tǒng)建立加密網(wǎng)絡(luò)連接。
英格蘭銀行證書問(wèn)題
2024年已經(jīng)是中央銀行老化的結(jié)算系統(tǒng)第四次中斷,而值得注意的是,這是第二次因證書問(wèn)題導(dǎo)致的宕機(jī)。
2024年1月26日,RTGS(實(shí)時(shí)全額結(jié)算)系統(tǒng)曾發(fā)生一次持續(xù)39分鐘的宕機(jī),導(dǎo)致CHAPS和CREST結(jié)算暫停,英格蘭銀行模糊地將其歸因于“證書頒發(fā)機(jī)構(gòu)問(wèn)題”。(這一日期與AWS某些證書更換要求的時(shí)間一致,但我們沒(méi)有證據(jù)表明兩者之間存在因果關(guān)系,僅作時(shí)間上的關(guān)聯(lián)說(shuō)明。)
英格蘭銀行在2024年9月27日發(fā)布的報(bào)告中指出:“在過(guò)去一年中,RTGS服務(wù)發(fā)生了多次中斷。但在所有情況下,我們的重要業(yè)務(wù)服務(wù)的影響容忍度都得到了滿足,即提交給我們的所有支付和其他結(jié)算指令都在當(dāng)天結(jié)算完成。”
這一細(xì)節(jié)來(lái)自RTGS現(xiàn)代化更新,因?yàn)橛⒏裉m銀行正逐步推進(jìn)其現(xiàn)有引擎的替換工作,計(jì)劃采用一種“模塊化設(shè)計(jì)的新核心賬本和結(jié)算引擎”,這一更新將使更多金融服務(wù)機(jī)構(gòu)更容易接入英格蘭銀行系統(tǒng)。
據(jù)悉,現(xiàn)有的RTGS引擎可能基于大型主機(jī),接入新機(jī)構(gòu)的過(guò)程繁瑣:“RTGS更新計(jì)劃的每個(gè)主要里程碑都需要技術(shù)準(zhǔn)備工作,包括對(duì)現(xiàn)有RTGS基礎(chǔ)設(shè)施的變更凍結(jié),以便安全地進(jìn)行必要的變更,”英格蘭銀行指出。“對(duì)于CHAPS和零售支付系統(tǒng),下一批接入時(shí)段將于2025年開(kāi)放。”
在過(guò)去12個(gè)月里,其他值得注意的宕機(jī)事件還包括:2023年10月26日RTGS系統(tǒng)發(fā)生36分鐘的中斷,導(dǎo)致CHAPS、CREST和零售結(jié)算停止,原因是“網(wǎng)絡(luò)配置問(wèn)題”;2024年6月17日,RTGS系統(tǒng)內(nèi)部組件故障引發(fā)6分鐘的中斷;2024年7月18日,CHAPS結(jié)算出現(xiàn)245分鐘的中斷,原因是SWIFT的Y-Copy服務(wù)出現(xiàn)問(wèn)題,導(dǎo)致該服務(wù)全球范圍內(nèi)受到影響。
《The Stack》已聯(lián)系英格蘭銀行對(duì)此事發(fā)表評(píng)論。一位發(fā)言人表示:“我們會(huì)對(duì)RTGS的每次事故進(jìn)行審查,包括7月31日的事件,所有確定的改進(jìn)措施都會(huì)被跟蹤落實(shí)。”
更新證書時(shí)操作失誤導(dǎo)致ServiceNow服務(wù)中斷
無(wú)獨(dú)有偶,在上月末,市值1810億美元的ServiceNow公司也因類似問(wèn)題短暫受到了影響。
此次問(wèn)題的根源在于ServiceNow的管理、工具及發(fā)現(xiàn)(MID)服務(wù)器。該服務(wù)器是本地客戶端服務(wù)器上的Java應(yīng)用程序。一份有限的公告顯示,“MID Server Root G2 SSL”證書已過(guò)期。
ServiceNow最終表示:“在9月22日,ServiceNow確認(rèn)了一個(gè)過(guò)期的TLS跨鏈證書,影響了MID服務(wù)器與客戶實(shí)例之間的連接。”公司補(bǔ)充說(shuō),證書已于本周初更新完畢,系統(tǒng)已經(jīng)恢復(fù)正常運(yùn)行。
但超過(guò)600家客戶的系統(tǒng)在此事件后崩潰,眾多報(bào)告顯示該證書即將過(guò)期的警告幾周前就已發(fā)出。至于此次證書更新是否是人工操作還是自動(dòng)化管理出了紕漏,仍是個(gè)未知數(shù),但此次事件再次強(qiáng)調(diào)了證書管理的持續(xù)風(fēng)險(xiǎn)。
對(duì)此,Venafi首席創(chuàng)新官Kevin Bocek聲稱,此事件表明“ServiceNow的流程中存在嚴(yán)重的漏洞,亟待修復(fù)。”
“根證書是數(shù)字安全和在線身份的基礎(chǔ),它位于信任金字塔的頂端,負(fù)責(zé)認(rèn)證并簽發(fā)鏈條下的其他TLS身份。如果根證書過(guò)期,它將影響所有與其關(guān)聯(lián)的機(jī)器身份——這就是為何客戶受到如此廣泛影響的原因。”他補(bǔ)充道,“…在當(dāng)今復(fù)雜的IT環(huán)境中,試圖通過(guò)人工管理機(jī)器身份幾乎是不可能的任務(wù)。而且難度還在加大。全球已有超過(guò)2.9億個(gè)TLS證書,過(guò)去兩年增加了超過(guò)4000萬(wàn)個(gè)……隨著Google即將強(qiáng)制實(shí)施90天的證書有效期規(guī)定,持續(xù)的替換和更短的生命周期將很快成為常態(tài)。”
證書自動(dòng)化管理大勢(shì)所趨
多年來(lái),許多大型組織因未能及時(shí)更換即將到期的證書而導(dǎo)致服務(wù)中斷,隨著證書生命周期的縮短,這種情況可能會(huì)愈加嚴(yán)重。
另一方面,在當(dāng)下許多組織中,證書的更新仍然依靠人工管理(甚至使用經(jīng)典的Excel表格),而對(duì)于錯(cuò)過(guò)一個(gè)證書更新從而引發(fā)連鎖反應(yīng)的恐懼并不少見(jiàn)。
由于手動(dòng)管理眾多證書的到期和續(xù)期日期的難度日益增加,證書過(guò)期未能及時(shí)處理可能會(huì)導(dǎo)致應(yīng)用程序宕機(jī)、服務(wù)中斷、服務(wù)器冒充甚至敏感數(shù)據(jù)泄露。
Sectigo的威脅檢測(cè)專家Tim Callan在一封電子郵件中指出,“許多組織仍在嘗試并苦苦應(yīng)對(duì)手動(dòng)管理其生態(tài)系統(tǒng)中數(shù)千個(gè)數(shù)字證書的挑戰(zhàn)。這是一個(gè)耗時(shí)的過(guò)程,單獨(dú)手動(dòng)簽發(fā)一張證書可能需要一個(gè)多小時(shí)。將此工作量乘以數(shù)百或數(shù)千個(gè)證書,很明顯,手動(dòng)證書生命周期管理對(duì)于即便是資源最為充足的IT團(tuán)隊(duì)來(lái)說(shuō)也是難以維持的。”
他補(bǔ)充道:“不久之后,隨著Google Chromium在其‘Moving Forward, Together’路線圖中的最新更新生效,TLS證書的最長(zhǎng)有效期將從398天縮短至90天,這將成為未來(lái)政策更新的一部分。此舉帶來(lái)的好處是真實(shí)的,特別是提高了安全性。但對(duì)于仍在手動(dòng)管理證書的組織來(lái)說(shuō),這意味著工作量將增加四倍,如果繼續(xù)采用手動(dòng)方法,預(yù)計(jì)會(huì)有更多的違規(guī)和宕機(jī)事件發(fā)生。我們?cè)僖矡o(wú)法承受手動(dòng)證書管理帶來(lái)的摩擦了——系統(tǒng)宕機(jī)或數(shù)據(jù)泄露的潛在風(fēng)險(xiǎn)太大。證書管理需要具備CA無(wú)關(guān)性并實(shí)現(xiàn)自動(dòng)化,以便在新規(guī)落地時(shí),CISO們能夠輕松維護(hù)數(shù)字信任。”