親愛的客戶朋友們
在此希望您有個愉快的周末!
首先, 我們希望對于2018年3月11日至3月12日凌晨其間內(nèi)發(fā)生的網(wǎng)絡(luò)連線中斷情形表達(dá)誠摯的歉意。以下我們?yōu)槟f明此次事件的詳細(xì)情形:
在2018年3月11日晚上,我們收到了第一個關(guān)于網(wǎng)絡(luò)連線問題的投訴。某個客戶無法由某個國際地區(qū)連接到我們的洛杉磯網(wǎng)絡(luò)。所以,我們都進(jìn)行了初步調(diào)查,但檢查當(dāng)下并沒有再發(fā)生相同的問題。而后,我們收到來自其他客戶的額外投訴,表示他們無法加載他們的網(wǎng)站或他們的IPMI。最終,我們將這個問題鎖定在我們網(wǎng)絡(luò)內(nèi)的TCP / UDP連接問題上。經(jīng)過多次故障排除嘗試后,我們?nèi)匀粺o法找到問題的真正根源。在2018年3月11日星期日的早上,我們做了最后的嘗試,并且檢查我們機(jī)房內(nèi)的每個交換機(jī)/路由器設(shè)備,期望找到可能導(dǎo)致此異常TCP / UDP丟失的任何事情?偠灾,我們最終在核心交換機(jī)上發(fā)現(xiàn)了內(nèi)存泄漏的小警告級別。而此內(nèi)存泄漏是由操作系統(tǒng)(軟件)錯誤引起的。我們?nèi)匀徊桓逸p下結(jié)論,所以我們決定排除此錯誤故障來確定是否能解決問題。正如你可能已經(jīng)知道我們有一個冗余的N + 1網(wǎng)絡(luò)基礎(chǔ)設(shè)施。這使我們有能力暫時將有問題的核心交換機(jī)下線進(jìn)行故障排除。關(guān)閉后,我們看到問題自行解決。因此網(wǎng)絡(luò)團(tuán)隊(duì)隨后決定用最新的操作系統(tǒng)更新來修補(bǔ)交換機(jī),并希望能夠解決修復(fù)這種情況。然后,我們試圖在核心上運(yùn)行補(bǔ)丁更新,但不幸更新失敗。這迫使我們必須以更新的固件完全格式化交換機(jī),并手動配置將各項(xiàng)設(shè)定恢復(fù)到交換機(jī)中。這項(xiàng)更新補(bǔ)丁的嘗試工作造成了大約1-2個小時的整個網(wǎng)絡(luò)中斷。但最終經(jīng)歷更新和恢復(fù)完成后,我們現(xiàn)在很高興地通知您,所有連接問題都已解決!
再次,我們對任何網(wǎng)絡(luò)中斷和最初的TCP / UDP連接問題深表歉意。我們知道這可能耗費(fèi)了比預(yù)期更長的時間,但由于這個問題的癥狀較廣泛,我們花了一段比較長的時間才發(fā)現(xiàn)細(xì)部原因,然后找出問題的真正根源。往后, 我們也將持續(xù)監(jiān)控網(wǎng)絡(luò),隨時關(guān)注我們可能已經(jīng)找到或尚未發(fā)現(xiàn)到的其他任何問題。我們非常感謝您繼續(xù)的業(yè)務(wù)合作與支持理解。
如果您有任何反饋需求或尚有其他疑慮, 請?jiān)诖碎_啟建立客戶服務(wù)聯(lián)絡(luò)單.