X14
機房主要的設備是UPS與備份系統,這通常是系統面臨一個災難時,最終的解決方案。

 

對IT而言,機房的災難並不是火災或地震,而是資料的永遠毀損
相對資料的毀損,我還寧可發生火災,至少我只需要換設備即可,而資料的損壞將是永久都救不回來了

昨天凌晨1點40分,我的機房台電跳電了5秒鐘

這5秒鐘造成的伺服器硬碟整個毀損
而且還是很嚴重發出嘰~嘰~的聲音,推測應該是讀寫頭已經完蛋了,開始刮磁碟表面了
這種物理性的傷害,硬碟已經恢復不能..

這大概是IT最恐懼的情況,等同天崩地裂的災難

這種情形會發生,在於我沒有用UPS(不斷電系統)
其實我的機房有UPS設備的,但每當停電或跳電時,UPS他媽的叫個不停
我的UPS警告音又很大聲又很腦殘的關不掉
最後忍不住,把它停用後,經過幾次停電或跳電,伺服器一樣可以正常的閞機與恢復服務
我就很顢頇的果斷停用UPS啦(OS.這叫死好)

但這次跳電卻造成嚴重的後果
以前我還在嘲笑朋友,跟本不需要裝置UPS,看他UPS運作數年,完全都沒用到
現在,這個教訓讓我懂UPS的重要性了

停電或跳電大電腦都幾乎能重新開機與恢復服務
但是..如果硬碟正在寫零軌那幾ms(毫秒),死不死,剛好在那時候跳(斷)電,就有好戲看了
磁碟在紀錄資料的原理是先把資料寫入硬碟的區塊,寫完後,會在零軌寫入這些檔案的位置與屬性值
這說明你在拷貝檔案時,你去拔插頭也不會傷害磁碟,因為零軌的檔案位置與屬尚未寫入
重開機後,系統就當你沒做過這件事
但是如果在寫零軌時那2-3毫秒(ms)時,電力消失,讀寫頭甚致會在電力不足時做出不確定的動作
比如把你的零軌全寫上0

運作交易型的商業網站近二十年來
我常心有所感,其實客戶看的到東西,只有10%左右
其它的90%是備份工作與安全系統

我向來不怎麼相信SQL SERVER的備份,也不相信系統本身的自我備份
我的網站系統都是架在一個沒有internet連線的封閉系統裡,然後在這個系統建立虛擬系統
這一來被攻擊,駭客們也只是攻擊到我的系統的子系統,我一根手指就輕易的阻擋與分析
再威的攻擊,假設毀掉我的系統好了,我也不怕,重點是備份與還原非常容易
我只需將虛擬系統整個再匯入就行了(不過會有回溯的問題,所以要勤備份)

以前用MS SQL的備份,還原後少東少西的,不確定的因素太多
而且有時系統或元件發生故障,修起來麻煩的要死,有時光找出壞掉的元件,就要好幾天
後來想通,直接用虛擬系統的匯出檔,不管什麼故障,甚致是有人誤砍資料庫
都能輕易的還原

不過,匯出整個系統挺累人的就是了

第一次發現跳電這麼可怕,以後我會乖乖的用UPS了。

arrow
arrow
    全站熱搜

    半熟園丁 發表在 痞客邦 留言(0) 人氣()