作者 蔡哲民 2000.03.01
自從有了第二個小孩之後,我幾乎沒有多少時間可以參與網路的服事,唯一能做的就是好好的管理信望愛站的系統而已,而眼看自己越來越忙,而信望愛站的硬體即將邁入第二個年頭,心中不免有些擔心。根據以往的經驗,硬體系統,尤其是硬碟系統,在第二年之後就會開始或多或少出現問題。
我們一開始就知道硬碟系統是整個硬體穩定性的「罩門」,所以我們選定 IBM 的硬碟來購買(避開其他比較危險的廠牌),而且也使用了 DAT 來每天備份系統的資料。這樣謹慎小心的背後原因,無非是因為以前吃過太多虧了。但,使用 IBM 的硬碟就能高枕無憂了嗎?我想許多人都很清楚,該壞的還是會壞,硬碟的損壞只是早晚的事情而已,而我自己悲觀的預估今年夏天應該就是我們的硬體系統遭遇相當大的挑戰的時間(因為溫度加硬體年紀)。
這一陣子我在想,如果硬碟損壞,我們的技術人員有什麼辦法可以盡快修復?到底最糟糕的情況下信望愛站會當機多久?仔細評估下來,其實是相當令人擔心的。主要是目前主要的緊急修復人力就是我自己,如果 BBS 的硬碟壞掉,狀況又出現在上班時間,以我現在的忙碌狀況,大概沒有把握可以「立刻回機房處理」,而晚上回家,大概只有四個小時左右的時間可以處理,而硬碟損壞的處理,卻又不一定是四個小時可以解決的。
如果 WWW 主機(信望愛 BBS 站與信望愛全球資訊網)或 Life 主機(心靈小憩、教會機構與其他專案事工)硬碟壞掉,我必須立刻停掉 Tech 主機(技術同工測試專用),將 tech 的硬碟重新分割成 BBS 可以使用的狀況,然後將磁帶中的備份轉出來到 tech 的硬碟上去,並作一些必要的系統調整與測試。這樣的狀況下,我預估四個小時大概可以完成。但是 tech 就必須停機,信望愛站的研發也就必須停止。而信望愛站大概要停機一天才能重新啟動。
接下來我必須去買新硬碟回來裝(得要隔天我有空才能去電腦公司買),如果沒貨就必須等一段時間,這段時間如果再有硬碟損壞,那就沒有辦法拯救了。硬碟買回來,我大概又必須花四個小時來將 tech 重建,將信望愛站弄回來,當然,這難免又會造成一段時間的停機。
這段時間我認真的思考這樣的狀況是否是信望愛站可以忍受或應該忍受的。目前信望愛站的硬體架構是假設我們的技術人員可以隨時修復解決問題的設計,但隨著技術人員的流失與繁忙程度增加,這樣的設計恐怕是有問題的。所以我特別設計了一個「完美的信望站硬體架構」,當成我們的夢想與未來努力的方向,在此與大家分享。
我們未來的網站,應該以「穩固的資料儲存」配合「可快速替換的運算硬體」來架設。因此,我們需要:
1. 一個 RAID(編註),其中包含七個硬碟,三個給 BBS 用,三個給 Life 用,一個做備援使用。
2. 三部電腦,配備一致,可隨時更替。一部BBS、一部Life,另外一部配備傳統硬碟當研發與備援用(tech)。
3. 整個系統採用機架式,方便維修。
這樣,透過 RAID 的保護,除非有兩個以上的硬碟損壞,信望愛站不至於立刻無法使用,而整個維修也就可以在不停機的狀況下執行。這樣任何一個硬碟壞掉的停機時間,都將由一天降低至零。採用機架式的架構,是希望能夠提供更好的散熱與維修效率。如果由目前的架構轉換成「夢幻架構」,預估需要採購:
1. 一套 RAID(含七個硬碟):25萬
2. 三套機架式電腦與機架:15萬
3. 共計大約要40萬元。
這樣的預算經費相當高昂(信望愛資訊中心一年的預算也不過一百萬左右),如果要分期執行,倒是可以先用目前的電腦硬體,而先採購 RAID,未來等到信望愛站硬體進入第三年再更換電腦硬體。至於專線部分,目前已經有 ISDN 備援線路了,所以不會成為系統的瓶頸。
呵呵!這個方案我想了很久,一直沒有敢公布出來,也不敢提出預算(只要想到我們苦哈哈的全職同工,我就不想這樣花錢)。但是我想我們的神是豐富的上帝,我現在把這個構想提出來,歡迎大家提供意見,如果成為大家的共識,我們就可以一起為我們的夢幻系統禱告,如果我們認為我們的站是最好的基督教網站之一,那我想我們沒有理由不敢向上帝求適當的硬體的。
好了,我已經把我心裡的夢想說出來了,歡迎大家指教。如果計畫成形,那也許就當一個專案來奉獻吧!
(本文作者為信望愛資訊中心技術組負責人,本中心前任負責人,高雄醫學大學電算中心主任)
編註:RAID 是什麼?
RAID 的中文意義是「磁碟陣列」,顧名思義,就是用許多顆磁碟組成的陣列,功能是可以讓機器的資料儲存經過特別的運算而存放在這許多顆磁碟上,這樣不但可以使資料的儲存速度加快,也可以在某一顆硬碟損壞的時候,主機仍然可以繼續運轉,不會當掉,之後再儘快找一段時間將新硬碟換裝上,即可自動 Recover,一個好的磁碟陣列,在硬體的設計上甚至可以火線上(on line 作業)插拔換裝新硬碟,完全不需停機處理。
RAID 對於伺服器管理與防止重要的電腦業務停擺確實是方便又有效的裝置,不過成本相當高,現在信望愛資訊中心的業務和資料將是必然的愈來愈龐大,不要說是使用 RAID,甚至使用高階伺服器來作為主機都是有可能的。在信望愛正在進步的同時,我們不可能期待只有「軟體」的成長,卻沒有足夠的「硬體」來支撐,所以這樣的規劃,確實是需要的。