簡介
在網(wǎng)絡(luò)通信,通信設(shè)備有時會因?yàn)槟撤N原因不能正常,這時需要啟用備用設(shè)備使系統(tǒng)正常工作。備用冗余一般是指在一組在正常情況下不工作,只在正在使用的設(shè)備不工作的時候才工作的設(shè)備。備用冗余是一種計算機(jī)容災(zāi)備份技術(shù),備用冗余有著廣泛的應(yīng)用,特別是在互聯(lián)網(wǎng)通信中。
以計算機(jī)為例,其服務(wù)器及電源等重要設(shè)備,都采用一用二備甚至一用三備的配置。正常工作時,只有幾臺服務(wù)器同時工作,電源也是這樣。一旦遇到停電或者機(jī)器故障,自動轉(zhuǎn)到正常設(shè)備上繼續(xù)運(yùn)行,確保系統(tǒng)不停機(jī),數(shù)據(jù)不丟失。
冗余多余的重復(fù)或啰嗦內(nèi)容(包括信息、語言、代碼、結(jié)構(gòu)、服務(wù)、軟件、硬件等等)均稱為冗余。冗余有兩層含義,第一層含義是指多余的不需要的部分,第二層含義是指人為增加地重復(fù)部分,其目的是用來對原本的單一部分進(jìn)行備份,以達(dá)到增強(qiáng)其安全性的目的,這在信息通信系統(tǒng)當(dāng)中有著較為廣泛的應(yīng)用。
冗余一般又可以分為軟冗余和硬冗余。軟冗余:一般是指代處理器的冷備用。冷備用采用采用軟件方式切換。硬冗余:一般指代處理器的熱備用。熱備用系統(tǒng)采用硬件方式切換。
在通信工程當(dāng)中,冗余指出于系統(tǒng)安全和可靠性等方面的考慮,人為地對一些關(guān)鍵部件或功能進(jìn)行重復(fù)的配置。當(dāng)系統(tǒng)發(fā)生故障時,比如某一設(shè)備發(fā)生損壞,冗余配置的部件可以作為備援,及時介入并承擔(dān)故障部件的工作,由此減少系統(tǒng)的故障時間。冗余尤用于應(yīng)急處理。冗余可以存在于不同層面,如網(wǎng)絡(luò)冗余、服務(wù)器冗余、磁盤冗余、數(shù)據(jù)冗余等。2
冗余按照結(jié)構(gòu)可分為靜態(tài)、動態(tài)冗余和表決系統(tǒng);按在系統(tǒng)中所處的位置,可以分為元件級、部件級和系統(tǒng)級冗余;按冗余的程度可分為1:1、1:2/1:n等多種冗余。1
備用冗余系統(tǒng)配件電源:高端伺服器產(chǎn)品中普遍采用雙電源系統(tǒng),這兩個電源是負(fù)載均衡的,即在系統(tǒng)工作時它們都為系統(tǒng)提供電力,當(dāng)一個電源出現(xiàn)故障時,另一個電源就承擔(dān)所有的負(fù)載。有些伺服器系統(tǒng)實(shí)現(xiàn)了DC的冗余,另一些伺服器產(chǎn)品,如Micron公司的NetFRAME 9000實(shí)現(xiàn)了AC、DC的全冗余。
存儲子系統(tǒng):存儲子系統(tǒng)是整個伺服器系統(tǒng)中最容易發(fā)生故障的地方。以下幾種方法可以實(shí)現(xiàn)該系統(tǒng)的冗余。
磁碟鏡像:將相同的數(shù)據(jù)分別寫入兩個磁碟中。
磁碟雙聯(lián):為鏡像磁碟增加了一個I/O控制器,就形成了磁碟雙聯(lián),使匯流排爭用情況得到改善。
RAID:廉價冗余磁碟陣列(Redundant array of inexpensive disks)的縮寫。顧名思義,它由幾個磁碟組成,通過一個控制器協(xié)調(diào)運(yùn)動機(jī)制使單個數(shù)據(jù)流依次寫入這幾個磁碟中。RAID3系統(tǒng)由5個磁碟構(gòu)成,其中4個磁碟存儲數(shù)據(jù),1個磁碟存儲校驗(yàn)信息。如果一個磁碟發(fā)生故障,可以在線更換故障盤,并通過另3個磁碟和校驗(yàn)盤重新創(chuàng)建新盤上的數(shù)據(jù)。RAID5將校驗(yàn)信息分布在5個磁碟上,這樣可更換任一磁碟,其余與RAID3相同。
I/O卡:對伺服器來說,主要指網(wǎng)卡和硬碟控制卡的冗余。網(wǎng)卡冗余是在伺服器中插上雙網(wǎng)卡。冗余網(wǎng)卡技術(shù)原為大型機(jī)及中型機(jī)上的技術(shù),現(xiàn)在也逐漸被PC伺服器所擁有。PC伺服器如Micron公司的NetFRAME9200最多實(shí)現(xiàn)4個網(wǎng)卡的冗余,這4個網(wǎng)卡各承擔(dān)25%的網(wǎng)路流量??蛋毓镜乃蠵roSignia/Proliant伺服器都具有容錯冗余雙網(wǎng)卡。
PCI匯流排:代表Micron公司最高技術(shù)水平的產(chǎn)品NetFRAME 9200采用三重對等PCI技術(shù),化PCI匯流排的帶寬,提升硬碟、網(wǎng)卡等高速設(shè)備的數(shù)據(jù)傳輸速度。
CPU:系統(tǒng)中主處理器并不會經(jīng)常出現(xiàn)故障,但對稱多處理器(SMP)能讓多個CPU分擔(dān)工作以提供某種程度的容錯。
循環(huán)冗余檢查(Cyclical Redundancy Check),就是在每個數(shù)據(jù)塊(稱之為幀)中加入一個FCS(Frame CheckSequence,幀檢查序列)。FCS包含了幀的詳細(xì)信息,專門用于發(fā)送/接收裝置比較幀的正確與否。如果數(shù)據(jù)有誤,則再次發(fā)送。是一種數(shù)據(jù)傳輸檢錯功能,對數(shù)據(jù)進(jìn)行多項式計算,在每個數(shù)據(jù)塊(稱之為幀)中加入一個FCS(Frame Check Sequence幀檢查序列)并將得到的結(jié)果附在幀的后面,F(xiàn)CS包含了幀的詳細(xì)信息,專門用于發(fā)送/接收裝置比較幀的正確與否。接收設(shè)備也執(zhí)行類似的演算法,以保證數(shù)據(jù)傳輸?shù)恼_性和完整性。若CRC校驗(yàn)不通過,系統(tǒng)重復(fù)向硬碟復(fù)制數(shù)據(jù),陷入死循環(huán),導(dǎo)致復(fù)制過程無法完成。
應(yīng)用:DHCP 故障轉(zhuǎn)移操作的熱備用服務(wù)器模式是最適合于部署其中總公司或數(shù)據(jù)中心服務(wù)器扮演到位于遠(yuǎn)程站點(diǎn),這是 DHCP 客戶端的本地服務(wù)器的備用備份服務(wù)器 (ex: 中心與分支部署)。 在這種部署中,在本地 DHCP 服務(wù)器沒有不可用的情況下讓一臺遠(yuǎn)程的備份服務(wù)器服務(wù)于任何客戶端,都是不可取的。 下圖是中心與分支部署的示例。
在此示例中,四個遠(yuǎn)程站點(diǎn)每個具有主 (活動) 的 DHCP 服務(wù)器現(xiàn)場備用服務(wù)器位于遠(yuǎn)程位置在中央站點(diǎn)。 在中央站點(diǎn)的備用服務(wù)器也可能用于在中央站點(diǎn),一個子網(wǎng)的活動 DHCP 服務(wù)器或其唯一的函數(shù)可用作備用服務(wù)器的站點(diǎn) 1-4。 即使不主動提供這些租約可以查看所有四個站點(diǎn)的客戶端租用的中心的 DHCP 服務(wù)器上。
在熱備用服務(wù)器模式下,兩臺服務(wù)器在故障轉(zhuǎn)移關(guān)系下操作,其中活躍的服務(wù)器負(fù)責(zé)租出 IP 地址并向作用域或子網(wǎng)中的所有客戶端配置信息。 伙伴服務(wù)器假定的備用角色與責(zé)任僅當(dāng)活動服務(wù)器變?yōu)椴豢捎媒o DHCP 客戶端發(fā)布租約。 熱備用服務(wù)器模式非常適合于其中的故障轉(zhuǎn)移伙伴只是暫時當(dāng)活動的服務(wù)器不可用時要使用的方案。
服務(wù)器是活動狀態(tài)還是備用故障轉(zhuǎn)移關(guān)系的上下文中。 例如,對于某個給定的關(guān)系處于活動狀態(tài)的角色的服務(wù)器可能是另一個關(guān)系的備用服務(wù)器。 默認(rèn)情況下,用來創(chuàng)建故障轉(zhuǎn)移關(guān)系的服務(wù)器是活動的服務(wù)器,但這不是必需。
當(dāng)選擇熱備用服務(wù)器時,還必須僅供使用備用服務(wù)器上的事件中活動的服務(wù)器不響應(yīng)的活動服務(wù)器上配置的 IP 地址的百分比。 默認(rèn)情況下,此預(yù)留百分比為 5%。
預(yù)留百分比用于新的 DHCP 租約。 如果 DHCP 客戶端嘗試?yán)m(xù)訂 DHCP 租約與無法聯(lián)系 (通信 INTERRUPTED 或合作伙伴向下狀態(tài)存在) 活動服務(wù)器的備用服務(wù)器,則將續(xù)訂相同先前已指派給 DHCP 客戶端的 IP 地址。 在此情況下,臨時租約授予的最大客戶端提前期 (MCLT) 的持續(xù)時間、 不完整的作用域租約時間。
處于通信中斷或合作伙伴向下狀態(tài)時,如果備用服務(wù)器給新的 DHCP 客戶端發(fā)出其所有可用的預(yù)留百分比租約,MCLT 過期之前,它將拒絕發(fā)布新的 DHCP 租約,但它將繼續(xù)續(xù)訂現(xiàn)有租約。 MCLT 到期后,備用服務(wù)器將不允許使用新的 DHCP 租用的整個可用的 IP 地址池提供的服務(wù)器是在伙伴關(guān)閉狀態(tài)。 如果服務(wù)器是仍在通信中斷狀態(tài),它將為新的 DHCP 租約不使用整個可用的 IP 地址池。3