共享競爭優勢,尋求互利雙贏
RAID (redundant array of independent disks)技術使得用戶除了使用硬盤存儲數據之外,還能得到更多像是數據保護、容錯、增加執行效能及擴大存儲容量的用途。在磁盤陣列日漸普及的今天,不論是已經存在的用戶或是準備建置并應用盤陣技術的潛在用戶,都需要了解一下如何建置一個可以正常運行的磁盤陣列系統,以確保您所服務的或擁有的企業或單位的重要數據能被妥善的保管及應用,并利用盤陣技術簡化工作的流程及節約數據存儲工作的時間。在此,特提出建置盤陣的十個注意事項,供大家參考:
盤陣的比較:
在比較盤陣系統時不要只關注CPU的時鐘速度,因為它并不意味著更快的盤陣執行效能;我們應該著眼于執行效能的計算(MB/Sec 或 IOPS)。只有當2個盤陣系統具有同樣的RAID ASIC、RAID Firmware及硬件設計時,比較CPU的時鐘速度才變得有意義。每一個盤陣產品的制造商提供的CPU、機構、韌體、硬件、RAID ASIC等是不同的,因此單獨比較CPU時鐘速度并不是衡量執行效能的一個可靠而清晰的比較標準。
保持空氣流通:
如果你已經購買了24或16盤位的盤陣子系統以迎合未來數據的成長,不用著急將每個插槽都安裝硬盤,可以先安裝硬盤托架在機殼中,這樣還能確保足夠的空氣流通。一般用戶總以為,沒有安裝硬盤的插槽,如果不把硬盤抽取盒裝上去,可以增加盤陣的空氣流通,可是正好相反,一般的盤陣風扇設計,都是經過仔細的流體力學模擬,能保證系統在插滿抽取盒的情況下,保持良好的空氣流動,并降低系統溫度,任意的抽去抽取盒,反而可能造成空氣流動不順暢,導致溫度上升。
讓管理更簡單:
就像許多的盤陣用戶,如果你已經建置了數十個或是上百臺的盤陣,此時由于制作盤陣的等級(0,1,3,5…等)的不同與邏輯卷、邏輯硬盤劃分的不同,而這些設置又各自對應不同的主機,這些原因將使得整個盤陣系統內部配置的關系變得非常的繁瑣。為了管理這個龐大而繁瑣的盤陣集群,我們可以用顯示字串的方式做為管理軟件管理的依據,這樣有助于管理者快速地搜尋到一個特定的盤陣單元。這些字串可以使用像是 IP address、或盤陣所連接主機電腦的名字、或甚至給予盤陣一個名字或編號。這樣主機與盤陣間可以用名字來建立其相互間的對應關系,在管理上就一目了然了。
如何確保從 RAID5 遷移到 RAID6時,系統有足夠的存儲空間:
在進行盤陣轉移計劃之前,先確認在盤陣中有足夠的未分配存儲空間或尚未使用的硬盤。RAID6 比 RAID5 多一組校驗碼,因此當我們要把盤陣中的數據,從 RAID5 遷移到 RAID6 時,必須確認盤陣中有足夠的空間,來存儲新增加的這組校驗碼。例如,如果決定將3塊設定成 RAID5硬盤中的數據遷移到RAID6,這時候我們需要增加一塊額外的硬盤,或是原來的硬盤中具有足夠的、未分配的空間以存放第二次校驗的校驗碼。我們怎樣判定原來硬盤中還有足夠的未分配空間呢?這個問題要從制作RAID 5之初開始說起。在開始制作盤陣的時候,硬盤使用的宣告初始值默認為硬盤容量的全部,例如:將4塊147G硬盤做成 RAID 5 ,以默認的初始值宣告盤陣的可使用空間,其總容量為147G*3。在這樣設定的前提下,如果遷移發生的時候,我們有2種選擇。第一是增加一塊同級的新硬盤(建議使用);第二是將數據導出,重新制作RAID6,再將數據導回。另外一種情況是在一開始制作RAID5的時候,就已經宣告本盤陣的可使用空間,未被宣告的剩余空間就是這里所謂的未分配空間。在有未分配空間而遷移需求發生的時候,如果其中一塊硬盤的未分配空間的容量大于已宣告的可使用空間的幾分之一(視硬盤數而異),這個時候我們可以判定盤陣系統具有足夠的未分配空間來確保數據遷移的正常運行。例如:我們用3塊147G硬盤做成 RAID 5,并在制作之初宣告90G的可使用空間,這時候是從每一塊硬盤撥出30G的空間。而每一塊硬盤都有117G的未分配空間。當遷移發生的時候,因為未分配空間117G大于90G的三分之一30G,所以我們可以判定具有足夠的空間來進行遷移。如果小于的話,我們建議你增加一塊同級的新硬盤來進行遷移。
保護內存里的數據:
備援電池的功能是確保萬一當主電源故障或突然斷電時內存里的數據不流失,因此如何確保備援電池的正常運行就顯得格外重要。備援電池在2種情況下,系統視為無法正常運行以保護內存里的數據。一是壞掉的時候,背板的LED燈將亮起紅燈。一是電池充電的時候,背板的LED燈將亮起黃燈。備援電池的使用壽命是根據充電的次數及電力釋放的周期而變化的,這取決于用戶本身對盤陣的使用情況,一般而言我們建議最好在盤陣使用了12個月之后更換備援電池模塊(BBU)。備援電池在正常情況下充滿電的時候是3.5V,當其電力降至2.7V的時候將自動進入充電狀態,此時系統因為保護內存數據不流失的電力消失,自動地將數據的寫入切換成“Write-Through”模式;當充完電后,又自動切換回“Write-Back”模式。這個動作是在事件啟動裝置(Event Trigger)功能來執行的,在安裝管理軟件的時候,事件啟動裝置對備援電池的管理初始值是打開的(Enable)。如果你沒有更改過初始設置,那么上述的動作就會正常的運行。如果備援電池已經壞掉,不能正常保護內存里的數據時,而事件啟動裝置對備援電池的管理是設定在關閉的狀態下,我們建議你手動將數據寫入模式更改為“Write-Through”模式,以免數據寫入沒有電力保護的內存中而主電源故障或突然斷電時,這些正在寫入的數據就遺失了。
檢查寫入動作:
介質掃描(Media Scan)是Firmware的主要功能之一,其作用有二:管理硬盤掃描與壞塊處理。介質掃描功能應該正常地執行,只要一有壞塊就處理,是一種提前預防并保障數據安全不流失的功能。如果太久沒有執行這個功能,萬一一組數據有2個或多個壞塊的情況發生時,數據就無法挽回了。介質掃描的執行也不好太過頻繁,主要是考慮硬盤的使用壽命,這點還是視用戶的使用情況而定。建議:我們可以用任務時程功能來設定介質掃描在固定的時間自動執行,例如每周或每月等。另外一種確保數據正確寫入的方式是啟動 “Write-Verify” 的功能做為正常的寫入模式,這個功能會自動核對寫入硬盤數據的正確性。但由于每筆數據均會檢查,對盤陣執行的效能是會有一定影響的。
減少延遲:
當關閉內存“Write-Back”功能時就進入了“Write-Through”的模式,這時候主機數據是不會寫入內存而直接寫入硬盤的。在“Write-Through”模式下,所有的硬盤將與其相關的主機以適當的方式存取數據塊,而大多數的時候硬盤處于接受寫命令的狀態。此時盤陣只要從主機接收到寫入的命令,硬盤的讀寫頭就會去尋找讀寫的位置,并等待硬盤處于可寫入的狀態,這個等待的現象就是所謂的延遲(Latency Time),而硬盤經常處于等待寫入的狀態,增加了延遲的時間,不但縮短硬盤的使用壽命,并且系統也比較耗電。當打開內存的“Write-Back”功能時,從主機寫入硬盤的數據先被寫在內存里,在內存寫滿數據時盤陣控制器會將存在于內存的數據大量地寫入硬盤。 這個內存“Write-Back”的模式將主機寫入的命令以寫入內存來取代,可以大幅減少硬盤延遲的時間,并且相較于“Write-Through”模式,在大多數的時候提供更佳的寫入政策。
避免使用低速的PCI設備:
如何讓盤陣達到最佳的執行效能呢?一般來說,影響執行效能的因素可能是來自主機端上用以安裝 SCSI 卡或者光纖通道的HBA卡的 PCI 插槽及這些卡本身的效能。通常我們會分配主機電腦上的一個或是2個PCI插槽作為連接盤陣之用,如果這些插槽是那種看起來與正常PCI插槽一樣,但卻以較低的速度在運行的PCI設備時,就會影響盤陣的執行效能。PCI總線有分PCI、PCI-X與PCI-E,其頻寬也不盡相同,還要注意與SCSI卡或HBA卡本身的匹配。另外,盤陣的執行效能還取決于電腦的內部設計,在許多情況下多個 PCI 設備會分散 PCI 的頻寬,分散的結果限制了使用SCSI/光纖通道HBA卡本身應該具備的最大執行效能,也就是說,在電腦主機上我們應該盡量減少不必要的PCI設備,使PCI的速度能得到最佳狀態。
為數據成長做計劃:
創建盤陣邏輯硬盤的時候,要計劃能容納未來的硬盤容量需求,并且注意從不同制造商取得的硬盤其容量看似一樣,但實際上其容量大小是有差異的。硬盤的存儲容量是依據有效的數據塊數量來測算的,通常這些數據塊被歸類為在硬盤上的LBA(Logical Block Address, 每一塊是512 bytes). 在盤陣邏輯硬盤中所有的硬盤容量會以最低容量的一塊硬盤來進行格式化,例如在設定為RAID 5 的邏輯硬盤中有三塊硬盤,其容量分別是100、99及101個數據塊,在設定成RAID 5的時候,每塊硬盤最大的數據塊只能為99個數據塊。這種硬盤容量的差異意味著當一個硬盤毀損而替代的硬盤容量小于舊硬盤中最小硬盤容量1%的時候系統是不會進行硬盤重建的。因此,我們最好選擇同一廠牌同型號的硬盤來進行重建。
不只是硬件的拷貝:
保留盤陣的配置及記錄與主機連接方案是非常必要的,就像是一個完整的系統正在進行更新,而這個更新的對象不是同一種產品,例如是不同的供應商所提供的不同產品,它可能是主機、可能是HBA卡、可能是Switch、可能是連接的端口及電纜線、也可能是盤陣。這個原來的盤陣配置檔案可以讓我們快速地從舊的配置中區設定新的配置,而與主機連接方案的記錄也可以讓我們迅速地依照以前的連接情況為更新的盤陣環境進行重建與設定,并且讓它正常的運行。
?2023深圳拓普龍科技有限公司 版權所有 粵ICP備09130463號-1