專利名稱:控制計(jì)算機(jī)單元之間存儲(chǔ)訪問(wèn)的計(jì)算機(jī)集群、計(jì)算機(jī)單元和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及關(guān)鍵環(huán)境中的計(jì)算機(jī)系統(tǒng)。具體來(lái)說(shuō),本發(fā)明涉及冗余計(jì)算機(jī)集群和其中使用例如服務(wù)器節(jié)點(diǎn)的計(jì)算機(jī)單元之間的存儲(chǔ)訪問(wèn)轉(zhuǎn)移來(lái)協(xié)助切換。
現(xiàn)有技術(shù)說(shuō)明可靠性是通信網(wǎng)絡(luò)或一般任何其他關(guān)鍵系統(tǒng)環(huán)境中的一個(gè)重要因素。盡管實(shí)際上在計(jì)算機(jī)硬件和軟件中可能有故障,仍向最終用戶提供持續(xù)不間斷的服務(wù)體驗(yàn)是重要的。最小化事務(wù)處理中的中斷是重要的。事務(wù)處理的示例可包括數(shù)據(jù)通信會(huì)話和數(shù)據(jù)庫(kù)事務(wù)處理。再者,必須可以在不影響最終用戶體驗(yàn)的前提下在計(jì)算機(jī)系統(tǒng)中執(zhí)行管理動(dòng)作。例如,必須可以盡可能透明和快速地激活、去活、添加、移除和替換子系統(tǒng)。在關(guān)鍵環(huán)境中,復(fù)制包括硬件和/或軟件的子系統(tǒng),以便有后備子系統(tǒng)準(zhǔn)備就緒來(lái)替換變得有故障的子系統(tǒng)。這種子系統(tǒng)常??蔁崆袚Q。可以復(fù)制子系統(tǒng),使得對(duì)于每個(gè)活動(dòng)子系統(tǒng)都有一個(gè)后備子系統(tǒng)或者使得對(duì)于一組子系統(tǒng)有一個(gè)后備子系統(tǒng)。在該情況中,子系統(tǒng)意味著包括至少一個(gè)硬件單元的集合和/或包括至少一個(gè)軟件組件的集合。硬件單元可以是例如處理器單元、接口卡和通信鏈路。軟件組件可以是例如處理器單元中執(zhí)行的一組進(jìn)程或一組線程。子系統(tǒng)還可以同時(shí)包括軟件和硬件。例如,通信鏈路子系統(tǒng)可以包括線路接口卡和在相關(guān)聯(lián)的處理器單元中執(zhí)行的進(jìn)程集合。通常,有許多相似的線路接口卡,各包括含線路接口卡硬件和在該線路接口卡相關(guān)聯(lián)的處理器單元中執(zhí)行的軟件的子系統(tǒng)。通常,后備子系統(tǒng),在軟件進(jìn)程的情況中即復(fù)制品,在與其活動(dòng)配對(duì)進(jìn)程不同的另一個(gè)計(jì)算機(jī)單元中執(zhí)行。
有一個(gè)聯(lián)盟稱為服務(wù)可用性論壇(SA論壇),正在開(kāi)發(fā)兩層的標(biāo)準(zhǔn)載波等級(jí)接口。如果一個(gè)系統(tǒng)具有不會(huì)喪失服務(wù)連續(xù)性和送達(dá)地提供不間斷服務(wù)的能力,則稱它為載波等級(jí)。SA論壇規(guī)范具有應(yīng)用接口和平臺(tái)接口。應(yīng)用接口提供對(duì)應(yīng)用軟件的標(biāo)準(zhǔn)工具集的訪問(wèn)以使用,以便將其處理分布在多個(gè)計(jì)算部件上。這些工具將不會(huì)喪失服務(wù)連續(xù)性和向任何用戶的送達(dá)地響應(yīng)那些部件的故障。這些工具通過(guò)符合應(yīng)用接口規(guī)范的管理中間件來(lái)提供。平臺(tái)接口用于訪問(wèn)操作系統(tǒng)級(jí)。其目的在于隱藏不同平臺(tái)之間的操作系統(tǒng)級(jí)差異。在SA論壇規(guī)范概念中,有多個(gè)服務(wù)組(SG),它們包括至少一個(gè)服務(wù)單元(SU)。每個(gè)SU又包括至少一個(gè)組件。組件可以是軟件進(jìn)程或線程。組件可以已與硬件單元相關(guān)聯(lián)。換言之,SU是一個(gè)子系統(tǒng),它可以是活動(dòng)子系統(tǒng)或作為活動(dòng)子系統(tǒng)的替代的冗余子系統(tǒng)。SU基于如下意義來(lái)復(fù)制,在SG中,有至少一個(gè)處于活動(dòng)狀態(tài)的SU和至少一個(gè)處于待機(jī)狀態(tài)的SU。處于待機(jī)狀態(tài)的SU將充當(dāng)處于活動(dòng)狀態(tài)的SU的后備復(fù)制品。如果活動(dòng)SU變得有故障或因維護(hù)而停機(jī),則復(fù)制品SU變成活動(dòng)的,并接管故障或停機(jī)的SU的任務(wù)。本文使用來(lái)自SA論壇規(guī)范的概念來(lái)用于說(shuō)明目的。可以其他等效概念來(lái)替換它們。因此本發(fā)明及其實(shí)施例不限于明確符合SA論壇規(guī)范的系統(tǒng)和實(shí)現(xiàn)。
現(xiàn)在參考圖1,圖中說(shuō)明上述SA論壇規(guī)范概念。在圖1中,有具有計(jì)算機(jī)單元110和112的冗余兩單元計(jì)算機(jī)集群。使用通信信道104連接計(jì)算機(jī)單元。通信信道104可以是例如以太網(wǎng)段或PCI總線。有三個(gè)SG,即SG140-144。在每個(gè)SG中,有兩個(gè)SU。在SG140中有SU120和130,在SG142中有SU122和SU132,以及在SG144中有SU124和134。SU120、132和124處于活動(dòng)狀態(tài),SU130、122和134處于待機(jī)狀態(tài)。對(duì)于每個(gè)活動(dòng)SU,有一個(gè)處于待機(jī)狀態(tài)的備用SU。例如,若因SU132中的某個(gè)故障或管理動(dòng)作導(dǎo)致SG142中有切換,則SU122變成活動(dòng)的且接管SU132的任務(wù)。SU132的狀態(tài)變成“待機(jī)”或“不存在”或反映SU132中的狀況的任何其他狀態(tài)。如果在計(jì)算機(jī)單元級(jí)發(fā)生故障和計(jì)算機(jī)單元110出故障,則計(jì)算機(jī)單元112中的SU130-134必須代替出故障的計(jì)算機(jī)單元110中的對(duì)等SU120-124。
在冗余計(jì)算機(jī)集群中,例如在活動(dòng)-待機(jī)冗余性中,冗余應(yīng)用通常因軟件局限將一次僅經(jīng)由一個(gè)單元,即節(jié)點(diǎn)來(lái)訪問(wèn)給定的共享數(shù)據(jù)存儲(chǔ)資源。在此上下文中數(shù)據(jù)存儲(chǔ)資源意味著例如文件系統(tǒng)(FS)、軟件RAID(獨(dú)立盤(pán)的冗余陣列)或邏輯卷管理(LVM)的邏輯卷。在此上下文中,數(shù)據(jù)存儲(chǔ)訪問(wèn)建立意味著,例如,文件系統(tǒng)(FS)安裝、軟件RAID(獨(dú)立盤(pán)的冗余陣列)啟動(dòng)或邏輯卷管理(LVM)的邏輯卷部署。應(yīng)該注意,例如當(dāng)軟件RAID在一個(gè)單元中啟動(dòng)時(shí),它僅包括為從軟件RAID讀取或向其中寫(xiě)入而在操作系統(tǒng)級(jí)上就緒的建立。文件系統(tǒng)通常較早已經(jīng)創(chuàng)建,所以它不是軟件RAID啟動(dòng)的問(wèn)題。一次只能從一個(gè)單元建立對(duì)數(shù)據(jù)存儲(chǔ)資源的讀寫(xiě)訪問(wèn),以便避免例如文件系統(tǒng)崩潰或數(shù)據(jù)存儲(chǔ)資源的任何不相干狀態(tài)。數(shù)據(jù)存儲(chǔ)資源的讀寫(xiě)訪問(wèn)意味著,允許建立了對(duì)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn)的實(shí)體修改數(shù)據(jù)存儲(chǔ)資源中的數(shù)據(jù)的訪問(wèn)。如果單元已經(jīng)建立對(duì)給定數(shù)據(jù)存儲(chǔ)資源的讀寫(xiě)訪問(wèn),通常任何其他單元就不能建立甚至對(duì)該數(shù)據(jù)存儲(chǔ)資源的讀訪問(wèn)。在文件系統(tǒng)讀寫(xiě)安裝中更是如此。
在讀訪問(wèn)建立的情況中,對(duì)于執(zhí)行了訪問(wèn)建立的實(shí)體,允許數(shù)據(jù)存儲(chǔ)資源的只讀。
從用戶的角度來(lái)看,軟件RAID表現(xiàn)得像是任何塊裝置,例如單個(gè)盤(pán)上的分區(qū)。換言之,它是虛擬裝置。在軟件RAID上,可以像對(duì)任何其他塊裝置一樣創(chuàng)建文件系統(tǒng)。換言之,可以對(duì)它格式化。文件系統(tǒng)的示例是從Linux操作系統(tǒng)熟悉的ext2和Reiserfs。在Linux中,給定文件系統(tǒng)的安裝包括將其中所含的目錄結(jié)構(gòu)連接到執(zhí)行該安裝的計(jì)算機(jī)的目錄結(jié)構(gòu)。將目錄結(jié)構(gòu)安裝在指定安裝點(diǎn),即該目錄結(jié)構(gòu)內(nèi)的某個(gè)子目錄。在安裝期間,可以由計(jì)算機(jī)易失性存儲(chǔ)器中的操作系統(tǒng)至少部分地緩存從存儲(chǔ)卷檢索的文件系統(tǒng)目錄結(jié)構(gòu)。還可以從存儲(chǔ)卷檢索一些其他文件系統(tǒng)信息,并在安裝期間緩存,例如盤(pán)空間分配信息。文件系統(tǒng)的安裝在任何現(xiàn)存的操作系統(tǒng),如Microsoft Windows中基本相似。差異主要涉及如何標(biāo)識(shí)安裝的文件系統(tǒng)上的文件的機(jī)制。例如,在Windows中不是將它們連接到單個(gè)目錄樹(shù),而是使用如A、D、E、F等字母來(lái)標(biāo)識(shí)安裝的文件系統(tǒng)。通常字母C表示本地硬盤(pán)驅(qū)動(dòng)器。
在本文中,安裝意味著已經(jīng)為一般文件訪問(wèn)操作系統(tǒng)服務(wù),例如在執(zhí)行該安裝的系統(tǒng)中打開(kāi)、讀取、寫(xiě)入和關(guān)閉,準(zhǔn)備好了要安裝的文件系統(tǒng)。文件訪問(wèn)操作系統(tǒng)服務(wù)使它們根據(jù)單個(gè)可標(biāo)識(shí)文件而非大量輔助存儲(chǔ)來(lái)操作。
對(duì)于多個(gè)單元,可以訪問(wèn)一個(gè)給定文件系統(tǒng),使得它們僅只讀安裝文件系統(tǒng)。實(shí)際中,活動(dòng)單元或活動(dòng)軟件實(shí)體,即活動(dòng)子系統(tǒng),將是訪問(wèn)該文件系統(tǒng)并擁有其讀寫(xiě)安裝的一個(gè)子系統(tǒng)。類似地,在軟件RAID的情況中,活動(dòng)單元或活動(dòng)軟件實(shí)體將是建立并擁有對(duì)該軟件RAID的讀寫(xiě)訪問(wèn)的一個(gè)實(shí)體。在SA論壇術(shù)語(yǔ)中,這意味著活動(dòng)SU將擁有對(duì)數(shù)據(jù)存儲(chǔ)資源的讀寫(xiě)訪問(wèn)。這意味著它擁有例如文件系統(tǒng)安裝、軟件RAID訪問(wèn)或LVM訪問(wèn)。如果活動(dòng)實(shí)體,即活動(dòng)SU發(fā)生故障,或者如果例如因?yàn)檐浖?jí)或任何其他管理動(dòng)作,操作員必須切換活動(dòng)-待機(jī)角色,則必須將數(shù)據(jù)存儲(chǔ)資源訪問(wèn)安全地從舊SU轉(zhuǎn)移到新SU,即,通常從第一單元轉(zhuǎn)到第二單元。
現(xiàn)在參考圖2,該圖說(shuō)明上文討論的策略。在圖2中,有具有計(jì)算機(jī)單元110和112的冗余兩單元計(jì)算機(jī)集群。使用通信信道104連接計(jì)算機(jī)單元,其中通信信道104是局域網(wǎng)(以太網(wǎng))。使用光纖信道202將計(jì)算機(jī)單元連接到盤(pán)存儲(chǔ)單元200,光纖信道202提供高帶寬訪問(wèn)。盤(pán)存儲(chǔ)單元具有卷250、252和254。已經(jīng)分別為卷分配了卷標(biāo)V1、V2和V3。在此情況中,卷是實(shí)際可以是硬盤(pán)驅(qū)動(dòng)器、一組硬盤(pán)驅(qū)動(dòng)器或硬盤(pán)驅(qū)動(dòng)器內(nèi)包括該硬盤(pán)驅(qū)動(dòng)器中指定數(shù)量的柱面的分區(qū)的抽象。卷還可以是RAID邏輯卷。概念卷表示一塊存儲(chǔ)區(qū),它在邏輯上看是毗鄰的且可以使用標(biāo)準(zhǔn)機(jī)制來(lái)訪問(wèn)。可以在卷中創(chuàng)建文件系統(tǒng)。文件系統(tǒng)可以是例如Linux ext2或Reiserfs。文件系統(tǒng)的其他示例是Microsoft Windows操作系統(tǒng)中的NTFS和FAT32。文件系統(tǒng)包括卷上的目錄、文件和訪問(wèn)數(shù)據(jù)結(jié)構(gòu)及其存儲(chǔ)格式。卷250、252和254上分別創(chuàng)建了文件系統(tǒng)260、262和264。在文件系統(tǒng)創(chuàng)建步驟期間,將文件系統(tǒng)數(shù)據(jù)結(jié)構(gòu)分配并創(chuàng)建到卷。在圖2的情況中,文件系統(tǒng)260、262和264是Linux ext2文件系統(tǒng)。計(jì)算機(jī)單元110和112分別在操作系統(tǒng)220和222下操作。操作系統(tǒng)220具有讀寫(xiě)安裝的文件系統(tǒng)260和讀安裝的文件系統(tǒng)264。圖2中使用操作系統(tǒng)與文件系統(tǒng)之間箭頭的方向說(shuō)明了這一點(diǎn)。而操作系統(tǒng)222具有讀寫(xiě)安裝的文件系統(tǒng)262和讀安裝的文件系統(tǒng)264。這反映如下原理,如果單個(gè)單元讀寫(xiě)安裝給定的文件系統(tǒng),則其他單元不得安裝它。如果每個(gè)安裝單元只讀安裝給定卷,則多個(gè)單元可安裝它。如果在計(jì)算機(jī)單元110中執(zhí)行的活動(dòng)SU應(yīng)該轉(zhuǎn)到待機(jī)狀態(tài),而計(jì)算機(jī)單元112中執(zhí)行的被動(dòng)SU應(yīng)該變成活動(dòng)的,則在該SU需要對(duì)文件系統(tǒng)260讀寫(xiě)訪問(wèn)的情況下產(chǎn)生問(wèn)題。當(dāng)計(jì)算機(jī)單元112中執(zhí)行的后備SU進(jìn)入活動(dòng)狀態(tài)時(shí),文件系統(tǒng)260仍在計(jì)算機(jī)單元112上未安裝,SU不可能從文件系統(tǒng)260讀取或向其中寫(xiě)入。如圖2所示的解決方案的一個(gè)問(wèn)題是文件系統(tǒng)安裝在本機(jī)操作系統(tǒng),例如在Linux級(jí)上發(fā)生。如果有切換在其中待機(jī)SU必須接替活動(dòng)SU的SG級(jí)上發(fā)生,則可能不會(huì)影響或通知操作系統(tǒng)。因此,這種SG級(jí)切換在操作系統(tǒng)級(jí)上是透明的。
為了克服上述問(wèn)題,可以應(yīng)用現(xiàn)有技術(shù)中的一些解決方案。這樣一種解決方案是使用網(wǎng)絡(luò)文件系統(tǒng)(NFS)從計(jì)算機(jī)單元110和112來(lái)使用文件系統(tǒng)260和262。在NFS中,對(duì)于兩個(gè)計(jì)算機(jī)單元,可以同時(shí)以讀寫(xiě)模式訪問(wèn)這兩個(gè)文件系統(tǒng)。但是,文件系統(tǒng)內(nèi)僅分開(kāi)的文件變成同時(shí)可訪問(wèn)。無(wú)論何時(shí)用戶打開(kāi)給定文件來(lái)寫(xiě)入,則它對(duì)于其他同時(shí)用戶變成只讀可訪問(wèn)。
現(xiàn)在參考圖3,該圖說(shuō)明如NFS之類的網(wǎng)絡(luò)文件系統(tǒng)的使用。在圖3中,有具有計(jì)算機(jī)單元110和112的冗余兩單元計(jì)算機(jī)集群。使用通信信道104連接計(jì)算機(jī)單元。通信信道104可以是例如以太網(wǎng)段或PCI總線。計(jì)算機(jī)單元110和112連接到運(yùn)行NFS的文件服務(wù)器300。文件服務(wù)器300使用光纖信道連接到盤(pán)存儲(chǔ)單元200。盤(pán)存儲(chǔ)單元200具有如圖2所示的文件系統(tǒng)260和262。文件服務(wù)器300具有NFS,它使如計(jì)算機(jī)單元110和112之類的遠(yuǎn)程客戶機(jī)能夠建立對(duì)實(shí)際僅在文件服務(wù)器300上安裝的文件系統(tǒng)的讀寫(xiě)訪問(wèn)。在遠(yuǎn)程客戶機(jī)中,NFS安裝模仿本地安裝?,F(xiàn)在,對(duì)于計(jì)算機(jī)單元110可以執(zhí)行同時(shí)對(duì)文件系統(tǒng)260和262的讀寫(xiě)NFS安裝?,F(xiàn)在有從計(jì)算機(jī)單元110對(duì)文件系統(tǒng)260和262的讀寫(xiě)NFS安裝320和322。相似地,現(xiàn)在有從計(jì)算機(jī)單元112對(duì)文件系統(tǒng)260和262的讀寫(xiě)NFS安裝324和326。
如圖3所示的現(xiàn)有技術(shù)的基于NFS安裝的解決方案的缺點(diǎn)是性能差。比起這種情況計(jì)算機(jī)單元110和112與盤(pán)存儲(chǔ)單元200接口并能夠在沒(méi)有另一個(gè)計(jì)算機(jī)單元及其介入網(wǎng)絡(luò)文件系統(tǒng)軟件的情況下往返盤(pán)存儲(chǔ)單元200移動(dòng)大的盤(pán)塊序列,文件服務(wù)器300和NFS的使用顯著減慢對(duì)文件系統(tǒng)260和262的訪問(wèn)。此外,必須將盤(pán)訪問(wèn)安全地從舊SU轉(zhuǎn)移到新SU,以便不會(huì)有這些單元以讀寫(xiě)訪問(wèn)模式同時(shí)訪問(wèn)相同的邏輯存儲(chǔ)實(shí)體、例如文件系統(tǒng)時(shí)的重疊時(shí)刻。由此,可以保持文件系統(tǒng)一致性。如圖3所示的現(xiàn)有技術(shù)的基于NFS安裝的解決方案的另一個(gè)缺點(diǎn)是文件服務(wù)器300變成系統(tǒng)中的單一故障點(diǎn)。如果復(fù)制文件服務(wù)器300,則產(chǎn)生如圖2所示的相同問(wèn)題,因?yàn)槲募?wù)器300的復(fù)制品會(huì)同時(shí)需要文件系統(tǒng)260和262的同時(shí)讀寫(xiě)安裝。因此,基本未改進(jìn)此狀況。
發(fā)明目的本發(fā)明的目的是解決上述問(wèn)題。具體來(lái)說(shuō),本發(fā)明的目的在于確保切換期間服務(wù)單元之間讀寫(xiě)安裝的可靠傳遞。
發(fā)明概述本發(fā)明涉及用于執(zhí)行冗余計(jì)算機(jī)集群中的切換的方法,所述冗余計(jì)算機(jī)集群至少包括第一計(jì)算機(jī)單元、第二計(jì)算機(jī)單元和共享存儲(chǔ)單元。第一和第二計(jì)算機(jī)單元與共享存儲(chǔ)單元接口,它包括由計(jì)算機(jī)集群中執(zhí)行的復(fù)制服務(wù)單元訪問(wèn)的至少一個(gè)數(shù)據(jù)存儲(chǔ)資源。在該方法中,檢測(cè)與復(fù)制服務(wù)單元相關(guān)聯(lián)的切換狀況;由第一計(jì)算機(jī)單元釋放對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);由第二計(jì)算機(jī)單元對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源建立訪問(wèn);以及允許服務(wù)單元的復(fù)制品在第二計(jì)算機(jī)單元中變成活動(dòng)的。
本發(fā)明還涉及冗余計(jì)算機(jī)集群,其中至少包括第一計(jì)算機(jī)單元、第二計(jì)算機(jī)單元和共享存儲(chǔ)單元。第一和第二計(jì)算機(jī)單元與共享存儲(chǔ)單元接口,它包括由計(jì)算機(jī)集群中執(zhí)行的復(fù)制服務(wù)單元訪問(wèn)的至少一個(gè)數(shù)據(jù)存儲(chǔ)資源。該計(jì)算機(jī)集群還包括切換控制部件,用于檢測(cè)與該復(fù)制服務(wù)單元相關(guān)聯(lián)的切換狀況;第一和第二計(jì)算機(jī)單元中的訪問(wèn)釋放部件,用于釋放對(duì)至少數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);第一和第二計(jì)算機(jī)單元中的訪問(wèn)建立部件,用于建立對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);以及切換控制部件,用于在對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的成功訪問(wèn)建立之后激活服務(wù)單元的復(fù)制品。
本發(fā)明還涉及與至少一個(gè)共享存儲(chǔ)單元接口的計(jì)算機(jī)單元。計(jì)算機(jī)單元執(zhí)行需要對(duì)共享存儲(chǔ)單元上的至少一個(gè)數(shù)據(jù)存儲(chǔ)資源訪問(wèn)的至少一個(gè)復(fù)制服務(wù)單元。該計(jì)算機(jī)單元還包括切換控制部件,用于檢測(cè)與至少一個(gè)復(fù)制服務(wù)單元中的任一個(gè)相關(guān)聯(lián)的切換狀況;訪問(wèn)釋放部件,用于釋放對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);訪問(wèn)建立部件,用于建立對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);切換控制部件,用于在對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的成功訪問(wèn)建立之后激活服務(wù)單元;以及切換控制部件,用于在成功釋放對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn)之后更替服務(wù)單元的狀態(tài)。
在本發(fā)明的一個(gè)實(shí)施例中,訪問(wèn)建立、釋放和切換控制部件是諸如進(jìn)程、線程或子例程的軟件組件。在本發(fā)明的一個(gè)實(shí)施例中,由與例如使用對(duì)數(shù)據(jù)存儲(chǔ)資源的讀寫(xiě)訪問(wèn)的每個(gè)服務(wù)單元相關(guān)聯(lián)的訪問(wèn)代理執(zhí)行訪問(wèn)建立和訪問(wèn)釋放步驟。訪問(wèn)代理可以是服務(wù)單元內(nèi)的組件。該組件可以是被切換控制系統(tǒng)視為服務(wù)單元的一部分的進(jìn)程或線程。切換控制系統(tǒng)可以包括若干切換控制服務(wù),即部件。當(dāng)正在更替服務(wù)單元的狀態(tài)時(shí),還就切換狀況以信號(hào)通知訪問(wèn)代理。由此,訪問(wèn)代理能夠檢測(cè)何時(shí)要執(zhí)行訪問(wèn)建立或訪問(wèn)的釋放。無(wú)需因訪問(wèn)代理的存在而變更操作系統(tǒng)級(jí)軟件。
在本發(fā)明一個(gè)實(shí)施例中,數(shù)據(jù)存儲(chǔ)資源是文件系統(tǒng),對(duì)文件系統(tǒng)的訪問(wèn)的建立是文件系統(tǒng)的安裝。類似地,釋放對(duì)文件系統(tǒng)的訪問(wèn)是文件系統(tǒng)的卸下。
在本發(fā)明的一個(gè)實(shí)施例中,共享存儲(chǔ)單元是包括若干物理存儲(chǔ)單元的邏輯單元。在該實(shí)施例中,如果使用RAID,數(shù)據(jù)存儲(chǔ)單元可以是例如RAID邏輯單元。在一個(gè)實(shí)施例中,共享存儲(chǔ)單元是單個(gè)物理存儲(chǔ)單元。
在本發(fā)明的一個(gè)實(shí)施例中,共享存儲(chǔ)單元是盤(pán)存儲(chǔ)單元。數(shù)據(jù)存儲(chǔ)資源可以是例如,軟件獨(dú)立盤(pán)的冗余陣列(RAID)或文件系統(tǒng)。在本發(fā)明的一個(gè)實(shí)施例中,第一和第二計(jì)算機(jī)單元使用外圍接口與共享存儲(chǔ)單元接口,該外圍接口可以是例如光纖信道(FC)、小型計(jì)算機(jī)系統(tǒng)接口(SCSI)、因特網(wǎng)小型計(jì)算機(jī)系統(tǒng)接口(iSCSI)或集成系統(tǒng)接口(ISA)。
本發(fā)明的益處涉及冗余多單元計(jì)算機(jī)集群中數(shù)據(jù)存儲(chǔ)資源訪問(wèn)的提高的性能和可靠性。避免了在安裝計(jì)算機(jī)單元和共享存儲(chǔ)單元之間使用中間單元和網(wǎng)絡(luò)文件系統(tǒng)軟件。由此避免了顯著的延遲。使得執(zhí)行計(jì)算機(jī)集群中的切換更靈活。通過(guò)在服務(wù)單元與已經(jīng)從服務(wù)單元建立對(duì)其的讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源之間設(shè)置關(guān)聯(lián)來(lái)實(shí)現(xiàn)此目的。由此將數(shù)據(jù)存儲(chǔ)資源訪問(wèn)轉(zhuǎn)移與服務(wù)單元的狀態(tài)及其中的組件服務(wù)示例綁定。再者,還使得分開(kāi)的服務(wù)組中的服務(wù)單元可以獨(dú)立地執(zhí)行切換成為可能。
附圖簡(jiǎn)介為提供對(duì)本發(fā)明的進(jìn)一步理解而包括的并構(gòu)成本說(shuō)明的一部分的
本發(fā)明的實(shí)施例,它們連同說(shuō)明幫助解釋本發(fā)明的原理。在這些圖中圖1是說(shuō)明現(xiàn)有技術(shù)的冗余兩單元計(jì)算機(jī)集群和SA論壇體系結(jié)構(gòu)的服務(wù)單元(SU)和服務(wù)組(SG)概念的框圖;圖2是說(shuō)明使用共享盤(pán)存儲(chǔ)單元的現(xiàn)有技術(shù)冗余兩單元計(jì)算機(jī)集群的框圖;圖3是說(shuō)明經(jīng)由公共文件服務(wù)器單元使用網(wǎng)絡(luò)文件系統(tǒng)的冗余兩單元計(jì)算機(jī)集群的框圖;圖4是說(shuō)明根據(jù)本發(fā)明在切換之前具有三個(gè)服務(wù)組和兩個(gè)數(shù)據(jù)存儲(chǔ)資源的冗余兩單元計(jì)算機(jī)集群的框圖;圖5是說(shuō)明根據(jù)本發(fā)明在切換之后具有三個(gè)服務(wù)組和兩個(gè)數(shù)據(jù)存儲(chǔ)資源的冗余兩單元計(jì)算機(jī)集群的框圖;以及圖6是說(shuō)明根據(jù)本發(fā)明的圖4或圖5的計(jì)算機(jī)集群中的數(shù)據(jù)存儲(chǔ)訪問(wèn)轉(zhuǎn)移方法的一個(gè)實(shí)施例的流程圖。
優(yōu)選實(shí)施例的詳細(xì)說(shuō)明現(xiàn)在將詳細(xì)地參考本發(fā)明的實(shí)施例,附圖中說(shuō)明其實(shí)例。
圖4是說(shuō)明包括具有計(jì)算機(jī)單元110和112的冗余兩單元計(jì)算機(jī)集群的本發(fā)明的一個(gè)實(shí)施例的框圖。在本發(fā)明的其他實(shí)施例中,還可以有任何其他數(shù)量的計(jì)算機(jī)單元。使用通信信道104來(lái)連接這些計(jì)算機(jī)單元,該通信信道104是局域網(wǎng)(以太網(wǎng))。在本發(fā)明的其他實(shí)施例中,該通信信道可以基于任何其他技術(shù)。使用信道202將這些計(jì)算機(jī)單元連接到存儲(chǔ)單元200,這提供高帶寬訪問(wèn)。信道202可以基于例如光纖信道(FC)、小型計(jì)算機(jī)系統(tǒng)接口(SCSI)接口、因特網(wǎng)SCSI(iSCSI)或集成系統(tǒng)體系結(jié)構(gòu)(ISA)總線。存儲(chǔ)單元200是包括至少一個(gè)硬盤(pán)驅(qū)動(dòng)器的硬盤(pán)單元。在本發(fā)明的其他實(shí)施例中,存儲(chǔ)單元200可以基于任何類型的非易失性存儲(chǔ)器,如硬盤(pán)驅(qū)動(dòng)器、光盤(pán)、磁帶單元或閃速存儲(chǔ)器。存儲(chǔ)單元200具有數(shù)據(jù)存儲(chǔ)資源260和262。數(shù)據(jù)存儲(chǔ)資源可以是例如文件系統(tǒng)、軟件RAID或LVM邏輯卷。有三個(gè)SG,即SG400-404。SG400具有SU410和420,SG 402具有SU412和422以及SG404具有SU414和424。SU420-424是SU410-414的復(fù)制品。如果將SU410-414其中之一脫離活動(dòng)狀態(tài),則使SU420-424中的對(duì)應(yīng)復(fù)制品進(jìn)入活動(dòng)狀態(tài)。在圖4中,SU410-414處于活動(dòng)狀態(tài),而SU422-424處于待機(jī)狀態(tài)。SU410已建立對(duì)數(shù)據(jù)存儲(chǔ)資源262的讀寫(xiě)訪問(wèn)。由此,SU410中存在數(shù)據(jù)存儲(chǔ)資源262的讀寫(xiě)訪問(wèn)432。如果數(shù)據(jù)存儲(chǔ)資源262是文件系統(tǒng),則SU已讀寫(xiě)安裝它。SU414已建立對(duì)數(shù)據(jù)存儲(chǔ)資源260的讀寫(xiě)訪問(wèn)。由此,SU414中存在數(shù)據(jù)存儲(chǔ)資源260的讀寫(xiě)訪問(wèn)430。圖4所示的情況一直是相似,直到發(fā)生切換,其中SU414必須離開(kāi)活動(dòng)狀態(tài)且SU424必須進(jìn)入活動(dòng)狀態(tài)。
在此情況中,必須傳遞讀寫(xiě)訪問(wèn)430,即轉(zhuǎn)移到SU424。有訪問(wèn)代理450、452、460和462。訪問(wèn)代理負(fù)責(zé)確??煽康厍乙允芸胤绞綇幕顒?dòng)SU將數(shù)據(jù)存儲(chǔ)資源的讀寫(xiě)訪問(wèn)傳遞到被動(dòng)SU。不得有活動(dòng)SU和被動(dòng)SU同時(shí)以讀寫(xiě)訪問(wèn)模式訪問(wèn)相同的數(shù)據(jù)存儲(chǔ)資源的重疊時(shí)刻。由此,可以保持文件系統(tǒng)或一般而言數(shù)據(jù)存儲(chǔ)區(qū)一致性。在本發(fā)明的一個(gè)實(shí)施例中,訪問(wèn)代理是如計(jì)算機(jī)單元中執(zhí)行的進(jìn)程或線程等的軟件組件示例。當(dāng)作出執(zhí)行有關(guān)給定SG的切換的決策時(shí),在將要離開(kāi)其活動(dòng)狀態(tài)的活動(dòng)SU中調(diào)用訪問(wèn)代理。對(duì)于擁有對(duì)數(shù)據(jù)存儲(chǔ)資源的至少一個(gè)讀寫(xiě)訪問(wèn)的每個(gè)活動(dòng)SU,有一個(gè)訪問(wèn)代理。在本發(fā)明的一個(gè)實(shí)施例中,無(wú)論SU是否擁有任何讀寫(xiě)訪問(wèn),對(duì)于每個(gè)SU,都有一個(gè)訪問(wèn)代理。對(duì)于一旦待機(jī)SU進(jìn)入活動(dòng)狀態(tài)而擁有對(duì)數(shù)據(jù)存儲(chǔ)資源的至少一個(gè)讀寫(xiě)訪問(wèn)的每個(gè)待機(jī)SU,也有一個(gè)訪問(wèn)代理。例如,在SG404中,SU414具有訪問(wèn)代理452,因?yàn)镾U已經(jīng)建立對(duì)數(shù)據(jù)存儲(chǔ)資源260的讀寫(xiě)訪問(wèn),并由此具有讀寫(xiě)訪問(wèn)430。
在圖4中,在計(jì)算機(jī)單元110中具有切換控制服務(wù)470-474,在計(jì)算機(jī)單元112中有切換控制服務(wù)480-484。切換控制服務(wù)470-474照管與計(jì)算機(jī)單元110中服務(wù)單元相關(guān)聯(lián)的任務(wù)。相似地,切換控制服務(wù)480-484照管與計(jì)算機(jī)單元112中服務(wù)單元相關(guān)聯(lián)的任務(wù)。切換控制服務(wù)470和480的任務(wù)是分別檢測(cè)與服務(wù)單元410-414和420-424的任一個(gè)相關(guān)聯(lián)的切換狀況。切換控制服務(wù)472和482的任務(wù)是分別激活服務(wù)單元410-414和420-424的任一個(gè)??梢栽趯?duì)服務(wù)單元所需的數(shù)據(jù)存儲(chǔ)資源的成功訪問(wèn)建立之后,使服務(wù)單元進(jìn)入激活狀態(tài)。切換控制服務(wù)474和484的任務(wù)是分別在成功釋放對(duì)已經(jīng)從服務(wù)單元建立對(duì)其的讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源的訪問(wèn)之后變更服務(wù)單元410-414和420-424的活動(dòng)狀態(tài)。通常,將活動(dòng)狀態(tài)變更到待機(jī)或故障。在本發(fā)明的一個(gè)實(shí)施例中,切換控制服務(wù)470-474可以由計(jì)算機(jī)單元110中的單個(gè)服務(wù)來(lái)執(zhí)行。在該情況中,切換控制服務(wù)470-474僅是與單個(gè)切換控制服務(wù)相關(guān)聯(lián)的不同任務(wù)或過(guò)程。相似地,在本發(fā)明的同一個(gè)實(shí)施例中,切換控制服務(wù)480-484可以由計(jì)算機(jī)單元112中的單個(gè)服務(wù)來(lái)執(zhí)行??梢宰鳛橹虚g件和/或操作系統(tǒng)的一部分來(lái)實(shí)現(xiàn)切換控制服務(wù)。
圖5是說(shuō)明圖4在發(fā)生了切換,其中SU414已進(jìn)入待機(jī)狀態(tài)而SU424已進(jìn)入活動(dòng)狀態(tài)時(shí)的情況的框圖。對(duì)數(shù)據(jù)存儲(chǔ)資源262的讀寫(xiě)訪問(wèn)432仍在SU410中,但是現(xiàn)在在SU424中對(duì)數(shù)據(jù)存儲(chǔ)資源260的新讀寫(xiě)訪問(wèn)500已經(jīng)替代圖4中的讀寫(xiě)訪問(wèn)430。
圖6是說(shuō)明根據(jù)本發(fā)明的圖4或圖5的計(jì)算機(jī)集群中的數(shù)據(jù)存儲(chǔ)資源訪問(wèn)轉(zhuǎn)移方法的一個(gè)實(shí)施例的流程圖。圖6說(shuō)明從第一SU到第二SU的整個(gè)訪問(wèn)轉(zhuǎn)移過(guò)程以及訪問(wèn)代理所采取的動(dòng)作。在本發(fā)明的一個(gè)實(shí)施例中,照管SG404的SU414部分的切換控制的切換控制服務(wù)470檢測(cè)與SU414相關(guān)聯(lián)的切換狀況。切換控制服務(wù)470與切換控制服務(wù)472和474合作。切換控制服務(wù)474的任務(wù)是使SU414中的所有軟件組件或它照管的任何其他SU準(zhǔn)備好以進(jìn)入不同狀態(tài),本情況中是待機(jī)狀態(tài)。切換控制服務(wù)470、472和474還可以照管其他SG和SU的切換控制。當(dāng)SU414要進(jìn)入待機(jī)狀態(tài)且SU424要進(jìn)入活動(dòng)狀態(tài)時(shí),訪問(wèn)代理452從切換控制服務(wù)470接收信號(hào)。切換控制服務(wù)470、472和474可以分別是操作系統(tǒng)220和222的一部分,或者如中間件軟件組件之類的分開(kāi)服務(wù)。在步驟600,當(dāng)發(fā)生切換時(shí),訪問(wèn)代理452等待來(lái)自切換控制服務(wù)470的調(diào)用它的信號(hào)。在該步驟中還可派生訪問(wèn)代理進(jìn)程。在步驟602,訪問(wèn)代理452釋放對(duì)于已從SU414對(duì)其建立讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源(SR)的訪問(wèn)。如果數(shù)據(jù)存儲(chǔ)資源是文件系統(tǒng),則這意味著訪問(wèn)代理452卸下文件系統(tǒng)。這包括負(fù)責(zé)文件系統(tǒng)卸下的操作系統(tǒng)服務(wù),例如稱為umount的Linux系統(tǒng)服務(wù)的調(diào)用。如果數(shù)據(jù)存儲(chǔ)資源是軟件RAID,則訪問(wèn)代理釋放它,換言之,釋放對(duì)它的訪問(wèn)。釋放軟件RAID使之可用于從另一個(gè)SU的訪問(wèn)建立。
為了簡(jiǎn)明,本文假定有至少一個(gè)已經(jīng)對(duì)其建立訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源。在步驟604,訪問(wèn)代理452檢查是否還有更多已從SU414對(duì)其建立讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源。如果是此情況,則處理在步驟602繼續(xù)。在本發(fā)明的一個(gè)實(shí)施例中,有系統(tǒng)文件或表,其中包含有關(guān)已從SU414或已從SU424對(duì)其建立讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源的信息。換言之,列示有已從SG404對(duì)其建立讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源。在本發(fā)明的一個(gè)實(shí)施例中,訪問(wèn)代理452以信號(hào)通知切換控制服務(wù)474已釋放對(duì)所有必需的數(shù)據(jù)存儲(chǔ)資源的訪問(wèn),即已經(jīng)釋放它們,并由此使之可用于從其他地方的訪問(wèn)建立。
在步驟606中,例如由切換控制服務(wù)474執(zhí)行與將SU414帶入待機(jī)狀態(tài)相關(guān)聯(lián)的其余任務(wù)。在本發(fā)明的一個(gè)實(shí)施例中,利用指示它必需開(kāi)始建立對(duì)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn)的信號(hào),調(diào)用訪問(wèn)代理462的進(jìn)程,因?yàn)镾U424將要進(jìn)入活動(dòng)狀態(tài)。該信號(hào)來(lái)自例如切換控制服務(wù)480。在本發(fā)明的一個(gè)實(shí)施例中,切換控制服務(wù)470-474和480-484通過(guò)通信信道104交換消息傳遞。
在步驟608,訪問(wèn)代理建立對(duì)將要從SU424對(duì)其建立讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源的訪問(wèn)。如果數(shù)據(jù)存儲(chǔ)資源是文件系統(tǒng),則這包括負(fù)責(zé)文件系統(tǒng)安裝的操作系統(tǒng)服務(wù)的調(diào)用,例如mount。為了簡(jiǎn)明,本文假定有至少一個(gè)將要對(duì)其建立訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源。在步驟610,訪問(wèn)代理462檢查是否還有更多將要從SU424對(duì)其建立讀寫(xiě)訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源。如果是此情況,則處理在步驟608繼續(xù)。在步驟612,例如由切換控制服務(wù)482執(zhí)行與將SU424帶入活動(dòng)狀態(tài)相關(guān)聯(lián)的其余任務(wù)。例如,可以由訪問(wèn)代理462以信號(hào)通知切換控制服務(wù)482已經(jīng)成功建立對(duì)所需的所有數(shù)據(jù)存儲(chǔ)資源的訪問(wèn)。
對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),顯然隨著技術(shù)的發(fā)展,可以以多種不同方式實(shí)施本發(fā)明的基本原理。因此本發(fā)明及其實(shí)施例并不局限于上述的實(shí)例;相反,它們可以在權(quán)利要求的范圍內(nèi)變化。
權(quán)利要求
1.一種用于在冗余計(jì)算機(jī)集群中執(zhí)行切換的方法,所述冗余計(jì)算機(jī)集群至少包括第一計(jì)算機(jī)單元、第二計(jì)算機(jī)單元和共享存儲(chǔ)單元,其中所述第一計(jì)算機(jī)單元和所述第二計(jì)算機(jī)單元與所述共享存儲(chǔ)單元接口,所述共享存儲(chǔ)單元包括由所述冗余計(jì)算機(jī)集群中執(zhí)行的復(fù)制服務(wù)單元訪問(wèn)的至少一個(gè)數(shù)據(jù)存儲(chǔ)資源,所述方法包括檢測(cè)與所述復(fù)制服務(wù)單元相關(guān)聯(lián)的切換狀況;由所述第一計(jì)算機(jī)單元釋放對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);由所述第二計(jì)算機(jī)單元建立對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);以及在所述第二計(jì)算機(jī)單元中允許所述復(fù)制服務(wù)單元的復(fù)制品變成活動(dòng)的。
2.如權(quán)利要求1所述的方法,其特征在于,所述建立所述訪問(wèn)以及所述釋放所述訪問(wèn)由訪問(wèn)代理執(zhí)行,所述訪問(wèn)代理與所述復(fù)制服務(wù)單元相關(guān)聯(lián)。
3.如權(quán)利要求1所述的方法,其特征在于,還包括提供包括盤(pán)存儲(chǔ)單元的共享存儲(chǔ)單元。
4.如權(quán)利要求1所述的方法,其特征在于,還包括提供包括文件系統(tǒng)的所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源,所述建立所述訪問(wèn)安裝所述文件系統(tǒng)以及所述釋放所述訪問(wèn)卸下所述文件系統(tǒng)。
5.如權(quán)利要求1所述的方法,其特征在于,還包括提供包括軟件獨(dú)立盤(pán)的冗余陣列的所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源。
6.如權(quán)利要求1所述的方法,其特征在于,還包括使用外圍接口提供所述第一計(jì)算機(jī)單元和所述第二計(jì)算機(jī)單元與共享存儲(chǔ)單元接口。
7.如權(quán)利要求6所述的方法,其特征在于,還包括提供包括光纖信道、小型計(jì)算機(jī)系統(tǒng)接口、因特網(wǎng)小型計(jì)算機(jī)系統(tǒng)接口或集成系統(tǒng)接口的所述外圍接口。
8.一種冗余計(jì)算機(jī)集群,至少包括第一計(jì)算機(jī)單元、第二計(jì)算機(jī)單元和共享存儲(chǔ)單元,其中所述第一計(jì)算機(jī)單元和所述第二計(jì)算機(jī)單元與所述共享存儲(chǔ)單元接口,所述共享存儲(chǔ)單元包括由所述冗余計(jì)算機(jī)集群中執(zhí)行的復(fù)制服務(wù)單元訪問(wèn)的至少一個(gè)數(shù)據(jù)存儲(chǔ)資源,所述冗余計(jì)算機(jī)集群包括切換控制部件,用于檢測(cè)與所述復(fù)制服務(wù)單元相關(guān)聯(lián)的切換狀況;所述第一計(jì)算機(jī)單元和所述第二計(jì)算機(jī)單元中的訪問(wèn)釋放部件,用于釋放對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);所述第一計(jì)算機(jī)單元和所述第二計(jì)算機(jī)單元中的訪問(wèn)建立部件,用于建立對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);以及切換控制部件,用于在對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的成功訪問(wèn)建立之后激活所述復(fù)制服務(wù)單元的復(fù)制品。
9.如權(quán)利要求8所述的計(jì)算機(jī)集群,其特征在于,所述訪問(wèn)建立部件和所述訪問(wèn)釋放部件包括在訪問(wèn)代理中,所述訪問(wèn)代理與所述復(fù)制服務(wù)單元相關(guān)聯(lián)。
10.如權(quán)利要求8所述的計(jì)算機(jī)集群,其特征在于,共享存儲(chǔ)單元包括盤(pán)存儲(chǔ)單元。
11.如權(quán)利要求8所述的計(jì)算機(jī)集群,其特征在于,所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源包括文件系統(tǒng),所述訪問(wèn)建立部件安裝所述文件系統(tǒng)以及所述訪問(wèn)釋放部件卸下所述文件系統(tǒng)。
12.如權(quán)利要求8所述的計(jì)算機(jī)集群,其特征在于,所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源包括軟件獨(dú)立盤(pán)的冗余陣列。
13.如權(quán)利要求8所述的計(jì)算機(jī)集群,其特征在于,所述第一計(jì)算機(jī)單元和所述第二計(jì)算機(jī)單元使用外圍接口與共享存儲(chǔ)單元接口。
14.如權(quán)利要求13所述的計(jì)算機(jī)集群,其特征在于,所述外圍接口包括光纖信道、因特網(wǎng)小型計(jì)算機(jī)系統(tǒng)接口、小型計(jì)算機(jī)系統(tǒng)接口或集成系統(tǒng)接口。
15.一種與至少一個(gè)共享存儲(chǔ)單元接口的計(jì)算機(jī)單元,所述計(jì)算機(jī)單元執(zhí)行需要對(duì)所述至少一個(gè)共享存儲(chǔ)單元上的至少一個(gè)數(shù)據(jù)存儲(chǔ)資源訪問(wèn)的至少一個(gè)復(fù)制服務(wù)單元,所述計(jì)算機(jī)單元包括切換控制部件,用于檢測(cè)與所述至少一個(gè)復(fù)制服務(wù)單元相關(guān)聯(lián)的切換狀況;訪問(wèn)釋放部件,用于釋放對(duì)至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);訪問(wèn)建立部件,用于建立對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn);切換控制部件,用于在對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的成功訪問(wèn)建立之后激活所述至少一個(gè)復(fù)制服務(wù)單元;以及切換控制部件,用于在成功釋放對(duì)所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源的所述訪問(wèn)之后變更所述至少一個(gè)復(fù)制服務(wù)單元的狀態(tài)。
16.如權(quán)利要求15所述的計(jì)算機(jī)單元,其特征在于,所述訪問(wèn)釋放部件和訪問(wèn)建立部件包括在訪問(wèn)代理中,所述訪問(wèn)代理與服務(wù)單元相關(guān)聯(lián)。
17.如權(quán)利要求15所述的計(jì)算機(jī)單元,其特征在于,存儲(chǔ)單元包括盤(pán)存儲(chǔ)單元。
18.如權(quán)利要求8所述的計(jì)算機(jī)單元,其特征在于,所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源包括文件系統(tǒng),所述訪問(wèn)建立部件安裝所述文件系統(tǒng)以及所述訪問(wèn)釋放部件卸下所述文件系統(tǒng)。
19.如權(quán)利要求15所述的計(jì)算機(jī)單元,其特征在于,所述至少一個(gè)數(shù)據(jù)存儲(chǔ)資源包括軟件獨(dú)立盤(pán)的冗余陣列。
20.如權(quán)利要求15所述的計(jì)算機(jī)單元,其特征在于,計(jì)算機(jī)節(jié)點(diǎn)使用外圍接口與存儲(chǔ)單元接口。
21.如權(quán)利要求20所述的計(jì)算機(jī)單元,其特征在于,所述外圍接口包括光纖信道、小型計(jì)算機(jī)系統(tǒng)接口、因特網(wǎng)小型計(jì)算機(jī)系統(tǒng)接口或集成系統(tǒng)接口。
全文摘要
一種用于執(zhí)行計(jì)算機(jī)單元之間的存儲(chǔ)訪問(wèn)轉(zhuǎn)移的方法、計(jì)算機(jī)集群和計(jì)算機(jī)單元。冗余計(jì)算機(jī)集群包括計(jì)算機(jī)單元和共享存儲(chǔ)單元。這些計(jì)算機(jī)單元與共享存儲(chǔ)單元接口,它存儲(chǔ)由計(jì)算機(jī)集群中執(zhí)行的復(fù)制服務(wù)單元已對(duì)其建立訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源。當(dāng)檢測(cè)到與復(fù)制服務(wù)單元相關(guān)聯(lián)的切換狀況時(shí),首先在將進(jìn)入待機(jī)狀態(tài)的服務(wù)單元復(fù)制品中釋放已經(jīng)從服務(wù)單元建立對(duì)其的訪問(wèn)的數(shù)據(jù)存儲(chǔ)資源。然后,在將要進(jìn)入活動(dòng)狀態(tài)的服務(wù)單元復(fù)制品中建立對(duì)數(shù)據(jù)存儲(chǔ)資源的訪問(wèn)。然后才允許服務(wù)單元的復(fù)制品變成活動(dòng)的。本發(fā)明的好處涉及冗余多節(jié)點(diǎn)計(jì)算機(jī)集群中文件系統(tǒng)訪問(wèn)的提高的性能和可靠性。
文檔編號(hào)G06F11/00GK1879088SQ200480032979
公開(kāi)日2006年12月13日 申請(qǐng)日期2004年10月5日 優(yōu)先權(quán)日2003年11月10日
發(fā)明者H·海蒂艾南 申請(qǐng)人:諾基亞有限公司