基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法

文檔序號：6378116閱讀：214來源：國知局

專利名稱：基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法
技術領域：
本發(fā)明涉及計算技術領域，更具體地說，本發(fā)明涉及一種基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法。
背景技術：
在數(shù)據(jù)密集型應用中，大規(guī)模數(shù)據(jù)集處理是應用的核心，而I/O (輸入/輸出)帶寬成為影響其性能的主要因素，這使得傳統(tǒng)的計算和存儲分離的系統(tǒng)不適合數(shù)據(jù)密集型應用，因此，需要一種新型的數(shù)據(jù)存儲和服務模式，以提高數(shù)據(jù)傳輸和處理的性能。
數(shù)據(jù)服務一般指的是數(shù)據(jù)的存儲、管理和傳輸，在不同的應用場合中具體表現(xiàn)形式不同。在數(shù)據(jù)密集型應用背景下，數(shù)據(jù)服務主要包含兩方面的內(nèi)容，一是海量數(shù)據(jù)的存儲技術，二是海量數(shù)據(jù)的組織管理技術。
智能數(shù)據(jù)服務指的是在上述兩方面加入了數(shù)據(jù)的預處理操作處理，這樣可以將部分數(shù)據(jù)處理負載從外部計算設備轉(zhuǎn)移到系統(tǒng)內(nèi)部，從而減少系統(tǒng)向外部計算設備提供數(shù)據(jù)服務的帶寬需求。
實現(xiàn)數(shù)據(jù)服務有很多種方法，比如采用傳統(tǒng)的集中全局存儲的方法，或采用數(shù)據(jù)庫系統(tǒng)。
傳統(tǒng)的集中全局存儲的方法需要專用的存儲服務器，傳統(tǒng)的計算密集型計算采用的是這種模式。集中全局存儲的方法構建數(shù)據(jù)服務的性能受限于存儲服務器的帶寬，并且價格昂貴，難以大規(guī)模擴展。
數(shù)據(jù)庫系統(tǒng)又分為關系型數(shù)據(jù)庫和非關系型數(shù)據(jù)庫。數(shù)據(jù)密集型應用工作數(shù)據(jù)集較大，且不需要進行頻繁的數(shù)據(jù)庫操作，所以不適合存儲在關系型數(shù)據(jù)庫中。非關系型數(shù)據(jù)庫提供Key-Value (鍵-值)的存儲形式，但它難以在數(shù)據(jù)服務中加入預處理的功能，難以形成智能數(shù)據(jù)服務。發(fā)明內(nèi)容
本發(fā)明所要解決的技術問題是針對現(xiàn)有技術中存在上述缺陷，提供一種在數(shù)據(jù)密集應用中將傳統(tǒng)的分布式系統(tǒng)的空閑存儲資源聚合起來并向外部計算設備提供智能數(shù)據(jù)服務的方法。
根據(jù)本發(fā)明，提供了一種基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其包括利用分布式系統(tǒng)的主節(jié)點管理全局文件命名空間；并且，在向分布式系統(tǒng)寫入文件的流程、從分布式系統(tǒng)讀取文件的流程、以及從分布式系統(tǒng)讀取文件的流程中，利用分布式系統(tǒng)的主節(jié)點對客戶端的請求進行分析處理，選擇具體的數(shù)據(jù)預處理程序，分發(fā)到分布式系統(tǒng)的從節(jié)點以進行后續(xù)的數(shù)據(jù)預處理和傳輸操作。
優(yōu)選地，主節(jié)點監(jiān)測并管理從節(jié)點的正常運行，保存并更新所有從節(jié)點數(shù)據(jù)存儲的元數(shù)據(jù)，以及提供客戶端對數(shù)據(jù)請求的響應。
優(yōu)選地，主節(jié)點維持分布式系統(tǒng)的全局文件系統(tǒng)的目錄。
優(yōu)選地，在分布式系統(tǒng)中，數(shù)據(jù)按照原始數(shù)據(jù)的形式進行存儲，不對文件進行分塊存儲。
優(yōu)選地，數(shù)據(jù)是冗余存儲的，從而一個文件可以冗余存儲在多個從節(jié)點中。
優(yōu)選地，向分布式系統(tǒng)寫入文件的流程包括第一寫入步驟客戶端向主節(jié)點詢問需要寫入的文件是否在分布式系統(tǒng)中存在；第二寫入步驟如果需要寫入的文件存在分布式系統(tǒng)，主節(jié)點向客戶端發(fā)送文件的元數(shù)據(jù)，其中包括文件的信息和文件所處的從節(jié)點信息，向分布式系統(tǒng)寫入文件的流程進入第三寫入步驟；如果需要寫入的文件不存在分布式系統(tǒng)，主節(jié)點向客戶端返回可寫入文件的從節(jié)點列表；第三寫入步驟客戶端根據(jù)第二寫入步驟返回的文件元數(shù)據(jù)及從節(jié)點信息向其中一個從節(jié)點寫入文件；第四寫入步驟從節(jié)點接收客戶端數(shù)據(jù)流并寫入文件，如果成功完成向主節(jié)點發(fā)送成功信息，并同時向客戶端發(fā)送確認信息，客戶端收到確認信息后完成操作；如果確認信息不成功，重復第二寫入步驟的操作；第五寫入步驟主節(jié)點收到從節(jié)點完成數(shù)據(jù)寫入的信息后更新元數(shù)據(jù)。
優(yōu)選地，向分布式系統(tǒng)寫入文件的過程不會對數(shù)據(jù)進行預處理。
優(yōu)選地，從分布式系統(tǒng)讀取文件的流程包括第一讀取步驟客戶端向主節(jié)點發(fā)送數(shù)據(jù)請求，其中包括文件路徑和所需要的預處理；第二讀取步驟主節(jié)點對客戶端的數(shù)據(jù)請求進行分析，確定所需文件所處的從節(jié)點和所需要的預處理程序，直接對所需文件進行預處理操作，并且向客戶單返回中間數(shù)據(jù)所處的從節(jié)點；第三讀取步驟客戶端直接向中間數(shù)據(jù)所處的從節(jié)點進行數(shù)據(jù)請求，從節(jié)點根據(jù)數(shù)據(jù)數(shù)據(jù)預處理的情況返回給客戶端所需數(shù)據(jù)。
優(yōu)選地，從分布式系統(tǒng)讀取文件的流程包括第一預處理步驟客戶端向主節(jié)點發(fā)送數(shù)據(jù)預處理操作，并根據(jù)需要編寫更加復雜的數(shù)據(jù)預處理程序；第二預處理步驟主節(jié)點根據(jù)數(shù)據(jù)預處理處理請求指定從節(jié)點通過數(shù)據(jù)預處理引擎對本地文件進行數(shù)據(jù)預處理，從節(jié)點完成后發(fā)送給主節(jié)點成功信息；第三預處理步驟主節(jié)點根據(jù)從節(jié)點發(fā)送的成功信息更新元數(shù)據(jù)。
本發(fā)明能夠在數(shù)據(jù)密集型應用環(huán)境下，將現(xiàn)有的分布式系統(tǒng)存儲空間快速聚合，并向外部計算設備提供數(shù)據(jù)服務；而且，本發(fā)明充分利用分布式系統(tǒng)計算資源，能夠根據(jù)外部計算設備的需求智能地提供數(shù)據(jù)服務；并且，本發(fā)明將部分數(shù)據(jù)處理負載從外部計算設備轉(zhuǎn)移到分布式系統(tǒng)中，從而減少向外部計算設備提供數(shù)據(jù)服務的帶寬需求。

結合附圖，并通過參考下面的詳細描述，將會更容易地對本發(fā)明有更完整的理解并且更容易地理解其伴隨的優(yōu)點和特征，其中
圖I示意性地示出了根據(jù)本發(fā)明第一實施例的基于分布式系統(tǒng)的智能數(shù)據(jù)服務平臺架構。
圖2示意性地示出了根據(jù)本發(fā)明第二實施例的向分布式系統(tǒng)寫入文件的流程的示意圖。
圖3示意性地示出了根據(jù)本發(fā)明第三實施例的從分布式系統(tǒng)讀取文件的流程的示意圖。
圖4示意性地示出了根據(jù)本發(fā)明第四實施例的分布式系統(tǒng)內(nèi)部預處理流程的示5意圖。
需要說明的是，附圖用于說明本發(fā)明，而非限制本發(fā)明。注意，表示結構的附圖可能并非按比例繪制。并且，附圖中，相同或者類似的元件標有相同或者類似的標號。
具體實施方式
為了使本發(fā)明的內(nèi)容更加清楚和易懂，下面結合具體實施例和附圖對本發(fā)明的內(nèi)容進行詳細描述。
<第一實施例>
本發(fā)明是基于傳統(tǒng)分布式系統(tǒng)衍生出來的針對數(shù)據(jù)密集型應用的智能數(shù)據(jù)服務方法。
具體地，圖I示意性地示出了根據(jù)本發(fā)明第一實施例的基于分布式系統(tǒng)的智能數(shù)據(jù)服務平臺架構。
如圖I所示，類似于絕大多數(shù)分布式文件系統(tǒng)和分布式數(shù)據(jù)庫，整個架構是典型的主從(Master/Slave)架構。例如，圖I所示的基于分布式系統(tǒng)的智能數(shù)據(jù)服務平臺架構包括一個主節(jié)點M以及多個從節(jié)點；具體地說，圖I中示出了包括η個從節(jié)點的情況，即第一從節(jié)點SI、第二從節(jié)點S2、第三從節(jié)點S3、……、第η從節(jié)點Sn。
其中，主節(jié)點M包括數(shù)據(jù)預處理分析引擎Ml以及全局元數(shù)據(jù)管理模塊M2。每個從節(jié)點均包括數(shù)據(jù)預處理引擎(S11、S21、S31、……、Snl)和數(shù)據(jù)存儲器(S12、S22、S32、……、 Sn2)。
外部計算設備pcm (作為客戶端)可對各個從節(jié)點進行可以通過不同的從節(jié)點讀寫文件。
分布式系統(tǒng)的主節(jié)點M管理全局文件命名空間，其提供的主要操作為監(jiān)測并管理從節(jié)點的正常運行；保存并更新所有從節(jié)點數(shù)據(jù)存儲的元數(shù)據(jù)；提供客戶端對數(shù)據(jù)請求的響應等。從節(jié)點(第一從節(jié)點SI、第二從節(jié)點S2、第三從節(jié)點S3、……、第η從節(jié)點Sn) 存儲海量數(shù)據(jù)，在主節(jié)點M的協(xié)調(diào)下直接向客戶端提供數(shù)據(jù)。
在本發(fā)明實施例的分布式系統(tǒng)中，數(shù)據(jù)仍然按照原始數(shù)據(jù)的形式進行存儲，不對文件進行分塊存儲，這是因為分布式系統(tǒng)采用單主節(jié)點配置，分塊會加大主節(jié)點進行元數(shù)據(jù)處理的開銷，同時在數(shù)據(jù)處理過程中不需要再對分塊整合，使得數(shù)據(jù)處理更加靈活。在分布式系統(tǒng)中存儲的文件直接通過文件路徑訪問，比如“/dirl/filel”，主節(jié)點維持分布式系統(tǒng)的全局文件系統(tǒng)的目錄。
在本發(fā)明實施例的分布式系統(tǒng)中，數(shù)據(jù)是冗余存儲的，一個文件可以冗余存儲在多個從節(jié)點中。這是由于分布式系統(tǒng)是采用商用的組件，單節(jié)點宕機后仍需要分布式系統(tǒng)能夠正常使用。冗余存儲的另一個優(yōu)點是在發(fā)生讀寫熱點，即多個客戶端集中讀寫少數(shù)的幾個文件時，多個客戶端可以通過不同的從節(jié)點讀寫文件，提高可用帶寬。
本發(fā)明實施例的分布式系統(tǒng)的一個典型特征是數(shù)據(jù)存儲和數(shù)據(jù)處理緊耦合，本發(fā)明實施例的智能數(shù)據(jù)服務方法充分利用了這個特征。在分布式系統(tǒng)中，不僅提供了海量數(shù)據(jù)的存儲管理組件，同時提供了數(shù)據(jù)的預處理引擎。
數(shù)據(jù)預處理引擎同樣分為主節(jié)點M的數(shù)據(jù)預處理分析引擎Ml和從節(jié)點的數(shù)據(jù)預處理引擎；由此，主節(jié)點M負責對客戶端的請求進行分析處理，選擇具體的數(shù)據(jù)預處理程序，分發(fā)到從節(jié)點以進行后續(xù)的數(shù)據(jù)預處理和傳輸操作。從節(jié)點的預處理引擎內(nèi)置提供多種數(shù)據(jù)預處理程序，同時允許用戶進行擴展，只需要采用預處理引擎提供的統(tǒng)一編程接口。
<第二實施例>
圖2示意性地示出了根據(jù)本發(fā)明第二實施例的向分布式系統(tǒng)寫入文件的流程的示意圖。其中，向分布式系統(tǒng)寫入文件的過程不會對數(shù)據(jù)進行預處理。在此，假設分布式系統(tǒng)中具有三個從節(jié)點第一從節(jié)點SI、第二從節(jié)點S2、第三從節(jié)點S3，但是顯然分布式系統(tǒng)中從節(jié)點的數(shù)量不限于三個，而是可以是任意合適數(shù)量。
具體地說，如圖2所示，根據(jù)本發(fā)明第二實施例的向分布式系統(tǒng)寫入文件的流程包括
第一寫入步驟al :客戶端pcml向主節(jié)點M詢問需要寫入的文件是否在分布式系統(tǒng)中存在。
第二寫入步驟bl :如果需要寫入的文件存在分布式系統(tǒng)，主節(jié)點M向客戶端pcml 發(fā)送文件的元數(shù)據(jù)，其中包括文件的信息和文件所處的從節(jié)點信息，向分布式系統(tǒng)寫入文件的流程進入第三寫入步驟Cl ;如果需要寫入的文件不存在分布式系統(tǒng)，那就需要寫入新的文件，主節(jié)點M向客戶端pcml返回可寫入文件的從節(jié)點列表。
第三寫入步驟Cl :客戶端pcml根據(jù)第二寫入步驟bl返回的文件元數(shù)據(jù)及從節(jié)點信息向其中一個從節(jié)點寫入文件。分布式系統(tǒng)會在后臺進行所有文件的備份，所以此時只需要向一個從節(jié)點寫入文件即可。
第四寫入步驟dl :從節(jié)點接收客戶端pcml數(shù)據(jù)流并寫入文件，如果成功完成向主節(jié)點M發(fā)送成功信息,并同時向客戶端pcml發(fā)送確認信息,客戶端pcml收到確認信息后完成操作。如果確認信息不成功，重復第二寫入步驟bl的操作。
第五寫入步驟el :主節(jié)點M收到從節(jié)點完成數(shù)據(jù)寫入的信息后更新元數(shù)據(jù)。
<第三實施例>
圖3示意性地示出了根據(jù)本發(fā)明第三實施例的從分布式系統(tǒng)讀取文件的流程的示意圖。在此，假設分布式系統(tǒng)中具有三個從節(jié)點第一從節(jié)點SI、第二從節(jié)點S2、第三從節(jié)點S3，但是顯然分布式系統(tǒng)中從節(jié)點的數(shù)量不限于三個，而是可以是任意合適數(shù)量。
根據(jù)本發(fā)明第三實施例的從分布式系統(tǒng)讀取文件的流程包括
第一讀取步驟a2 :客戶端pcml向主節(jié)點M發(fā)送數(shù)據(jù)請求，其中包括文件路徑和所需要的預處理。
第二讀取步驟b2 :主節(jié)點M對客戶端pcml的數(shù)據(jù)請求進行分析，可以確定所需文件所處的從節(jié)點和所需要的預處理程序，直接對所需文件進行預處理操作，并且向客戶單返回中間數(shù)據(jù)所處的從節(jié)點。
第三讀取步驟c2 :客戶端pcml直接向中間數(shù)據(jù)所處的從節(jié)點進行數(shù)據(jù)請求,從節(jié)點會根據(jù)數(shù)據(jù)數(shù)據(jù)預處理的情況返回給客戶端pcml所需數(shù)據(jù)。
〈第四實施例〉
圖4示意性地示出了根據(jù)本發(fā)明第四實施例的分布式系統(tǒng)內(nèi)部預處理流程的示意圖。在實際中，分布式系統(tǒng)內(nèi)部的數(shù)據(jù)需要進行多次預處理，并且不需要將其導出分布式系統(tǒng)。并且，在此，假設分布式系統(tǒng)中具有三個從節(jié)點第一從節(jié)點SI、第二從節(jié)點S2、第三從節(jié)點S3，但是顯然分布式系統(tǒng)中從節(jié)點的數(shù)量不限于三個，而是可以是任意合適數(shù)量。
具體地說，如圖4所示，根據(jù)本發(fā)明第四實施例的分布式系統(tǒng)內(nèi)部預處理流程包括
第一預處理步驟a3 :客戶端pcml向主節(jié)點M發(fā)送數(shù)據(jù)預處理操作，并根據(jù)需要編寫更加復雜的數(shù)據(jù)預處理程序。
第二預處理步驟b3 :主節(jié)點M根據(jù)數(shù)據(jù)預處理處理請求指定從節(jié)點通過數(shù)據(jù)預處理引擎對本地文件進行數(shù)據(jù)預處理，從節(jié)點完成后發(fā)送給主節(jié)點M成功信息。
第三預處理步驟c3 :主節(jié)點M根據(jù)從節(jié)點發(fā)送的成功信息更新元數(shù)據(jù)。
前面所描述的智能數(shù)據(jù)服務方法主要在數(shù)據(jù)密集型應用中利用現(xiàn)有的分布式系統(tǒng)及相關軟件，快速搭建適用于數(shù)據(jù)密集型應用的智能數(shù)據(jù)服務平臺。而且，在實際實施中，分布式系統(tǒng)已經(jīng)有很多的軟件可選，比如專門用戶文件服務的分布式文件系統(tǒng)，計算和數(shù)據(jù)存儲相結合的Hadoop和HDFS, Sector&Sphere,本發(fā)明的實現(xiàn)可盡量使用現(xiàn)有的軟件棧，這些分布式文件系統(tǒng)和分布式計算系統(tǒng)都可以用于構建智能數(shù)據(jù)服務平臺。需要做的就是在這些分布式系統(tǒng)之上加入數(shù)據(jù)預處理分析引擎及數(shù)據(jù)預處理引擎，以實現(xiàn)數(shù)據(jù)讀寫、系統(tǒng)內(nèi)部數(shù)據(jù)預處理等操作，構建智能數(shù)據(jù)服務平臺。
由此，根據(jù)本發(fā)明實施例的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法至少具有下述優(yōu)勢
I.本發(fā)明實施例解決了在數(shù)據(jù)密集型應用環(huán)境下，如何將現(xiàn)有的分布式系統(tǒng)存儲空間快速聚合，并向外部計算設備提供數(shù)據(jù)服務的問題；
2.本發(fā)明實施例充分利用分布式系統(tǒng)計算資源，根據(jù)外部計算設備的需求智能地提供數(shù)據(jù)服務；
3.本發(fā)明實施例將部分數(shù)據(jù)處理負載從外部計算設備轉(zhuǎn)移到分布式系統(tǒng)中，從而減少向外部計算設備提供數(shù)據(jù)服務的帶寬需求。
此外，需要說明的是，說明書中的術語“第一”、“第二”、“第三”等描述，除非特別限定，否則僅僅用于區(qū)分說明書中的各個組件、元素、步驟等，而不是用于表示各個組件、元素、步驟之間的邏輯關系或者順序關系等。
可以理解的是，雖然本發(fā)明已以較佳實施例披露如上，然而上述實施例并非用以限定本發(fā)明。對于任何熟悉本領域的技術人員而言，在不脫離本發(fā)明技術方案范圍情況下，都可利用上述揭示的技術內(nèi)容對本發(fā)明技術方案作出許多可能的變動和修飾，或修改為等同變化的等效實施例。因此，凡是未脫離本發(fā)明技術方案的內(nèi)容，依據(jù)本發(fā)明的技術實質(zhì)對以上實施例所做的任何簡單修改、等同變化及修飾，均仍屬于本發(fā)明技術方案保護的范圍內(nèi)。
權利要求
1.一種基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于包括利用分布式系統(tǒng)的主節(jié)點管理全局文件命名空間；并且，在向分布式系統(tǒng)寫入文件的流程、從分布式系統(tǒng)讀取文件的流程、以及從分布式系統(tǒng)讀取文件的流程中，利用分布式系統(tǒng)的主節(jié)點對客戶端的請求進行分析處理，選擇具體的數(shù)據(jù)預處理程序，分發(fā)到分布式系統(tǒng)的從節(jié)點以進行后續(xù)的數(shù)據(jù)預處理和傳輸操作。
2.根據(jù)權利要求I所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，主節(jié)點監(jiān)測并管理從節(jié)點的正常運行，保存并更新所有從節(jié)點數(shù)據(jù)存儲的元數(shù)據(jù)，以及提供客戶端對數(shù)據(jù)請求的響應。
3.根據(jù)權利要求I或2所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，主節(jié)點維持分布式系統(tǒng)的全局文件系統(tǒng)的目錄。
4.根據(jù)權利要求I或2所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，在分布式系統(tǒng)中，數(shù)據(jù)按照原始數(shù)據(jù)的形式進行存儲，不對文件進行分塊存儲。
5.根據(jù)權利要求I或2所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，在分布式系統(tǒng)中，數(shù)據(jù)是冗余存儲的，從而一個文件可以冗余存儲在多個從節(jié)點中。
6.根據(jù)權利要求I或2所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，向分布式系統(tǒng)寫入文件的流程包括第一寫入步驟客戶端向主節(jié)點詢問需要寫入的文件是否在分布式系統(tǒng)中存在；第二寫入步驟如果需要寫入的文件存在分布式系統(tǒng)，主節(jié)點向客戶端發(fā)送文件的元數(shù)據(jù)，其中包括文件的信息和文件所處的從節(jié)點信息，向分布式系統(tǒng)寫入文件的流程進入第三寫入步驟；如果需要寫入的文件不存在分布式系統(tǒng)，主節(jié)點向客戶端返回可寫入文件的從節(jié)點列表；第三寫入步驟客戶端根據(jù)第二寫入步驟返回的文件元數(shù)據(jù)及從節(jié)點信息向其中一個從節(jié)點寫入文件；第四寫入步驟從節(jié)點接收客戶端數(shù)據(jù)流并寫入文件，如果成功完成向主節(jié)點發(fā)送成功信息，并同時向客戶端發(fā)送確認信息，客戶端收到確認信息后完成操作；如果確認信息不成功，重復第二寫入步驟的操作；第五寫入步驟主節(jié)點收到從節(jié)點完成數(shù)據(jù)寫入的信息后更新元數(shù)據(jù)。
7.根據(jù)權利要求I或2所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，向分布式系統(tǒng)寫入文件的過程不會對數(shù)據(jù)進行預處理。
8.根據(jù)權利要求I或2所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，從分布式系統(tǒng)讀取文件的流程包括第一讀取步驟客戶端向主節(jié)點發(fā)送數(shù)據(jù)請求，其中包括文件路徑和所需要的預處理；第二讀取步驟主節(jié)點對客戶端的數(shù)據(jù)請求進行分析，確定所需文件所處的從節(jié)點和所需要的預處理程序，直接對所需文件進行預處理操作，并且向客戶單返回中間數(shù)據(jù)所處的從節(jié)點；第三讀取步驟客戶端直接向中間數(shù)據(jù)所處的從節(jié)點進行數(shù)據(jù)請求，從節(jié)點根據(jù)數(shù)據(jù)數(shù)據(jù)預處理的情況返回給客戶端所需數(shù)據(jù)。
9.根據(jù)權利要求I或2所述的基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法，其特征在于，從分布式系統(tǒng)讀取文件的流程包括第一預處理步驟客戶端向主節(jié)點發(fā)送數(shù)據(jù)預處理操作，并根據(jù)需要編寫更加復雜的數(shù)據(jù)預處理程序；第二預處理步驟主節(jié)點根據(jù)數(shù)據(jù)預處理處理請求指定從節(jié)點通過數(shù)據(jù)預處理引擎對本地文件進行數(shù)據(jù)預處理，從節(jié)點完成后發(fā)送給主節(jié)點成功信息；第三預處理步驟主節(jié)點根據(jù)從節(jié)點發(fā)送的成功信息更新元數(shù)據(jù)。
全文摘要
本發(fā)明提供了一種基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法。利用分布式系統(tǒng)的主節(jié)點管理全局文件命名空間；并且，在向分布式系統(tǒng)寫入文件的流程、從分布式系統(tǒng)讀取文件的流程、以及從分布式系統(tǒng)讀取文件的流程中，利用分布式系統(tǒng)的主節(jié)點對客戶端的請求進行分析處理，選擇具體的數(shù)據(jù)預處理程序，分發(fā)到分布式系統(tǒng)的從節(jié)點以進行后續(xù)的數(shù)據(jù)預處理和傳輸操作。本發(fā)明能夠在數(shù)據(jù)密集型應用環(huán)境下，將現(xiàn)有的分布式系統(tǒng)存儲空間快速聚合；而且，本發(fā)明充分利用分布式系統(tǒng)計算資源，能夠根據(jù)外部計算設備的需求智能地提供數(shù)據(jù)服務；并且，本發(fā)明將部分數(shù)據(jù)處理負載從外部計算設備轉(zhuǎn)移到分布式系統(tǒng)中，從而減少向外部計算設備提供數(shù)據(jù)服務的帶寬需求。
文檔編號G06F17/30GK102937964SQ20121037240
公開日2013年2月20日申請日期2012年9月28日優(yōu)先權日2012年9月28日
發(fā)明者謝向輝, 臧春峰, 吳東, 郝子宇, 原昊, 錢磊, 張魯飛, 胡蘇太申請人:無錫江南計算技術研究所

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：謝向輝;臧春峰;吳東;郝子宇;原昊;錢磊;張魯飛;胡蘇太
技術所有人：無錫江南計算技術研究所
我是此專利的發(fā)明人

上一篇：一種scada系統(tǒng)中通用通信框架的制作方法
上一篇：一種利用醫(yī)療信息平臺制作臨床文檔的方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

分布式智能系統(tǒng)控制器相關技術

分布式智能系統(tǒng)相關技術

分布式智能輸液系統(tǒng)相關技術

專利數(shù)據(jù)服務試驗系統(tǒng)相關技術

分布式管理系統(tǒng)相關技術

分布式控制系統(tǒng)相關技術

智能分布式饋線自動化相關技術

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于分布式系統(tǒng)的智能數(shù)據(jù)服務方法