亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

匹配于高性能計算機體系結構的結構網(wǎng)格數(shù)據(jù)管理方法_3

文檔序號:8258175閱讀:來源:國知局
角網(wǎng)格單元的索引值為(32,16)。
[0057]步驟202,針對確定的L層結構網(wǎng)格,生成網(wǎng)格片層次結構。
[0058]網(wǎng)格片層次結構101包含L個網(wǎng)格層102(參見圖4),依次編號為第O層、第I層、…、第L-2層和第L-1層。第O層為最粗網(wǎng)格層,包含離散數(shù)值模擬計算區(qū)域的所有最粗網(wǎng)格單元;第J(1 ^ J ^ L-2)層為中間網(wǎng)格層,包含所有最粗網(wǎng)格單元被加密J次后形成的細網(wǎng)格單元,覆蓋第J-1層數(shù)值模擬計算區(qū)域的局部區(qū)域;第L-1層為最細網(wǎng)格層,包含所有最細網(wǎng)格單元。
[0059]圖3b給出了管理二維結構網(wǎng)格的網(wǎng)格片層次結構和3個網(wǎng)格層。其中不同灰度的網(wǎng)格為不同層的網(wǎng)格的示意圖。
[0060]網(wǎng)格層匹配高性能計算機系統(tǒng),網(wǎng)格片層次結構的各個網(wǎng)格層各自獨立地匹配于高性能計算機系統(tǒng),網(wǎng)格層之間可以并行計算,也可以串行計算。
[0061]在一些實施例中,以天氣預報的數(shù)值模擬計算為例,將中國地圖結構網(wǎng)格化,中國地圖構成最粗網(wǎng)格,在每個最粗網(wǎng)格單元中包括該部分地區(qū)的氣象數(shù)據(jù),構成第O層網(wǎng)格,該結構網(wǎng)格對某些地區(qū)的細化率不夠,例如需要對河北省的氣象數(shù)據(jù)進行細化,則將該部分(河北省)的網(wǎng)格單元細化(即加密)構成第I層網(wǎng)格,該第I層網(wǎng)格對某些地區(qū)的細化率不夠,例如需要對北京市的氣象數(shù)據(jù)進行細化,則將該部分(北京市)的網(wǎng)格單元細化構成第2層網(wǎng)格。
[0062]步驟203,針對生成的每個網(wǎng)格層,將其剖分為N個網(wǎng)格區(qū)。其中,N為不小于I的正整數(shù)。
[0063]網(wǎng)格層102被剖分為互不重疊的N個網(wǎng)格區(qū)103,N等于高性能計算機結點數(shù)。網(wǎng)格區(qū)103在網(wǎng)格層102中具有惟一的邏輯編號,被映射到惟一的高性能計算機結點。依據(jù)網(wǎng)格區(qū)103對不同高性能計算機結點的映射,網(wǎng)格層分布存儲在高性能計算機結點的內(nèi)存空間。在所有網(wǎng)格層102中,網(wǎng)格區(qū)103的總數(shù)是一致的。
[0064]圖3c給出了 3個網(wǎng)格層被分別剖分為2個網(wǎng)格區(qū)的示意圖。
[0065]網(wǎng)格區(qū)匹配于高性能計算機結點,與結點一一對應。網(wǎng)格層通過網(wǎng)格區(qū)到結點的匹配,分布存儲到高性能計算機的結點,支持網(wǎng)格區(qū)之間的并行計算,其中,網(wǎng)格區(qū)之間的數(shù)據(jù)交換由進程之間的消息傳遞來完成。
[0066]步驟204,針對生成的每個網(wǎng)格區(qū),將其剖分為M個網(wǎng)格域。其中,M為不小于I的正整數(shù)。
[0067]網(wǎng)格區(qū)103被剖分為互不重疊的M個網(wǎng)格域104 (參見圖4),M等于高性能計算機結點內(nèi)的CPU個數(shù)。網(wǎng)格域104在網(wǎng)格層102中具有惟一的邏輯編號,被映射到高性能計算機結點內(nèi)惟一的CPU。依據(jù)網(wǎng)格域104對不同CPU的映射,網(wǎng)格區(qū)被非均勻訪存(NUMA)感知地分布共享存儲在高性能計算機結點內(nèi)不同CPU的內(nèi)存空間。所有網(wǎng)格層102的所有網(wǎng)格區(qū)103中,網(wǎng)格域104的總數(shù)是一致的。
[0068]圖3d給出了 3個網(wǎng)格層的6個網(wǎng)格區(qū)被分別剖分為2個網(wǎng)格域的示意圖。網(wǎng)格域匹配于高性能計算機結點內(nèi)CPU,與CPU—一對應。網(wǎng)格區(qū)通過網(wǎng)格域到CPU的匹配,分布共享存儲到高性能計算機結點內(nèi)的CPU所屬內(nèi)存中,支持網(wǎng)格域之間的并行計算,其中,網(wǎng)格域之間的數(shù)據(jù)交換由線程通過NUMA訪存來實現(xiàn)。
[0069]步驟205,針對生成的每個網(wǎng)格域,將其剖分為多個網(wǎng)格片。
[0070]網(wǎng)格域104被剖分為互不重疊的P個網(wǎng)格片105 (參見圖4),P為正整數(shù),P不小于CPU內(nèi)總核數(shù)。網(wǎng)格片105在網(wǎng)格層102中具有惟一的邏輯編號,被映射到高性能計算機結點內(nèi)CPU的惟一 CPU核。不同網(wǎng)格片105可以映射到同一個CPU核。依據(jù)網(wǎng)格片105對CPU核的映射,網(wǎng)格域104被共享存儲在高性能計算機結點內(nèi)CPU的內(nèi)存空間。同一網(wǎng)格層102的所有網(wǎng)格域104中,網(wǎng)格片105的總數(shù)可以不同,但至少為CPU內(nèi)總核數(shù)。
[0071]圖3e給出了 3個網(wǎng)格層的6個網(wǎng)格區(qū)的12個網(wǎng)格域被分別剖分為2個網(wǎng)格片的示意圖。
[0072]為了在實際應用中提升計算效率,通常需要根據(jù)高性能計算機CPU的緩存(Cache)大小和數(shù)值計算的訪存模式確定網(wǎng)格片105包含的網(wǎng)格單元106總數(shù)的上限。一個可選擇的辦法是,設置CPU的緩存(Cache)容量為網(wǎng)格片中數(shù)值計算依賴的所有數(shù)據(jù)片的內(nèi)存容量的上限,選取網(wǎng)格片單元總數(shù)上限值,使之滿足所在CPU分配到的所有網(wǎng)格片上的所有物理量的數(shù)據(jù)容量總和不超過該上限,選取所得結果的最大值作為所述網(wǎng)格片包含網(wǎng)格單元的總數(shù)上限;或者選取不同的網(wǎng)格片單元總數(shù)上限值,進行數(shù)值模擬計算,選取性能最優(yōu)的上限值作為所述網(wǎng)格片包括網(wǎng)格單元的總數(shù)上限。原則上,網(wǎng)格片包含的網(wǎng)格單元總數(shù)不超過該上限。
[0073]網(wǎng)格片匹配高性能計算機結點內(nèi)CPU的CPU核和CPU核內(nèi)多級高速緩存(Cache)。網(wǎng)格域通過網(wǎng)格片共享存儲到結點內(nèi)CPU的私有內(nèi)存空間,支持網(wǎng)格片之間的并行計算,其中,網(wǎng)格片之間的數(shù)據(jù)交換由線程通過對稱多處理結構(SMP)訪存來實現(xiàn)。結構網(wǎng)格上的數(shù)值計算隨著網(wǎng)格片被局部到CPU核,數(shù)值計算所需的網(wǎng)格坐標和物理量的訪存源自CPU核內(nèi)Cache,對比于傳統(tǒng)的結點內(nèi)內(nèi)存空間訪存,數(shù)據(jù)局部性顯著提升。
[0074]步驟206,針對生成的每個網(wǎng)格片,根據(jù)網(wǎng)格單元的索引,建立對網(wǎng)格單元的索引和管理。
[0075]網(wǎng)格片105包含多個幾何連通的網(wǎng)格單元106 (參見圖4)。同一網(wǎng)格層102中所有網(wǎng)格單元106具有惟一的邏輯編號,不同網(wǎng)格片105包含的網(wǎng)格單元106總數(shù)可以不同。同一網(wǎng)格層102中,兩個網(wǎng)格片105是幾何相鄰的,當且僅當它們各自存在幾何相鄰的網(wǎng)格單元106。
[0076]網(wǎng)格單元匹配于高性能計算機結點內(nèi)CPU核的指令級并行(ILP)和長向量加速并行(SIMD)。網(wǎng)格片通過網(wǎng)格單元之間的細粒度并行,支持CPU核內(nèi)多個功能部件(例如乘加部件)之間的數(shù)值計算并行,也支持長向量SIMD數(shù)值計算加速。網(wǎng)格單元之間的細粒度并行通過并行訪問和處理存儲網(wǎng)格坐標和物理量值的數(shù)據(jù)片的數(shù)組元素來實現(xiàn)。
[0077]步驟207,針對所有物理量,在所有網(wǎng)格片生成數(shù)據(jù)片,由網(wǎng)格片管理。
[0078]數(shù)據(jù)片107包含網(wǎng)格坐標,物理量定義在網(wǎng)格片105所有網(wǎng)格單元106上的離散值和物理量離散值在網(wǎng)格單元上的位置,其中物理量離散值以多維數(shù)組的形式存儲(如圖4所示)。數(shù)據(jù)片107根據(jù)離散值在網(wǎng)格單元106中的幾何位置的不同,可以分為多種類型,包括中心量、結點量、邊心量、面心量、散亂量、外表面中心量、外表面結點量、外表面面心量、等等。同一個物理量,它在結構網(wǎng)格所有網(wǎng)格單元106上的離散值隨網(wǎng)格片105以數(shù)據(jù)片107的形式分布存儲到結點、分布共享存儲到CPU或共享存儲到CPU核的內(nèi)存空間。根據(jù)網(wǎng)格片105之間的相鄰關系,數(shù)據(jù)片107還沿網(wǎng)格片105的四周設置影像區(qū),用于存儲同一物理量從相鄰網(wǎng)格片105對應幾何位置復制的數(shù)據(jù)片107的離散值。
[0079]圖3f給出了某個網(wǎng)格片管理的3個數(shù)據(jù)片的示意圖,在本步驟的實施例中,以該網(wǎng)格片具有3個物理量的數(shù)據(jù)片為例進行介紹,在本發(fā)明的其它實施例中該網(wǎng)格片還可以具有對應不同物理量的其它數(shù)量的數(shù)據(jù)片,在本例中的3個物理量分別為溫度、速度和壓力,對應3個數(shù)據(jù)片,分別定義于網(wǎng)格單元的幾何中心、幾
當前第3頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1