亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

匹配于高性能計算機體系結構的結構網格數據管理方法_2

文檔序號:8258175閱讀:來源:國知局
算機結點內CPU內多處理器核間。
[0024]通過本發(fā)明實施例的上述方法可以大幅提升結構網格和物理量的存儲與訪存的數據局部性,支持應用軟件面向高性能計算機復雜體系結構展開浮點性能優(yōu)化,大幅提升計算效率。
【附圖說明】
[0025]為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。在附圖中:
[0026]圖1所示為本發(fā)明實施例匹配于高性能計算機體系結構的結構網格數據管理方法的流程圖;
[0027]圖2所示為本發(fā)明實施例匹配于高性能計算機體系結構的結構網格數據管理方法的具體流程圖;
[0028]圖3a所示為本發(fā)明實施例一個二維結構網格實例示意圖;
[0029]圖3b所示為本發(fā)明實施例管理二維結構網格的網格片層次結構和3個網格層的示意圖;
[0030]圖3c所示為本發(fā)明實施例3個網格層被分別剖分為2個網格區(qū)的示意圖;
[0031]圖3d所示為本發(fā)明實施例3個網格層的6個網格區(qū)被分別剖分為2個網格域的示意圖;
[0032]圖3e所示為本發(fā)明實施例3個網格層的6個網格區(qū)的12個網格域被分別剖分為2個網格片的示意圖;
[0033]圖3f所示為本發(fā)明實施例某個網格片管理的3個數據片的示意圖;
[0034]圖4所示為本發(fā)明實施例結構網格層次結構的具體示意圖。
【具體實施方式】
[0035]為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚明白,下面結合附圖對本發(fā)明實施例做進一步詳細說明。在此,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,但并不作為對本發(fā)明的限定。
[0036]如圖1所示為本發(fā)明實施例匹配于高性能計算機體系結構的結構網格數據管理方法的流程圖。
[0037]包括步驟101,根據數值模擬對象確定結構網格和所述結構網格上的物理量,并將結構網格建模為由多個網格層構成的網格片層次結構。
[0038]所述結構網格由離散數值模擬計算區(qū)域的所有網格單元構成,網格單元是數值模擬數值算法和程序設計的最小幾何單位,具有惟一的邏輯索引和幾何拓撲。所述網格片層次結構包含若干連續(xù)編號的網格層。其中,包含離散數值模擬計算區(qū)域的所有最粗網格單元的網格層稱為最粗網格層;包含離散數值模擬計算區(qū)域所有最細網格單元的網格層稱為最細網格層;其余網格層稱為中間網格層。從最粗網格層到最細網格層中,每個網格層由上一個網格層的若干單元一致加密得到,覆蓋上一個網格層數值模擬計算區(qū)域的局部區(qū)域。
[0039]步驟102,將所述網格層剖分為互不重疊的若干個子網格,稱這些子網格為網格區(qū),為每個所述網格區(qū)賦予惟一的邏輯編號,將每個所述網格區(qū)映射到惟一的高性能計算機結點,將所述網格區(qū)分布存儲在高性能計算機結點的內存空間。
[0040]步驟103,將網格區(qū)剖分為互不重疊的若干個子網格,稱這些子網格為網格域,為每個網格域在網格層中分配惟一的邏輯編號,將其映射到高性能計算機結點內惟一的CPU,所述網格域被分布共享存儲在高性能計算機結點內不同CPU的內存空間。
[0041]步驟104,將網格域剖分為互不重疊的若干個子網格,稱這些子網格為網格片,為每個網格片在網格層中分配惟一的邏輯編號,將其映射到高性能計算機結點內CPU的惟一CPU核,依據所述網格片對CPU核的映射,網格片被共享存儲在高性能計算機結點內CPU的內存空間。
[0042]步驟105,在每個網格片上,為每個物理量在該網格片上分配唯一的內存空間,用于儲存該物理量定義在該網格片所有網格單元上的離散值。
[0043]所述網格片中包括至少一個數據片,所述數據片包括網格單元的坐標,以及物理量定義在該網格片所有網格單元上的離散值;還包括所述離散值在所述網格單元中的幾何位置。
[0044]其中,所述離散值根據所述幾何位置不同,分為多種類型,包括,中心量、結點量、邊心量、面心量、散亂量、外表面中心量、外表面結點量、外表面面心量等等。作為本發(fā)明的一個實施例,不同物理量對應不同的數據片。
[0045]作為本發(fā)明的一個實施例,所述數據片還沿網格片的四周設置影像區(qū),用于存儲同一物理量從相鄰網格片對應幾何位置復制的物理量的離散值。
[0046]作為本發(fā)明的一個實施例,所述網格片包括網格單元的總數上限可設置為,設置CPU的緩存(Cache)容量為網格片中數值計算依賴的所有數據片的內存容量的上限,選取網格片單元總數上限值,使之滿足所在CPU分配到的所有網格片上的所有物理量的數據容量總和不超過該上限,選取所得結果的最大值作為所述網格片包含網格單元的總數上限。
[0047]作為本發(fā)明的一個實施例,所述網格片包括網格單元的總數上限可設置為,選取不同的網格片單元總數上限值,進行數值模擬計算,選取性能最優(yōu)的上限值作為所述網格片包括網格單元的總數上限。
[0048]作為本發(fā)明的一個實施例,所述結構網格上的物理量隨著網格片被分布儲存于高性能計算機結點間、分布共享儲存于高性能計算機結點內CPU間、共享存儲于高性能計算機結點內CPU內多處理器核間。
[0049]上述的結構網格可以包括二維網格、三維網格和更高維網格。
[0050]通過本發(fā)明實施例的上述方法可以大幅提升結構網格和物理量的存儲與訪問的數據局部性,支持應用軟件面向高性能計算機復雜體系結構展開浮點性能優(yōu)化,大幅提升計算效率。
[0051]如圖2所示為本發(fā)明實施例匹配于高性能計算機體系結構的結構網格數據管理方法的具體流程圖。
[0052]包括步驟201,根據數值模擬對象確定剖分計算區(qū)域的結構網格和所述結構網格上的物理量。
[0053]在本實施例中,結構網格由L層網格構成,第O層網格為最粗層網格,包含離散計算區(qū)域的所有最粗網格單元,第I層網格包含最粗層部分網格單元按第I層網格細化率加密后形成的所有網格單元構成。依次類推,第J(0〈J〈L,其中J、L為正整數)層網格包含第J-1層部分網格單元按第J層網格細化率加密后形成的所有網格單元構成,第L-1層網格為最細網格層。
[0054]所述第J層網格細化率指第J-1層網格單元沿各個坐標維度被加密的倍數所構成的一個長度為空間總維數的整數正向量。
[0055]在每層網格,每個網格單元具有惟一的索引(K_1,K_2,…,K_d),K_i表示第1-1個坐標維度的索引,為一個整型數。幾何相鄰網格單元的索引沿相鄰坐標方向的索引值相差1,其他相鄰坐標方向的索引值相等。第J層網格單元的索引值是其加密前粗網格層網格單元的索引值與第J層網格細化率的乘積。
[0056]圖3a給出了一個二維結構網格實例的示意圖,它由3層網格構成,最粗網格層包含20x20個網格單元,左下角網格單元的索引值為(0,0);第I層網格包含20x16個網格單元,它通過加密最粗網格層的10x4個網格單元形成,網格細化率為2x4,左下角網格單元的索引值為(0,0);最細層網格包含16x16個網格單元,它通過加密第I層網格的4x4個網格單元形成,網格細化率為4x4,左下
當前第2頁1 2 3 4 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1