專利名稱:面向可重構陣列的多參數(shù)融合性能建模方法
技術領域:
本發(fā)明涉及計算機處理器技術領域,具體涉及一種面向可重構陣列的多參數(shù)融合性能建模方法。
背景技術:
可重構計算陣列Processing Element Array (PEA)是可重構處理器的重要組成部分,很多計算密集型運算都被映射到PEA上進行加速。為了更好的挖掘可重構計算陣列的計算潛能,我們需要要去優(yōu)化算法在陣列上面的映射。雖然通過算法仿真可以得到時鐘精確的陣列執(zhí)行結果,但是由于算法映射的方法千差萬別以及龐大復雜的算法任務,使得仿真過程需要大量的時間以至于我們的開發(fā)周期不能容忍。另外,可重構處理器擁有自己獨特的硬件結構和運行機制,傳統(tǒng)的性能評估模型不能直接應用。例如:陣列計算時間,陣列重構時間,陣列通信時間等參數(shù)都是影響陣列執(zhí)行性能的重要參數(shù)。因此,為可重構計算陣列建立一個多參數(shù)融合的性能解析模型,并以此為度量去指導我們的算法映射將具有重要的意義。 百分之九十的執(zhí)行時間花費百分之十的程序代碼上,循環(huán)是典型的計算密集型運算。因此,前人有很多映射工作都集中在循環(huán)映射上??芍貥嬘嬎汴嚵猩系难h(huán)的映射主要分為以下幾個主要的子問題:a)算子調度,即把一個算子放在哪一個時間控制步上面去執(zhí)行。b)布局,即把一個算子放在陣列中的哪一個處理單元Processing Element (PE)上面去執(zhí)行。c)布線,即怎么樣去連接不同PE之間的數(shù)據(jù)通道。很多前人的工作都把循環(huán)啟動間隔Initial Interval (II)作為算法映射的度量,通過獨立地或者聯(lián)合地解決這三個子問題來尋求最小的II,從而獲得最優(yōu)的映射方式。這種尋求最小II的模調度方法是起源于多核處理器上面的軟件流水方法。它通過重疊不同循環(huán)實例之間的算子,形成循環(huán)內核,從而獲得并行性,縮短程序執(zhí)行時間。然而可重構處理器不同于傳統(tǒng)的通用多核處理器,影響其程序執(zhí)行性能的參數(shù)不只是算子執(zhí)行的并行性,還有包括陣列的不同運行實例之間的通信代價,以及改變陣列功能的重構代價。因此傳統(tǒng)的以II為尺度的循環(huán)映射方法在可重構計算陣列上面不再精確和完備。現(xiàn)有技術中缺乏一種專門面向可重構計算陣列的精確的,統(tǒng)一的性能評估模型。
發(fā)明內容
本發(fā)明旨在至少在一定程度上解決上述技術問題之一或至少提供一種有用的商業(yè)選擇。為此,本發(fā)明的目的在于提出一種完備精確的面向可重構陣列的多參數(shù)融合性能建模方法。根據(jù)本發(fā)明實施例的面向可重構陣列的多參數(shù)融合性能建模方法,將一個任務分解成一系列連續(xù)的陣列操作P=[1,P],則任務總體執(zhí)行時間等于多次陣列操作的重構周期數(shù),數(shù)據(jù)載入周期數(shù),陣列計算周期數(shù)以及數(shù)據(jù)存儲周期數(shù)的總和再乘以陣列工作頻率,即:
權利要求
1.一種面向可重構陣列的多參數(shù)融合性能建模方法,其特征在于,將一個任務分解成一系列連續(xù)的陣列操作P=[l,P],則任務總體執(zhí)行時間等于多次陣列操作的重構周期數(shù),數(shù)據(jù)載入周期數(shù),陣列計算周期數(shù)以及數(shù)據(jù)存儲周期數(shù)的總和再乘以陣列工作頻率,即:
2.如權利要求1所述的面向可重構陣列的多參數(shù)融合性能建模方法,其特征在于,定義0-1變量Xp,當陣列操作需要重構時xp=l,當陣列操作不需要重構時xp=0,假設所有需要重構的陣列操作中重構周期相等,記為常數(shù)CFC,則所有的陣列操作中的重構周期就可表示為:CFCp=Xp CFC,以及整個任務的重構周期數(shù)表示為:
3.如權利要求1所述的面向可重構陣列的多參數(shù)融合性能建模方法,其特征在于,所有的陣列操作中的通信周期數(shù)等于每一次陣列操作的載入載出數(shù)據(jù)量之和除以局部數(shù)據(jù)存儲器的帶寬,即
4.如權利要求1所述的面向可重構陣列的多參數(shù)融合性能建模方法,其特征在于,在CrossBar互聯(lián)形式的陣列中,所有陣列的計算周期為固定的,則整個任務的陣列計算周期為
5.如權利要求1所述的面向可重構陣列的多參數(shù)融合性能建模方法,其特征在于,在Mesh互連形式的陣列中,陣列的計算時間是互聯(lián)形式和數(shù)據(jù)依賴長度的函數(shù),則整個任務的陣列計算周期數(shù)可以表示為:
6.如權利要求1所述的面向可重構陣列的多參數(shù)融合性能建模方法,其特征在于,對于L (Μ,N, fflb, Llb)的二維嵌套循環(huán),M和N分別代表這個循環(huán)的外層循環(huán)和內層循環(huán)的邊界,Wlb,Llb分別代表這個嵌套的循環(huán)體DFG圖寬和長,則上述二維嵌套循環(huán)的基于多面體模型的循環(huán)變換的多參數(shù)融合可重構計算陣列的性能模型為:
全文摘要
本發(fā)明公開了一種面向可重構陣列的多參數(shù)融合性能建模方法,該建模方法將一個任務分解成一系列連續(xù)的陣列操作p=[1,P],則任務總體執(zhí)行時間等于多次陣列操作的重構周期數(shù),數(shù)據(jù)載入周期數(shù),陣列計算周期數(shù)以及數(shù)據(jù)存儲周期數(shù)的總和再乘以陣列工作頻率,即其中,TET表示任務的總體執(zhí)行時間,f表示陣列工作的頻率,其中CFC表示重構周期,LDC表示數(shù)據(jù)載入周期,CPC表示陣列計算周期,STC表示數(shù)據(jù)存儲周期。本發(fā)明能夠精確地、完善地把可重構處理器的總體執(zhí)行時間解析的表達出來,以此總體執(zhí)行時間的性能模型,為用戶的算法映射提供了評估和指導意義。
文檔編號G06F15/80GK103218347SQ20131015676
公開日2013年7月24日 申請日期2013年4月28日 優(yōu)先權日2013年4月28日
發(fā)明者尹首一, 劉大江, 劉雷波, 魏少軍 申請人:清華大學