用于性能改善的可重配置圖形處理器的制造方法

文檔序號(hào)：9810007閱讀：527來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

用于性能改善的可重配置圖形處理器的制造方法
【專(zhuān)利說(shuō)明】用于性能改善的可重配置圖形處理器
[00011 本申請(qǐng)是申請(qǐng)日為2011年11月21日申請(qǐng)?zhí)枮榈?01180074955.6號(hào)發(fā)明名稱(chēng)為"用于性能改善的可重配置圖形處理器"的中國(guó)專(zhuān)利申請(qǐng)的分案申請(qǐng)。
[0002] 背景
[0003] 本申請(qǐng)總體上涉及計(jì)算機(jī)系統(tǒng)中的圖形處理。
[0004] 圖形處理器在不同的處理?xiàng)l件下運(yùn)行。在一些情況下，它們可在高功耗模式下以及在低功耗模式下運(yùn)行。可能令人期望的是，在給定圖形處理器所運(yùn)行的功耗模式的情況下，獲得最大的可能性能。
[0005] 附圖簡(jiǎn)要說(shuō)明
[0006] 圖1是本發(fā)明的一個(gè)實(shí)施例的框圖。
[0007] 圖2是本發(fā)明的另一個(gè)實(shí)施例的流程圖。
[0008] 圖3是本發(fā)明的一個(gè)實(shí)施例的示意圖描繪。
[0009] 圖4是本發(fā)明的一個(gè)實(shí)施例的性能相對(duì)于功率預(yù)算的假想圖；以及
[0010] 圖5是一個(gè)實(shí)施例的功率預(yù)算相對(duì)于時(shí)間的假想圖。
[0011] 詳細(xì)說(shuō)明
[0012] 在一些實(shí)施例中，圖形處理內(nèi)核自動(dòng)對(duì)其自身進(jìn)行重配置以便通過(guò)對(duì)圖形處理引擎的部分進(jìn)行動(dòng)態(tài)功率門(mén)控來(lái)在高功率和低功率包絡(luò)中增加或最大化性能。如在此所使用的，功率門(mén)控包括激活或去激活內(nèi)核部分。
[0013] 盡管將使用平板計(jì)算機(jī)圖形處理器提供示例，相同的概念應(yīng)用于任何圖形處理器。
[0014] 圖形處理內(nèi)核通常包括執(zhí)行算數(shù)、邏輯和其他操作的多個(gè)執(zhí)行單元?？墒褂枚鄠€(gè) 采樣器進(jìn)行紋理處理。采樣器和多個(gè)執(zhí)行單元是子切片（subslice)?？苫谀繕?biāo)性能和功率預(yù)算在特定的圖形處理內(nèi)核中包括多個(gè)子切片。對(duì)子切片進(jìn)行組合以形成圖形處理切片 (slice)。圖形處理內(nèi)核可包含一個(gè)或多個(gè)切片。在平板計(jì)算機(jī)圖形處理內(nèi)核中，通常使用單個(gè)切片以及一個(gè)、兩個(gè)或三個(gè)子切片設(shè)計(jì)。多切片在客戶(hù)端圖形處理器中是常見(jiàn)的。
[0015] 因此，參見(jiàn)圖1，示出了典型的圖形處理器內(nèi)核，內(nèi)核10包括切片編號(hào)1(標(biāo)記為 14)，該切片可包括固定功能流水線(xiàn)邏輯16和多個(gè)子切片18a和18b。在一些實(shí)施例中，可包括更多切片和更多或更少的子切片。圖形處理內(nèi)核還包括固定功能邏輯12。
[0016] -個(gè)、兩個(gè)和三個(gè)子切片設(shè)計(jì)的功率和性能特征不同，如圖4所示。作為一個(gè)示例，性能線(xiàn)性地增加到性能相對(duì)于功率耗散的拐點(diǎn)A(例如，大約2.5瓦）。在該拐點(diǎn)以下，圖形處理器在頻率成比例的區(qū)域中工作，在該區(qū)域中，可在不升高工作電壓的情況下升高圖形處理器頻率。在該拐點(diǎn)以上，圖形處理器頻率僅在電壓也升高時(shí)才升高，這通常對(duì)功率耗散具有負(fù)面影響并且導(dǎo)致性能相對(duì)于功率耗散中比頻率成比例區(qū)域經(jīng)歷更平緩的曲線(xiàn)。
[0017] 可對(duì)圖形處理器的子切片中的一個(gè)或多個(gè)進(jìn)行功率門(mén)控?？傮w上，子切片越多，性能越尚，但是性能間隙隨著可用功率預(yù)算的減少而減少并且可能在圖4中存在點(diǎn)B(例如，在大約1.5瓦），其中單一子切片配置表現(xiàn)得比兩子切片配置更好。這種更優(yōu)性能是由具有明顯更多泄露功率以及因此更少用于動(dòng)態(tài)功率的空間的更大配置造成的。在低功率預(yù)算中，更少用于動(dòng)態(tài)功率的空間可顯著地限制更大配置的頻率和性能，使得其看起來(lái)沒(méi)有更小配置那么吸引人。
[0018] 在一些實(shí)施例中，功率共享機(jī)制可用于實(shí)現(xiàn)圖形處理器子切片的高效動(dòng)態(tài)功率門(mén) 控。當(dāng)然，代替對(duì)子切片功耗進(jìn)行門(mén)控，相同的概念應(yīng)用于具有多于一個(gè)切片的實(shí)施例中的任意數(shù)量的圖形處理器切片的動(dòng)態(tài)功率門(mén)控。
[0019] 圖形處理器可具有功率共享功能，該功能基本上隨著時(shí)間增加(或降低）功率，如圖5所示。在特定的時(shí)間點(diǎn)七處，可由功率控制單元為圖形處理器內(nèi)核分配特定低水平的功率預(yù)算TDP1，該功率預(yù)算迫使圖形處理器在特定頻率Π 下運(yùn)行，該特定頻率是允許圖形處理器不超過(guò)其分配功率預(yù)算的最大頻率。當(dāng)功率預(yù)算隨著時(shí)間增加時(shí)，圖形內(nèi)核可在逐漸更尚的頻率下運(yùn)行。
[0020] 在子切片功率門(mén)控下，功率控制單元事先得知圖形處理器內(nèi)核可配置有全套的執(zhí) 行單元和子切片或者配置有更少的執(zhí)行單元和子切片。例如，一個(gè)實(shí)施例可包括十六個(gè)執(zhí) 行單元和兩個(gè)子切片并且另一種操作模式可包括八個(gè)執(zhí)行單元和一個(gè)子切片。當(dāng)圖形處理器可用的功率預(yù)算很小時(shí)，可在更小的內(nèi)核配置中配置圖形處理器，其中兩個(gè)可用子切片之一被功率門(mén)控。
[0021 ]總體而言，不是簡(jiǎn)單地在任何特定時(shí)間點(diǎn)關(guān)閉子切片，因?yàn)槠淇赡苷趫?zhí)行有效線(xiàn)程。當(dāng)功率控制單元確定應(yīng)當(dāng)對(duì)子切片進(jìn)行功率門(mén)控時(shí)，立即動(dòng)作是阻擋新的圖形處理線(xiàn)程被調(diào)度到該子切片上。因此，在已經(jīng)在子切片上執(zhí)行的線(xiàn)程完成并且子切片變?yōu)榭臻e 之前需要一段時(shí)間。在一個(gè)實(shí)施例中，僅當(dāng)這時(shí)對(duì)子切片進(jìn)行實(shí)際功率門(mén)控。
[0022] 在功率門(mén)控下，當(dāng)功率預(yù)算逐漸增加時(shí)，在某一時(shí)間點(diǎn)，初始關(guān)閉的子切片變?yōu)榇?開(kāi)?；蛘?，相反地，當(dāng)處理器從高功率預(yù)算變?yōu)榈凸β暑A(yù)算時(shí)，可關(guān)閉子切片(如圖5所示）。
[0023] 當(dāng)關(guān)閉子切片時(shí)，頻率可增加或翻倍(如果關(guān)閉了兩個(gè)子切片之一）。結(jié)果是，性能可保持相對(duì)穩(wěn)定，因?yàn)槭Ｓ嗟淖忧衅\(yùn)行得比兩個(gè)子切片快兩倍。這種頻率增加確保了從較大的未門(mén)控圖形內(nèi)核到較小的門(mén)控圖形內(nèi)核的平滑轉(zhuǎn)變(從性能角度出發(fā)）。相反地，當(dāng) 子切片未被門(mén)控并且我們轉(zhuǎn)變到兩切片圖形內(nèi)核時(shí)，時(shí)鐘頻率減半，以便將總體性能維持在大約相同的水平下。
[0024] 如上所述的時(shí)鐘頻率改變被設(shè)計(jì)成在出現(xiàn)功率門(mén)控的時(shí)間點(diǎn)不顯著地中斷(例如翻倍或減半）圖形內(nèi)核的可縮放部分（圖1所示子切片邏輯）的總體性能。然而，如果功率門(mén) 控的動(dòng)作由于其低泄露耗散已經(jīng)產(chǎn)生了更功率高效的圖形內(nèi)核，這隨后會(huì)允許圖形內(nèi)核升高其時(shí)鐘頻率和功率耗散從而滿(mǎn)足其分配功率預(yù)算。這將導(dǎo)致增加的性能，而這就是功率門(mén)控的終極目標(biāo)。
[0025] 另一方面，當(dāng)分配給圖形內(nèi)核的功率預(yù)算增加并允許增加子切片時(shí)，將時(shí)鐘頻率減半將初始地保留相同的性能。然而，給定增加的圖形功率預(yù)算，圖形內(nèi)核然后將被允許也升高其頻率，這將導(dǎo)致所希望的提高性能的結(jié)果。
[0026] 在如上所述的動(dòng)態(tài)功率門(mén)控的過(guò)程中升高或降低時(shí)鐘頻率針對(duì)圖形內(nèi)核的可縮放部分（即，圖1所示的子切片)而言運(yùn)行良好。然而，如果圖形內(nèi)核的不可縮放部分(例如，固定功能邏輯12,如圖1所示)使用相同的時(shí)鐘，則改變時(shí)鐘頻率可影響并且可能限制該邏輯的性能。這將不是所希望的。為了避免這種情況，不可縮放邏輯可使用其自身的獨(dú)立時(shí) 鐘，該獨(dú)立時(shí)鐘不受可縮放圖形邏輯內(nèi)的時(shí)鐘頻率改變的影響。
[0027] 從較大配置切換到較小配置可改善性能，因?yàn)槠涮峁┝诵孤豆?jié)省并且為更動(dòng)態(tài)的功率提供了空間。同時(shí)，從較大配置切換到較小配置可能潛在地導(dǎo)致增加的動(dòng)態(tài)功率，因?yàn)?頻率也相應(yīng)地增加了。因此，從較大配置轉(zhuǎn)變到較小配置由于相應(yīng)的頻率增加可能在所實(shí) 現(xiàn)的泄露節(jié)省超過(guò)了動(dòng)態(tài)功率成本時(shí)發(fā)生。當(dāng)這種情況保持時(shí)，這種轉(zhuǎn)變將存在凈功率節(jié) 省并且有余地來(lái)繼續(xù)增加頻率并且實(shí)現(xiàn)凈性能增益。
[0028] 因此，舉一個(gè)例子，在十六執(zhí)行單元下，兩子切片單元轉(zhuǎn)變到八執(zhí)行單元，一個(gè)子切片單元作為功率門(mén)控的結(jié)果，以下泄露增量(LD)等式適用：
[0031]其中f8和Π 6是在功率門(mén)控或不門(mén)控事件發(fā)生時(shí)的時(shí)間點(diǎn)處八和十六執(zhí)行單元配置的頻率;V8和V16是當(dāng)功率門(mén)控事件發(fā)生時(shí)兩個(gè)圖形處理內(nèi)核的工作電壓;C8和C16是當(dāng) 功率門(mén)控事件發(fā)生時(shí)兩個(gè)圖形處理內(nèi)核的切換電容；Cmax8和Cmaxl6是對(duì)于功率病毒 (virus)工作負(fù)載，兩個(gè)圖形內(nèi)核的最大切換電容；以及AR16和AR8是就在功率門(mén)控或不門(mén) 控事件之前和之后的兩個(gè)內(nèi)核的應(yīng)用率。應(yīng)用的"應(yīng)用率"被定義為當(dāng)該應(yīng)用在內(nèi)核上執(zhí)行時(shí)圖形內(nèi)核切換電容與圖形內(nèi)核功率病毒的切換電容的比率。
[0032]這些等式可用于決定

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：N·卡布拉塞斯;E·C·薩姆森;
技術(shù)所有人：英特爾公司;
我是此專(zhuān)利的發(fā)明人

上一篇：電子設(shè)備及其控制方法
上一篇：一種關(guān)閉應(yīng)用程序的方法和裝置的制造方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

高性能圖形處理器相關(guān)技術(shù)

改善穩(wěn)壓器性能的措施相關(guān)技術(shù)

如何改善存儲(chǔ)器性能相關(guān)技術(shù)

如何改善穩(wěn)壓器性能相關(guān)技術(shù)

為了改善摩擦性能相關(guān)技術(shù)

改善電腦性能相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于性能改善的可重配置圖形處理器的制造方法