基于gpu的動態(tài)視覺測量特征點(diǎn)中心快速定位方法
【專利摘要】本發(fā)明提供了一種基于GPU的像面特征點(diǎn)中心快速定位方法,所述方法包括如下步驟:CPU獲取原始圖像,傳送至全局存儲器中;GPU從全局存儲器中獲取所傳送的原始圖像,進(jìn)行高斯低通濾波,送回全局存儲器;在共享存儲器上分配存儲空間;由GPU基于濾波后的圖像進(jìn)行直方圖統(tǒng)計,并將統(tǒng)計信息傳回全局存儲器;CPU獲取的直方圖統(tǒng)計信息進(jìn)行最大類間方差計算,將計算得到的閾值傳送回全局存儲器;GPU進(jìn)行圖像二值化處理,并傳送至全局存儲器和CPU;CPU進(jìn)行感興趣區(qū)域的提取,提取后傳送至全局存儲器;GPU基于感興趣區(qū)域信息進(jìn)行區(qū)域約束判斷,將得到的有效目標(biāo)區(qū)域傳送至全局存儲器;根據(jù)得到的有效目標(biāo)區(qū)域進(jìn)行區(qū)域的點(diǎn)中心計算,將結(jié)果傳回到所述全局存儲器和CPU。
【專利說明】基于GPU的動態(tài)視覺測量特征點(diǎn)中心快速定位方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及動態(tài)視覺測量技術(shù),特別涉及一種基于GPU的動態(tài)視覺測量特征點(diǎn)中 心快速定位方法。
【背景技術(shù)】
[0002] 隨著工業(yè)制造技術(shù)的快速發(fā)展,對高精度、高效率的測量技術(shù)的需求越來越迫切, 如大尺寸雷達(dá)天線面形變化的測量、大型飛機(jī)裝配中的在線測量和大型光熱發(fā)電設(shè)備的在 線安裝定位測量等。動態(tài)視覺測量技術(shù)作為一種非接觸測量手段具有操作簡單、精度高及 測量不受被測物表面差異等其他方法無法比擬的優(yōu)點(diǎn),而被廣泛應(yīng)用于多種工業(yè)制造的場 合。
[0003] 但是,目前動態(tài)視覺測量系統(tǒng)受限于處理速度較慢,很難實(shí)現(xiàn)對速度要求很高的 測量。動態(tài)視覺測量系統(tǒng)中大量點(diǎn)云的點(diǎn)中心高精度定位耗時巨大,要滿足動態(tài)測量大量 點(diǎn)云的要求,在不損失精度的前提下加速點(diǎn)中心高精度定位的問題急需解決,因此視覺測 量中的加速問題目前已成為國內(nèi)外研究的重點(diǎn)。國外在視覺測量方面的研究起步較早并已 進(jìn)入成熟期,研究的重點(diǎn)已從幾何量測精度轉(zhuǎn)為實(shí)時性、全自動化等。目前國外已有動態(tài)視 覺測量系統(tǒng)推出,如美國的V-STARS Dynamo系統(tǒng),相對精度可達(dá)1/80000,最高工作頻率為 10Hz ;德國Gom公司的ARAMIS系統(tǒng)相對精度可達(dá)1/20000,最高工作頻率15Hz。但是,當(dāng)測 量大量點(diǎn)云時很難達(dá)到系統(tǒng)標(biāo)稱的速度,無法滿足動態(tài)測量的需求。在對精度和速度要求 較高的測量中,動態(tài)視覺測量系統(tǒng)同時獲得高精度和高速度相互矛盾,要想在較高精度的 前提下提高速度,必須尋求一種新的技術(shù)。
[0004] 由于處理器的頻率不會在短時間內(nèi)有飛躍式的提高,因此采用并行處理的方式來 提高處理速度是一個很好的選擇。CUDA (Compute Unified Device Architecture,統(tǒng)一計算 架構(gòu))是NVIDIA公司2007年正式推出的一個通用并行計算架構(gòu),通過CUDA可以直接調(diào)用 的計算資源,使數(shù)據(jù)密集型和計算密集型的部分在GPU上進(jìn)行并行處理。國外已經(jīng)有很 多學(xué)者做了 CUDA架構(gòu)下計算機(jī)視覺方面的研究,如ChangchangWu, SameerAgarwal等人應(yīng) 用CUDA并行架構(gòu)加速束調(diào)整算法達(dá)到了 30倍的加速效果。最近十年國內(nèi)多所高校及光電 產(chǎn)品研發(fā)公司對動態(tài)視覺測量系統(tǒng)相關(guān)技術(shù)進(jìn)行了研究。相關(guān)學(xué)者已經(jīng)對動態(tài)視覺測量中 高精度的標(biāo)定算法、匹配及相關(guān)技術(shù)進(jìn)行了研究,有些科研機(jī)構(gòu)還推出了相關(guān)的實(shí)驗(yàn)測量 系統(tǒng)。但是,動態(tài)視覺測量中處理速度較慢的問題一直沒有得到很好的解決,阻礙了其在工 業(yè)在線測量中的應(yīng)用。
[0005] 因此,需要一種改進(jìn)的處理特征點(diǎn)中心定位的方法,可以大大提高算法的處理速 度,從而解決動態(tài)視覺測量中大量點(diǎn)云的點(diǎn)中心定位耗時巨大的問題。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的是提供了一種基于GPU的像面特征點(diǎn)中心快速定位方法,所述方法 包括如下步驟:a)CPU獲取要進(jìn)行像面特征點(diǎn)中心快速定位的原始圖像,并傳送至全局存 儲器中;b)GPU從所述全局存儲器中獲取所傳送的原始圖像,對其進(jìn)行高斯低通濾波計算, 并送回所述全局存儲器;c)在共享存儲器上分配存儲空間;d)由GPU基于濾波后的圖像進(jìn) 行直方圖的統(tǒng)計,并將直方圖統(tǒng)計信息傳回到所述全局存儲器;e)CPU從所述全局存儲器 獲取直方圖統(tǒng)計后的信息,并且進(jìn)行最大類間方差計算,以確定閾值,將計算得到的閾值傳 送回全局存儲器;f)合并訪問全局存儲器中濾波后的圖像數(shù)據(jù)和存儲的閾值,GPU進(jìn)行圖 像的二值化處理,并傳送至全局存儲器和CPU ;g) CPU進(jìn)行感興趣區(qū)域的提取,提取后傳送 至全局存儲器;h)GPU基于全局存儲器的感興趣區(qū)域信息進(jìn)行區(qū)域約束判斷,將得到的有 效目標(biāo)區(qū)域傳送至全局存儲器;以及i)根據(jù)得到的有效目標(biāo)區(qū)域進(jìn)行區(qū)域的點(diǎn)中心計算, 將結(jié)果傳回到所述全局存儲器和CPU。
[0007] 優(yōu)選地,在步驟b中為每個線程塊分配相應(yīng)大小的共享存儲器,以存儲3X3的高 斯模板數(shù)據(jù)。
[0008] 優(yōu)選地,在步驟c中,每個線程塊在共享存儲器上分配大小為256的數(shù)組,線程塊 中的每個線程統(tǒng)計對應(yīng)像素的灰度信息,并將統(tǒng)計結(jié)果臨時存儲到共享內(nèi)存數(shù)組中,最后 再把共享存儲器中的統(tǒng)計結(jié)果應(yīng)用原子操作的方式累加到全局存儲器中。
[0009] 優(yōu)選地,在步驟e中,用串行的方式統(tǒng)計最大類間方差。
[0010] 優(yōu)選地,在步驟f中,合并訪問全局存儲器中濾波后的圖像數(shù)據(jù),并訪問共享存儲 器中存儲的閾值,在圖像的像素灰度值大于上述計算得到的閾值時,將其賦值為255,當(dāng)小 于閾值時賦值為0。
[0011] 優(yōu)選地,在步驟h中,GPU中的每個線程合并訪問全局存儲器中對應(yīng)的區(qū)域信息, 判斷是否滿足約束條件,將不滿足約束條件的區(qū)域信息賦〇,而滿足約束條件的區(qū)域不做任 何處理。
[0012] 優(yōu)選地,所述約束條件包括如下條件:區(qū)域邊緣周長約束,區(qū)域?qū)捈s束、區(qū)域長約 束、擴(kuò)展兩像素是否越界約束、區(qū)域面積約束、長寬比約束、二值化后區(qū)域擴(kuò)展一像素是否 有其他點(diǎn)引入約束、區(qū)域灰度比約束。
[0013] 優(yōu)選地,在步驟i中,點(diǎn)中心的坐標(biāo)計算方法包括合并訪問全局存儲器中的R0I區(qū) 域信息和濾波后的圖像數(shù)據(jù),以及執(zhí)行配置參數(shù),為每個線程塊分配1024個線程,每個線 程計算相應(yīng)的R0I區(qū)域?qū)?yīng)的點(diǎn)中心坐標(biāo)。
[0014] 優(yōu)選地,采用變權(quán)重灰度質(zhì)心法來提取特征點(diǎn)中心坐標(biāo)。
[0015] 優(yōu)選地,利用綁定多個線程的線程束來集體原子操作。
[0016] 根據(jù)本發(fā)明的基于GPU的像面特征點(diǎn)中心快速定位算法,根據(jù)特征點(diǎn)中心定位算 法的處理過程,將具有并行性的部分應(yīng)用GPU實(shí)現(xiàn)并行處理,最終實(shí)驗(yàn)結(jié)果證明可以大大 提高算法的處理速度,解決了動態(tài)視覺測量中大量點(diǎn)云的點(diǎn)中心定位耗時巨大的問題。
【專利附圖】
【附圖說明】
[0017] 參考隨附的附圖,本發(fā)明更多的目的、功能和優(yōu)點(diǎn)將通過本發(fā)明實(shí)施方式的如下 描述得以闡明,其中:
[0018] 圖1示意性示出了應(yīng)用本發(fā)明的基于GPU的像面特征點(diǎn)中心快速定位算法的計算 機(jī)系統(tǒng)架構(gòu)框圖。
[0019] 圖2示意性示出了根據(jù)本發(fā)明的基于GPU的像面特征點(diǎn)中心快速定位算法的流程 圖。
[0020] 圖3示意性示出了采用多層次并行策略來實(shí)現(xiàn)對全局存儲器的合并訪問的模型 架構(gòu)。
[0021] 圖4示意性地示出了采用了綁定多個線程的線程束來集體原子操作的方法流程 圖。
【具體實(shí)施方式】
[0022] 通過參考示范性實(shí)施例,本發(fā)明的目的和功能以及用于實(shí)現(xiàn)這些目的和功能的方 法將得以闡明。然而,本發(fā)明并不受限于以下所公開的示范性實(shí)施例;可以通過不同形式來 對其加以實(shí)現(xiàn)。說明書的實(shí)質(zhì)僅僅是幫助相關(guān)領(lǐng)域技術(shù)人員綜合理解本發(fā)明的具體細(xì)節(jié)。
[0023] 在下文中,將參考附圖描述本發(fā)明的實(shí)施例。在附圖中,相同的附圖標(biāo)記代表相同 或類似的部件,或者相同或類似的步驟。
[0024] 圖1示意性示出了應(yīng)用本發(fā)明的基于GPU的像面特征點(diǎn)中心快速定位算法的計算 機(jī)系統(tǒng)架構(gòu)框圖。如圖1所述,根據(jù)本發(fā)明的實(shí)施像面特征點(diǎn)中心快速定位算法的系統(tǒng)1〇〇 包括中央處理器(CPU) 110、圖形處理器(GPU) 120、全局存儲器130和位于GPU120內(nèi)部的共 享存儲器140。
[0025] CPU110用于接收要進(jìn)行特征點(diǎn)中心定位的圖像數(shù)據(jù),并將圖像數(shù)據(jù)通過傳送給全 局存儲器130從而發(fā)送至GPU120進(jìn)行一部分的并行計算處理。CPU110也承擔(dān)其中一部分 的圖像處理工作,如進(jìn)行圖像中的感興趣區(qū)域(R0I)區(qū)域的提取。由GPU120計算處理得到 的特征點(diǎn)中心數(shù)據(jù)會發(fā)送回CPU110進(jìn)行最終的輸出。
[0026] GPU120典型地包括一個或多個執(zhí)行程序指令的編譯器,用于在GPU內(nèi)所包括的一 個或多個處理內(nèi)核上進(jìn)行編譯。每個這類內(nèi)核可以與其他處理內(nèi)核一起并行地執(zhí)行線程, 以及并行地對特定執(zhí)行線程加以執(zhí)行。GPU120內(nèi)的特定內(nèi)核可以耦連到共享存儲器140, 該共享存儲器140在GPU120執(zhí)行線程時可供GPU120對存儲器進(jìn)行訪問操作。每個內(nèi)核還 可以耦連到一個或多個其他內(nèi)核,也可以耦連到共享存儲器空間。利用該配置,GPU120的 多個內(nèi)核可以經(jīng)由共享存儲器空間來共享數(shù)據(jù)。GPU120的內(nèi)核還可以耦連到全局存儲器 130,全局存儲器130可以對所有處理內(nèi)核都是可訪問的。
[0027] 圖2示意性示出了本發(fā)明的基于GPU的像面特征點(diǎn)中心快速定位算法的方法流 程。如圖2所述,根據(jù)本發(fā)明的基于GPU的像面特征點(diǎn)中心快速定位算法的方法200包括 如下步驟:
[0028] 首先進(jìn)行原始圖像的預(yù)處理。圖像預(yù)處理包括高斯低通濾波、最大類間方差法自 適應(yīng)求閾值和圖像二值化。圖像預(yù)處理中的高斯低通濾波、直方圖統(tǒng)計和圖像二值化是典 型的數(shù)據(jù)密集型問題,因此根據(jù)本發(fā)明的方法采用并行的方式處理。最大類間方差統(tǒng)計由 于數(shù)據(jù)之間具依賴性,在GPU上進(jìn)行統(tǒng)計時性能較差,故在CPU端進(jìn)行串行統(tǒng)計。具體地,
[0029] 首先在步驟202中,CPU獲取要進(jìn)行像面特征點(diǎn)中心快速定位的原始圖像;
[0030] 步驟204中,CPU將獲取到的原始圖像傳送至全局存儲器130中進(jìn)行存儲;
[0031] 步驟206中,GPU從全局存儲器130中獲取所傳送的原始圖像,然后在GPU中進(jìn)行 高斯低通濾波的計算(步驟208)。高斯低通濾波是線性平滑濾波,用于消除高斯噪聲,從而 用于圖像處理的減噪過程。具體地,高斯濾波對圖像進(jìn)行加權(quán)平均,利用模板掃描圖像中 的每一個像素,用模板確定的鄰域內(nèi)像素的加權(quán)平均灰度值去替代模板中心像素點(diǎn)的值, 從而去除噪聲。優(yōu)選地,根據(jù)本發(fā)明的一個實(shí)施例,為每個GPU的內(nèi)核線程塊(block)分配 相應(yīng)大小的共享存儲器,以存儲3X3的高斯模板數(shù)據(jù)。圖像的邊界數(shù)據(jù)不進(jìn)行濾波,由于 后期的約束判斷確保目標(biāo)區(qū)域不會出現(xiàn)在圖像的邊界,因此對定位結(jié)果沒有影響。
[0032] 步驟210,在濾波計算后,GPU120再將濾波后的圖像傳送回全局存儲器130。
[0033] 步驟212,在共享存儲器上分配存儲空間。具體地,每個線程塊在共享存儲器上分 配大小為256的數(shù)組,線程塊中的每個線程統(tǒng)計對應(yīng)像素的灰度信息,并將統(tǒng)計結(jié)果臨時 存儲到共享存儲器數(shù)組中,最后再把共享存儲器中的統(tǒng)計結(jié)果應(yīng)用原子操作的方式累加到 全局存儲器中。
[0034] 步驟214,由GPU基于濾波后的圖像進(jìn)行直方圖的統(tǒng)計,并在步驟216將直方圖統(tǒng) 計信息傳回到全局存儲器。
[0035] 步驟218, CPU從全局存儲器獲取GPU進(jìn)行直方圖統(tǒng)計后的信息,并且在步驟220 中由CPU進(jìn)行最大類間方差計算,以確定閾值。根據(jù)本發(fā)明的一個實(shí)施例,用串行的方式統(tǒng) 計最大類間方差,從而確定用來區(qū)分目標(biāo)和背景的閾值,用于之后進(jìn)行的圖像二值化。最大 類間方差計算按圖像的灰度特性,將圖像分成背景和目標(biāo)兩個部分。背景和目標(biāo)之間的類 間方差越大,則說明構(gòu)成圖像的背景和目標(biāo)兩部分之間的差別越大。當(dāng)將部分目標(biāo)錯分為 背景,或?qū)⒉糠直尘板e分為目標(biāo)時,都會導(dǎo)致背景和目標(biāo)之間的差別變小。因此,計算最大 類間方差,從而使得錯分的概率最小,以便確定真正的背景和目標(biāo)。
[0036] 步驟222,將計算得到的閾值傳送回全局存儲器。
[0037] 步驟224,合并訪問全局存儲器130中濾波后的圖像數(shù)據(jù)和存儲的閾值,在GPU中 進(jìn)行圖像的二值化處理。具體的,合并訪問全局存儲器130中濾波后的圖像數(shù)據(jù)和存儲的 閾值,在圖像的像素灰度值大于上述計算得到的閾值時,將其賦值為255,當(dāng)小于閾值時賦 值為〇,從而得到二值化圖像。
[0038] 步驟226,將二值化后的圖像傳送至全局存儲器130,從而完成圖像的預(yù)處理過 程。
[0039] 根據(jù)本發(fā)明的方法,在圖像的預(yù)處理之后進(jìn)行區(qū)域約束判斷的并行處理步驟。由 于精確的特征點(diǎn)中心定位對后期的匹配、相機(jī)定向和束調(diào)整至關(guān)重要,因此區(qū)域約束判斷 排除了外界帶來的干擾,從而可以確保最后提取的區(qū)域是有效的目標(biāo)區(qū)域。根據(jù)本發(fā)明,采 用了一系列多個約束判斷的約束條件,每個約束條件之間是嚴(yán)格的串行處理關(guān)系。但每個 區(qū)域之間的約束判斷是無關(guān)的,因此不同區(qū)域的約束判斷可以同時并行進(jìn)行。
[0040] 在步驟228,將二值化的圖像數(shù)據(jù)傳送給CPU,在步驟230由CPU進(jìn)行感興趣區(qū)域 (Region of Interest, R0I)的提取。R0I提取優(yōu)選可以采用二值化連通域標(biāo)記算法。
[0041] 在步驟232,將R0I區(qū)域信息傳送至全局存儲器。
[0042] 在步驟234,由GPU120基于全局存儲器的R0I區(qū)域信息進(jìn)行區(qū)域約束判斷。具體 地,GPU中的每個線程合并訪問全局存儲器中對應(yīng)的區(qū)域信息,判斷是否滿足約束條件,將 不滿足約束條件的區(qū)域信息賦〇,而滿足約束條件的區(qū)域不做任何處理。約束條件可以包 括如下條件:區(qū)域邊緣周長約束,區(qū)域?qū)捈s束、區(qū)域長約束、擴(kuò)展兩像素是否越界約束、區(qū)域 面積約束、長寬比約束、二值化后區(qū)域擴(kuò)展一像素是否有其他點(diǎn)引入約束、區(qū)域灰度比約束 等。
[0043] 接著,為每個線程塊分配大小為32的共享存儲器,采用線程束集體原子操作的方 法篩選經(jīng)過區(qū)域約束判斷之后的區(qū)域信息,篩選出非0的區(qū)域,輸出這些非0的區(qū)域以得到 有效的目標(biāo)區(qū)域。
[0044] 在步驟236,將得到的有效目標(biāo)區(qū)域傳送至全局存儲器。
[0045] 在步驟238, GPU根據(jù)得到的有效目標(biāo)區(qū)域進(jìn)行區(qū)域的點(diǎn)中心計算。
[0046] 根據(jù)目標(biāo)區(qū)域計算得到區(qū)域點(diǎn)中心坐標(biāo)是典型的計算密集型問題。由于區(qū)域點(diǎn)中 心計算中包含循環(huán)嵌套,這將導(dǎo)致在點(diǎn)數(shù)增多時消耗的時間急劇增加,如10000個區(qū)域時 串行計算區(qū)域點(diǎn)中心的耗時已經(jīng)占整個算法的50%以上。但是,由于每個目標(biāo)區(qū)域之間沒 有相關(guān)性,可以用并行的方法同時計算每個區(qū)域的點(diǎn)中心。具體地,點(diǎn)中心坐標(biāo)計算方法如 下:
[0047] 首先,合并訪問全局存儲器中的R0I區(qū)域信息和濾波后的圖像數(shù)據(jù)。
[0048] 其次,執(zhí)行配置參數(shù),每個線程塊分配1024個線程,每個線程計算相應(yīng)的R0I區(qū)域 對應(yīng)的點(diǎn)中心坐標(biāo)。優(yōu)選地,點(diǎn)中心的數(shù)據(jù)存儲格式選用CUDA內(nèi)部的double4類型進(jìn)行向 量化操作。
[0049] 在計算出區(qū)域點(diǎn)中心坐標(biāo)后,在步驟240,將計算得到的區(qū)域點(diǎn)中心坐標(biāo)傳回到全 局存儲器,再將點(diǎn)中心數(shù)據(jù)傳回至CPU110 (步驟242),進(jìn)行輸出,本發(fā)明的基于GPU的像面 特征點(diǎn)中心快速定位的方法結(jié)束。
[0050] 根據(jù)本發(fā)明的一個實(shí)施例,優(yōu)選采用變權(quán)重灰度質(zhì)心法來提取特征點(diǎn)中心坐標(biāo)。 特征點(diǎn)坐標(biāo)是整個視覺測量的數(shù)據(jù)來源,定位精度直接關(guān)系到整個視覺測量所能達(dá)到的精 度。視覺測量中對回光反射點(diǎn)坐標(biāo)提取算法一般分為兩類,一類是求取特征點(diǎn)邊緣,然后 擬合橢圓方程,從而求點(diǎn)坐標(biāo);另一類是基于特征點(diǎn)的灰度信息,通過質(zhì)心法求得點(diǎn)中心坐 標(biāo)。本發(fā)明的實(shí)驗(yàn)結(jié)果表明,在視覺測量中采用基于灰度的質(zhì)心法求取精度一般要好于基 于邊緣的擬合方法。
[0051] 傳統(tǒng)的灰度質(zhì)心法算法如下
【權(quán)利要求】
1. 一種基于GPU的像面特征點(diǎn)中心快速定位方法,所述方法包括如下步驟: a) CPU獲取要進(jìn)行像面特征點(diǎn)中心快速定位的原始圖像,并傳送至全局存儲器中; b) GPU從所述全局存儲器中獲取所傳送的原始圖像,對其進(jìn)行高斯低通濾波計算,并送 回所述全局存儲器; c) 在共享存儲器上分配存儲空間; d) 由GPU基于濾波后的圖像進(jìn)行直方圖的統(tǒng)計,并將直方圖統(tǒng)計信息傳回到所述全局 存儲器; e) CPU從所述全局存儲器獲取直方圖統(tǒng)計后的信息,并且進(jìn)行最大類間方差計算,以確 定閾值,將計算得到的閾值傳送回全局存儲器; f) 合并訪問全局存儲器中濾波后的圖像數(shù)據(jù)和存儲的閾值,GPU進(jìn)行圖像的二值化處 理,并傳送至全局存儲器和CPU ; g) CPU進(jìn)行感興趣區(qū)域的提取,提取后傳送至全局存儲器; h) GPU基于全局存儲器的感興趣區(qū)域信息進(jìn)行區(qū)域約束判斷,將得到的有效目標(biāo)區(qū)域 傳送至全局存儲器;以及 i) 根據(jù)得到的有效目標(biāo)區(qū)域進(jìn)行區(qū)域的點(diǎn)中心計算,將結(jié)果傳回到所述全局存儲器和 CPU。
2. 如權(quán)利要求1所述的方法,其中在步驟b中為每個線程塊分配相應(yīng)大小的共享存儲 器,以存儲3X3的高斯模板數(shù)據(jù)。
3. 如權(quán)利要求1所述的方法,其中在步驟c中,每個線程塊在共享存儲器上分配大小 為256的數(shù)組,線程塊中的每個線程統(tǒng)計對應(yīng)像素的灰度信息,并將統(tǒng)計結(jié)果臨時存儲到 共享內(nèi)存數(shù)組中,最后再把共享存儲器中的統(tǒng)計結(jié)果應(yīng)用原子操作的方式累加到全局存儲 器中。
4. 如權(quán)利要求1所述的方法,其中在步驟e中,用串行的方式統(tǒng)計最大類間方差。
5. 如權(quán)利要求1所述的方法,其中在步驟f中,合并訪問全局存儲器中濾波后的圖像數(shù) 據(jù),并訪問共享存儲器中存儲的閾值,在圖像的像素灰度值大于上述計算得到的閾值時,將 其賦值為255,當(dāng)小于閾值時賦值為0。
6. 如權(quán)利要求1所述的方法,其中在步驟h中,GPU中的每個線程合并訪問全局存儲器 中對應(yīng)的區(qū)域信息,判斷是否滿足約束條件,將不滿足約束條件的區(qū)域信息賦0,而滿足約 束條件的區(qū)域不做任何處理。
7. 如權(quán)利要求6所述的方法,其中所述約束條件包括如下條件:區(qū)域邊緣周長約束,區(qū) 域?qū)捈s束、區(qū)域長約束、擴(kuò)展兩像素是否越界約束、區(qū)域面積約束、長寬比約束、二值化后區(qū) 域擴(kuò)展一像素是否有其他點(diǎn)引入約束、區(qū)域灰度比約束。
8. 如權(quán)利要求1所述的方法,其中在步驟i中,點(diǎn)中心的坐標(biāo)計算方法包括合并訪問全 局存儲器中的ROI區(qū)域信息和濾波后的圖像數(shù)據(jù),以及執(zhí)行配置參數(shù),為每個線程塊分配 1024個線程,每個線程計算相應(yīng)的ROI區(qū)域?qū)?yīng)的點(diǎn)中心坐標(biāo)。
9. 如權(quán)利要求1所述的方法,其中采用變權(quán)重灰度質(zhì)心法來提取特征點(diǎn)中心坐標(biāo)。
10. 如權(quán)利要求1所述的方法,其中利用綁定多個線程的線程束來集體原子操作。
【文檔編號】G06F9/38GK104123119SQ201410319232
【公開日】2014年10月29日 申請日期:2014年7月7日 優(yōu)先權(quán)日:2014年7月7日
【發(fā)明者】董明利, 許曉臣, 王君, 燕必希, 孫鵬 申請人:北京信息科技大學(xué)