亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

圖片的源相機(jī)型號(hào)的識(shí)別方法和裝置的制造方法_3

文檔序號(hào):9727793閱讀:來(lái)源:國(guó)知局
實(shí)施例可以包括訓(xùn)練步驟和分類(預(yù)測(cè))步驟,下面分別進(jìn)行詳細(xì)描述:
[0048]訓(xùn)練步驟的具體過(guò)程如下:
[0049]步驟S1,進(jìn)行圖像收集。為了評(píng)估本發(fā)明實(shí)施例提出的方案,本發(fā)明實(shí)施例在德累斯頓圖像集合上進(jìn)行了大量的實(shí)驗(yàn)。該圖像數(shù)據(jù)庫(kù)是專門為基于數(shù)字取證技術(shù)的相機(jī)進(jìn)行發(fā)展和基準(zhǔn)測(cè)試構(gòu)建的。為了模擬不均衡訓(xùn)練數(shù)據(jù)集的真實(shí)場(chǎng)景,本發(fā)明實(shí)施例挑選了 7個(gè)不同圖像集大小的相機(jī)模型。被選中的相機(jī)模型的具體細(xì)節(jié)包括相機(jī)型號(hào)、相機(jī)別名、訓(xùn)練規(guī)模、測(cè)試規(guī)模等方面。
[0050]步驟S2,對(duì)收集到的圖像進(jìn)行特征提取,主要是在內(nèi)在硬件構(gòu)件或軟件相關(guān)紋路上從圖像中提取特征。在實(shí)驗(yàn)中,本發(fā)明實(shí)施例提取了 Kharraz i等人提出的34個(gè)特性來(lái)使這些圖像更具有特點(diǎn)。其中這34個(gè)特性分別包括:平均像素值(3個(gè)特性),紅綠藍(lán)相關(guān)對(duì)(3個(gè)特性),鄰居分布質(zhì)心(3個(gè)特性),紅綠藍(lán)對(duì)能量比例(3個(gè)特性),小波域統(tǒng)計(jì)數(shù)據(jù)(9個(gè)特性)和圖像質(zhì)量指標(biāo)(13個(gè)特性)。
[0051 ]步驟S3,將提取出的特征構(gòu)成特征矢量集合。
[0052]步驟S4,構(gòu)建并訓(xùn)練支持向量機(jī)集成分類器,其中支持向量機(jī)的構(gòu)建過(guò)程如下所述:
[0053]由于存在多個(gè)相機(jī)模型,源相機(jī)型號(hào)的識(shí)別可以被看作多類別分類問(wèn)題。類之間的邊界可以重疊,這使得分類復(fù)雜得多。此外,不均衡訓(xùn)練數(shù)據(jù)集可能會(huì)增加多層次分類的難度。在這種情況下,本發(fā)明實(shí)施例將原來(lái)的多層次分類問(wèn)題轉(zhuǎn)化成二元分類問(wèn)題。本發(fā)明實(shí)施例利用一對(duì)一的方法去分解多層次分類問(wèn)題,為k類別分類任務(wù)構(gòu)造k(k_l)/2 二進(jìn)制分類器。一個(gè)二進(jìn)制分類器用來(lái)訓(xùn)練每一個(gè)可能的類對(duì)。分解完成后,不均衡訓(xùn)練數(shù)據(jù)集的多層次分類問(wèn)題被轉(zhuǎn)化為不均衡訓(xùn)練數(shù)據(jù)集的二元分類問(wèn)題。
[0054]首先,通過(guò)SMOTE算法對(duì)少數(shù)類進(jìn)行過(guò)采樣。在SMOTE算法中,隨機(jī)合成的樣本點(diǎn)一定在兩個(gè)已知的少數(shù)類樣本的連線線段上。
[0055]然后,在過(guò)采樣的少數(shù)類和多數(shù)類上用AdaBoost算法去構(gòu)建支持向量機(jī)集成分類器。AdaBoost算法在訓(xùn)練數(shù)據(jù)集例子上通過(guò)自適應(yīng)調(diào)整權(quán)重創(chuàng)建一組迭代的基分類器。在每次的迭代過(guò)程中,當(dāng)前分類器的錯(cuò)誤分類實(shí)例都被給予更高的權(quán)重,反之亦然。
[0056]其中,SM0TE算法的提出是由于平時(shí)很多分類問(wèn)題都會(huì)面臨樣本不均衡的問(wèn)題,而很多算法在這種情況下分類效果都不夠理想。針對(duì)不均衡問(wèn)題,一般有采樣和代價(jià)敏感學(xué)習(xí)兩種策略,采樣的話又分為過(guò)采樣和欠采樣。其中,SM0TE算法是過(guò)采樣中比較常用的一種算法。SM0TE算法的思想是合成新的少數(shù)類樣本,合成的策略是對(duì)每個(gè)少數(shù)類樣本a,從它的最近鄰中隨機(jī)選一個(gè)樣本b,然后在a、b之間的連線上隨機(jī)選一點(diǎn)作為新合成的少數(shù)類樣本。
[0057]Adaboost算法是一種迭代算法,其核心思想是針對(duì)同一個(gè)訓(xùn)練集訓(xùn)練不同的分類器(弱分類器),然后把這些弱分類器集合起來(lái),構(gòu)成一個(gè)更強(qiáng)的最終分類器(強(qiáng)分類器)。其算法本身是通過(guò)改變數(shù)據(jù)分布來(lái)實(shí)現(xiàn)的,它根據(jù)每次訓(xùn)練集之中每個(gè)樣本的分類是否正確,以及上次的總體分類的準(zhǔn)確率,來(lái)確定每個(gè)樣本的權(quán)值。將修改過(guò)權(quán)值的新數(shù)據(jù)集送給下層分類器進(jìn)行訓(xùn)練,最后將每次訓(xùn)練得到的分類器最后融合起來(lái),作為最后的決策分類器。使用AdaBoost分類器可以排除一些不必要的訓(xùn)練數(shù)據(jù)特征,并將重點(diǎn)放在關(guān)鍵的訓(xùn)練數(shù)據(jù)上面。
[0058]分類(預(yù)測(cè))步驟,即本發(fā)明的實(shí)際使用步驟,具體過(guò)程如下:
[0059]步驟S5,進(jìn)行圖像的輸入。
[0060]步驟S6,對(duì)輸入的圖像進(jìn)行特征提取,與訓(xùn)練步驟類似,主要也是在內(nèi)在硬件構(gòu)件或軟件相關(guān)紋路上從圖像中提取特征。在實(shí)驗(yàn)中,提取Kharrazi等人提出的34個(gè)特性來(lái)使這些圖像更具有特點(diǎn)。其中這34個(gè)特性分別包括:平均像素值(3個(gè)特性),紅綠藍(lán)相關(guān)對(duì)(3個(gè)特性),鄰居分布質(zhì)心(3個(gè)特性),紅綠藍(lán)對(duì)能量比例(3個(gè)特性),小波域統(tǒng)計(jì)數(shù)據(jù)(9個(gè)特性)和圖像質(zhì)量指標(biāo)(13個(gè)特性)。
[0061]步驟S7,把這些特征輸入到訓(xùn)練支持向量機(jī)集成分類器中,進(jìn)而得到聚合的支持向量機(jī)預(yù)測(cè)結(jié)果。其中,支持向量機(jī)的輸出結(jié)果是通過(guò)多數(shù)投票的方法被聚合的。
[0062 ]步驟S8,完成圖像的識(shí)別。
[0063]本發(fā)明實(shí)施例對(duì)原方法、EnSVM方法、AdaBoost算法、SMOTE算法和本文中提出的圖片的源相機(jī)型號(hào)的識(shí)別方法在識(shí)別的準(zhǔn)確度和特征的測(cè)量方面進(jìn)行了對(duì)比,通過(guò)對(duì)比發(fā)現(xiàn)本文中提出的方案是最優(yōu)的,原因是在此方案中使用的AdaBoost算法與EnSVM方法中采用的裝袋算法相比能更有效的處理不均衡訓(xùn)練數(shù)據(jù)集。數(shù)據(jù)還表明SM0TE和AdaBoost算法比原方法能取得更好的性能。這表明這兩種算法有助于本發(fā)明提出的圖片的源相機(jī)型號(hào)的識(shí)別方法的整體性能。同時(shí),本發(fā)明提出的圖片的源相機(jī)型號(hào)的識(shí)別方法,即支持向量機(jī)集成方法,能有效地緩解不均衡訓(xùn)練數(shù)據(jù)集的影響,主要表現(xiàn)在以下三個(gè)方面:第一,SM0TE算法上的過(guò)采樣減輕了不均衡的程度。第二,在AdaBoost算法每次的迭代過(guò)程中,少數(shù)類樣本往往被給予更高的權(quán)重,因此它們更可能被誤分類。通過(guò)這種方式,不均衡訓(xùn)練數(shù)據(jù)集的影響進(jìn)一步得到緩解。第三,支持向量機(jī)集成分類器可以克服建立在不均衡訓(xùn)練數(shù)據(jù)集上單個(gè)支持向量機(jī)的不穩(wěn)定性并且實(shí)現(xiàn)更好的性能。
[0064]本發(fā)明對(duì)比現(xiàn)有技術(shù),通過(guò)結(jié)合SM0TE和AdaBoost算法,將原來(lái)的多層次分類問(wèn)題轉(zhuǎn)化成二元分類問(wèn)題,利用一對(duì)一的方法去分解多層次分類問(wèn)題,為k類別分類任務(wù)構(gòu)造k(k-l)/2 二進(jìn)制分類器,二進(jìn)制分類器用來(lái)訓(xùn)練每一個(gè)可能的類對(duì)。分解完成后,不均衡訓(xùn)練數(shù)據(jù)集的多層次分類問(wèn)題被轉(zhuǎn)化為不均衡訓(xùn)練數(shù)據(jù)集的二元分類問(wèn)題。本發(fā)明能夠有效解決不均衡訓(xùn)練數(shù)據(jù)集問(wèn)題,提高圖片的源相機(jī)型號(hào)的識(shí)別的準(zhǔn)確率。
[0065]根據(jù)本發(fā)明實(shí)施例,還提供了一種圖片的源相機(jī)型號(hào)的識(shí)別的裝置實(shí)施例,需要說(shuō)明的是,該圖片的源相機(jī)型號(hào)的識(shí)別裝置可以用于執(zhí)行本發(fā)明實(shí)施例中的圖片的源相機(jī)型號(hào)的識(shí)別方法,本發(fā)明實(shí)施例中的圖片的源相機(jī)型號(hào)的識(shí)別方法可以在該圖片的源相機(jī)型號(hào)的識(shí)別裝置中執(zhí)行。
[0066]圖3是根據(jù)本發(fā)明實(shí)施例的圖片的源相機(jī)型號(hào)的識(shí)別裝置的示意圖,如圖3所示,該裝置可以包括:
[0067]過(guò)采樣模塊22,用于對(duì)圖片樣本集中的第一類圖片樣本進(jìn)行過(guò)采樣處理,其中,第一類圖片樣本的數(shù)量遠(yuǎn)小于圖片樣本集中其他類圖片樣本的數(shù)量,圖片樣本集中的圖片樣本與源相機(jī)型號(hào)存在對(duì)應(yīng)關(guān)系;提取模塊24,用于提取經(jīng)過(guò)過(guò)采樣處理后的圖片樣本集中每個(gè)圖片樣本的特征;構(gòu)建模塊26,用于使用每個(gè)圖片樣本的特征與每個(gè)圖片樣本對(duì)應(yīng)的源相機(jī)型號(hào)構(gòu)建支持向量機(jī)分類器;以及識(shí)別模塊28,用于利用支持向量機(jī)分類器識(shí)別待識(shí)別圖片的源相機(jī)型號(hào)。
[0068]需要說(shuō)明的是,該實(shí)施例中的過(guò)采樣模塊22可以用于執(zhí)行本申請(qǐng)實(shí)施例中的步驟S102,該實(shí)施例中的提取模塊24可以用于執(zhí)行本申請(qǐng)實(shí)施例中的步驟S104,該實(shí)施例中的構(gòu)建模塊26可以用于執(zhí)行本申請(qǐng)實(shí)施例中的步驟S106,該實(shí)施例中的識(shí)別模塊28可以用于執(zhí)行本申請(qǐng)實(shí)施例中的步驟S108。上述模塊與對(duì)應(yīng)的步驟所實(shí)現(xiàn)的示例和應(yīng)用場(chǎng)景相同,但不限于上述實(shí)施例所公開的內(nèi)容。
[0069]可選地,過(guò)采樣模塊22可以包括:第一選取模塊,用于從第一類圖片樣本中選取第一圖片樣本和第二圖片樣本,其中,第二圖片樣本是第一類圖片樣本中距離第一圖片樣本最近的圖片樣本;以及第二選取模塊,用于在第一圖片樣本和第二圖片樣本之間的連線上選取一點(diǎn)作為新合成的第一類圖片樣本中的圖片樣本。
[0070]可選地,提取模塊24可以包括:第一子提取模塊,用于在硬件構(gòu)件或者軟件紋路上從每個(gè)圖片樣本的圖像中提取特征,其中,特征至少包括以下任意一種特征:平均像素值、紅綠藍(lán)相關(guān)對(duì)、鄰居分布質(zhì)心、紅綠藍(lán)對(duì)能量比例、小波域統(tǒng)計(jì)數(shù)據(jù)以及圖像質(zhì)量指標(biāo)。[0071 ]可選地,構(gòu)建模塊26可以包括:構(gòu)造模塊,用于將每個(gè)圖片樣本的特征構(gòu)造成特征矢量集合,其中,特征矢量集合中包括至少一對(duì)類別樣本的特征向量,類別樣本為已知源相機(jī)型號(hào)的圖片樣本;訓(xùn)練模塊,用于使用至少一對(duì)類別樣本的特征向量訓(xùn)練二分類支持向量機(jī);以及第一子構(gòu)建模塊,用于根據(jù)訓(xùn)練后的二分類支持向量機(jī)構(gòu)建支持向量機(jī)分類器。
[0072]可選地,識(shí)別模塊2
當(dāng)前第3頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1