本發(fā)明涉及一種置信度計算方法,特別是涉及一種基于狄利克雷特分布的置信度計算方法。
背景技術(shù):
傳統(tǒng)的回歸置信度計算方法,不能處理高維和線性不可分的情況下的置信度計算問題。隨著特征的數(shù)量增加的,傳統(tǒng)的置信度計算方法難以針對每個特征概率進行缺失補全、偏差修正等處理,容易造成計算結(jié)果的偏差。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于狄利克雷特分布的置信度計算方法,其能夠解決高維、線性不可分情況下的分界面預(yù)測問題,優(yōu)化缺失、強關(guān)聯(lián)、互斥情況下的特征概率。
本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:一種基于狄利克雷特分布的置信度計算方法,其包括以下步驟:
步驟一,隱含狄利克雷特分布參數(shù)估計訓(xùn)練;
步驟二,輸入特征數(shù)據(jù)、特征處理;
步驟三,參數(shù)和權(quán)重歸一化、置信度計算;
步驟四,利用置信度計算和排序。
優(yōu)選地,所述步驟一包括以下步驟:
步驟十,輸入訓(xùn)練樣本數(shù)據(jù);
步驟十一,隱含狄利克雷特分布參數(shù)估計訓(xùn)練;
步驟十二,輸出模型的參數(shù)估計到基于狄利克雷特分布的置信度計算的模型參數(shù)中。
優(yōu)選地,所述步驟二包括以下步驟:
步驟二十,輸入預(yù)測數(shù)據(jù);
步驟二十一,根據(jù)特征概率的特性,做補全、修正處理;
步驟二十二,輸出處理后的概率到預(yù)測排序中,進行置信度計算。
優(yōu)選地,所述步驟三包括以下步驟:
步驟三十,輸入預(yù)測數(shù)據(jù)的特征概率;
步驟三十一,置信度計算;
步驟三十二,置信度歸一化;
步驟三十三,根據(jù)歸一化后的置信度預(yù)測和排序。
優(yōu)選地,所述步驟四包括以下步驟:
步驟四十,類別輸出模塊,用于輸出所分析得到對象的類別;
步驟四十一,排序輸出模塊,用于輸出作案率較高的對象排序。
本發(fā)明的積極進步效果在于:本發(fā)明能夠采用隱含規(guī)律的置信度計算,克服了回歸等置信度計算方法在高維、線性不可分情況下的分界面預(yù)測問題;對不同類型的特征采取不同的處理方法,其中對缺失特征進行先驗概率補全,對強關(guān)聯(lián)、互斥特征進行概率縮放,避免了特征缺失、強關(guān)聯(lián)、互斥帶來的概率干擾,減少預(yù)測、排序偏差。
附圖說明
圖1為本發(fā)明的流程圖。
具體實施方式
下面結(jié)合附圖給出本發(fā)明較佳實施例,以詳細說明本發(fā)明的技術(shù)方案。
如圖1所示,本發(fā)明基于狄利克雷特分布的置信度計算方法包括以下步驟:
步驟一,隱含狄利克雷特分布參數(shù)估計訓(xùn)練,用于獲取樣本數(shù)據(jù)并進行隱含狄利克雷特分布訓(xùn)練,得到模型的參數(shù)估計;
步驟二,輸入特征數(shù)據(jù)、特征處理,用于計算預(yù)測數(shù)據(jù)概率,并針對特征概率進行修正;
步驟三,參數(shù)和權(quán)重歸一化、置信度計算,用于對預(yù)測數(shù)據(jù)進行復(fù)雜的算法運算計算置信度、做歸一化處理;
步驟四,利用置信度計算和排序。
所述步驟一包括以下步驟:
步驟十,輸入訓(xùn)練樣本數(shù)據(jù);
步驟十一,隱含狄利克雷特分布參數(shù)估計訓(xùn)練;
步驟十二,輸出模型的參數(shù)估計到基于狄利克雷特分布的置信度計算的模型參數(shù)中。
所述步驟二包括以下步驟:
步驟二十,輸入預(yù)測數(shù)據(jù);
步驟二十一,根據(jù)特征概率的特性,做補全、修正處理;
步驟二十二,輸出處理后的概率到預(yù)測排序中,進行置信度計算。
所述步驟三包括以下步驟:
步驟三十,輸入預(yù)測數(shù)據(jù)的特征概率;
步驟三十一,置信度計算;
步驟三十二,置信度歸一化;
步驟三十三,根據(jù)歸一化后的置信度預(yù)測和排序。
所述步驟四包括以下步驟:
步驟四十,類別輸出模塊,用于輸出所分析得到對象的類別;
步驟四十一,排序輸出模塊,用于輸出作案率較高的對象排序。
以上所述的具體實施例,對本發(fā)明的解決的技術(shù)問題、技術(shù)方案和有益效果進行了進一步詳細說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。