亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于生理信息熵的人體體成分預(yù)測(cè)方法

文檔序號(hào):9417667閱讀:696來(lái)源:國(guó)知局
基于生理信息熵的人體體成分預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物信息學(xué)領(lǐng)域,尤其涉及一種基于生理信息熵的人體體成分預(yù)測(cè)方 法。
【背景技術(shù)】
[0002] 人體成分的變化在一定程度上反映了身體健康狀況的變化,人體成分的準(zhǔn)確預(yù)測(cè) 對(duì)人體營(yíng)養(yǎng)狀況的調(diào)節(jié)及疾病的預(yù)防有著重要意義。影響人體成分的參數(shù)眾多,目前主要 包括生理電阻抗參數(shù)和普通生理特征參數(shù)兩類(lèi)。這些生理參數(shù)之間還存在著高度非線性、 嚴(yán)重關(guān)聯(lián)的特點(diǎn),現(xiàn)有的人體體成分模型難以滿足這一需要。
[0003] 隨著醫(yī)療測(cè)量技術(shù)的不斷進(jìn)步,可測(cè)得的生理特征大規(guī)模發(fā)展,并呈現(xiàn)出樣本少、 維數(shù)高等特點(diǎn),這給傳統(tǒng)生理數(shù)據(jù)的處理及分析帶來(lái)了巨大的挑戰(zhàn),其中冗余特征的存在 間接加重了不利影響,導(dǎo)致人體體成分預(yù)測(cè)存在不足。
[0004] 鑒于上述問(wèn)題,有必要提出一種新的人體體成分預(yù)測(cè)方法,以解決上述問(wèn)題。

【發(fā)明內(nèi)容】

[0005] 針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明解決的技術(shù)問(wèn)題是提供一種基于生理信息熵的人體 體成分預(yù)測(cè)方法,該方法可以有效地減少特征參數(shù)間的冗余性,簡(jiǎn)化人體成分預(yù)測(cè)的擬合 模型;解決參數(shù)眾多、參數(shù)耦合的建模難題;建立的人體體成分預(yù)測(cè)模型可提高人體體成 分預(yù)測(cè)精度,為人體體成分研究和臨床應(yīng)用提供更為有效的檢測(cè)手段。
[0006] 為解決上述技術(shù)問(wèn)題,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0007] -種基于生理信息熵的人體體成分預(yù)測(cè)方法,包括如下步驟:
[0008] Sl :收集數(shù)據(jù)并構(gòu)造生理信息樣本數(shù)據(jù)集T = (0, F,C),其中F =出,f2,…,、 C = Ic1, c2,…,ck}和0 = Io1, 〇2,…,on}分別表示原始特征、類(lèi)別和數(shù)據(jù)樣本集;
[0009] S2 :利用平均直方圖方法估計(jì)原始特征集F中的各個(gè)特征f的概率密度分布、信息 熵和互信息;
[0010] S3 :從原始特征集F中選出初始特征子集S ;
[0011] S4 :計(jì)算初始特征子集S的評(píng)價(jià)函數(shù)J(f)并記錄初始特征子集的數(shù)目,采用雙向 搜索的搜索策略對(duì)原始特征集進(jìn)行搜索,計(jì)算J(f),添加或刪除特征;
[0012] S5 :設(shè)定評(píng)價(jià)函數(shù)值J(f)達(dá)到最高為終止條件進(jìn)行判斷,若條件滿足,則選擇算 法結(jié)束,返回初始特征子集S作為最終結(jié)果;否則搜索過(guò)程繼續(xù)循環(huán),生成新的候選子集, 返回步驟S4,直到終止條件滿足為止;
[0013] S6 :構(gòu)造預(yù)測(cè)人體體成分所需的擬合模型;
[0014] S7 :對(duì)擬合模型進(jìn)行求解。
[0015] 進(jìn)一步地,八段阻抗值,性別,年齡,身高,體重,種族為第一特征;第一特征的平 方、倒數(shù)及乘積等組合為第二特征;原始特征集F由第一特征和第二特征共同組成。 υ?Ν 丄丄λ ·/·?·? 厶/ υ X
[0016] 進(jìn)一步地,特征f的概率密度分布函數(shù)為
m和h取經(jīng)驗(yàn) 公式:m = 67. 412η °·2376、h = 3. 73 σ η 1/3。
[0017] 進(jìn)一步地,信息熵計(jì)算公式為:
[0018] 進(jìn)一步地,互信息計(jì)算公式為:
[0019] 進(jìn)一步地,評(píng)價(jià)函數(shù)
[0020] 進(jìn)一步地,新的候選子集的生成方法是將所有生理特征的生理信息熵計(jì)算出,并 將其按降序排列,每次選擇新的特征子集的時(shí)候按照信息熵的多少進(jìn)行選擇。
[0021] 進(jìn)一步地,擬合模型為
[0022]
,式中,B1-B11 為 回歸系數(shù),ε為誤差。
[0023] 進(jìn)一步地,所述擬合模型求解步驟包括:
[0024] S71 :假設(shè)評(píng)估事件有m個(gè)對(duì)象,η個(gè)參數(shù),Xlj為第i個(gè)對(duì)象下的第j個(gè)指 標(biāo),則m行η列的決策矩陣Y = IxuUiI據(jù)公式
和公式
計(jì)算確定;
[0025] S72 :消除對(duì)象的不同指標(biāo)具有的不同量綱單位,形成統(tǒng)一矩陣
[0026] S73 :計(jì)算熵值
> 公式中A為第j個(gè)評(píng)估指標(biāo)所對(duì)應(yīng)熵值;如 果Y' lj= 0,那么e j值在[0, 1];
[0027] S74 :計(jì)算權(quán)值
> 公式中Wj表示第j個(gè)指標(biāo)的權(quán)值,η表示指標(biāo)個(gè)數(shù)。
[0028] 本發(fā)明的有益效果是:相較于現(xiàn)有技術(shù),本發(fā)明基于生理信息熵的人體體成分預(yù) 測(cè)方法可有效地減少特征參數(shù)間的冗余性,簡(jiǎn)化人體成分預(yù)測(cè)的擬合模型;解決參數(shù)眾多、 參數(shù)耦合的建模難題;建立的人體體成分預(yù)測(cè)模型可提高人體體成分預(yù)測(cè)精度,為人體體 成分研究和臨床應(yīng)用提供更為有效的檢測(cè)手段。
【附圖說(shuō)明】
[0029] 圖1為本發(fā)明基于生理信息熵的人體體成分預(yù)測(cè)方法的流程圖。
[0030] 圖2為擬合模型求解步驟流程圖。
【具體實(shí)施方式】
[0031] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對(duì) 本發(fā)明進(jìn)行詳細(xì)描述。
[0032] 在詳細(xì)說(shuō)明基于生理信息熵的人體體成分預(yù)測(cè)方法之前,先介紹本方法所需要參 數(shù)的收集以及相關(guān)計(jì)算公式。
[0033] 首先,構(gòu)造人體生理參數(shù)原始特征集。利用八段人體阻抗測(cè)量?jī)x測(cè)得八段阻抗值 及人體的普通生理特征參數(shù),并選定八段阻抗值,性別,年齡,身高,體重,種族作為第一特 征。然后,由第一特征通過(guò)代數(shù)變換產(chǎn)生第二特征,即將第一特征的平方、倒數(shù)及乘積等組 合作為第二特征。原始特征由第一特征和第二特征共同組成,即原始特征集F由八段阻抗 值Ri~R 8,阻抗值的組合f 1/%,R1Rj (1彡i彡8, 1彡j彡8),性別S,年齡A,身高H,體重 W,種族Z組成。用F = {fi,f2,…,fm}表示原始特征集,用S = (S1, S2,…,S1J表示初始特 征集。
[0034] 由信息熵的定義可知,隨機(jī)變量的概率分布必須是預(yù)先可知的。然而現(xiàn)實(shí)應(yīng)用中, 生理參數(shù)的真實(shí)概率分布一般是未知的。因此,計(jì)算熵之前,必須先近似估計(jì)生理參數(shù)的概 率密度分布。本發(fā)明采用平均直方圖的方法進(jìn)行生理信息熵的概率估計(jì)。
[0035] 平均直方圖法是將直方圖法中每個(gè)區(qū)間再細(xì)分,將原區(qū)間的粗網(wǎng)格再劃分為細(xì)網(wǎng) 格。通過(guò)計(jì)算每個(gè)細(xì)網(wǎng)格附近網(wǎng)格的加權(quán)平均得到。
[0036] 對(duì)于給定樣本集T的η個(gè)特征值,…fn,將f劃分為h寬度的粗網(wǎng)格,每個(gè)粗網(wǎng)格 又劃分為m個(gè)細(xì)網(wǎng)格,V k表示落在第k個(gè)細(xì)網(wǎng)格的樣本個(gè)數(shù)。概率密度函數(shù)可以估計(jì)為:
[0037] (!)
[0038] 式中,WniQ)代表權(quán)重函數(shù),即對(duì)當(dāng)前網(wǎng)格和它左右各m-Ι個(gè)網(wǎng)格的樣本總數(shù)求加 權(quán)。且當(dāng)前網(wǎng)格的權(quán)重為1,向左右兩側(cè)逐漸減小,上式可以寫(xiě)為:
[0039] (2)
[0040] m 和 h 取經(jīng)驗(yàn)公式:m = 67. 412η?!?376、h = 3. 73 σ η 1/3。
[0041] 假定一個(gè)生理參數(shù)R1, ρ(Χ)表示生理參數(shù)R1取值為X的概率,那么它的不確定性 程度可以用生理信息熵H(R 1)表示,其中:
[0042] H(R1)=-工 xp (X) log ρ (X) dx (3)
[0043] 由上述公式(3)可知,生理信息熵H (R1)只與生理參數(shù)R1的概率分布有關(guān),而與其 具體取值無(wú)關(guān)。這說(shuō)了明信息熵有效地避免了噪聲數(shù)據(jù)的干擾。
[0044] 用互信息衡量?jī)蓚€(gè)生理參數(shù)間相互依賴(lài)強(qiáng)弱程度,互信息表示兩個(gè)生理參數(shù)間共 同擁有信息的含量。假定兩個(gè)生理參數(shù)X和Y,若它們的邊緣概率分布分別為P (X)和P (y), 則它們之間的互信息I (X ;Y)定義為:
[0045]
(4):
[0046] 與互信息描述兩個(gè)生理參數(shù)間的關(guān)聯(lián)程度不同的是,聯(lián)合互信息KX1,…,X n;Y) 表達(dá)多個(gè)X1,…,1與Y之間的依賴(lài)程度,即
[0047]
[0048] 其中ρ (X1,…,χη)為聯(lián)合概率分布。聯(lián)合互信息I (X1,…,Χη;Υ)不僅考慮X1,…,Xn 與Y之間的依賴(lài)性,而且還涉及到變量X1,…,Xn內(nèi)部相關(guān)性,這對(duì)于生理特征選擇來(lái)說(shuō)特別 適用。
[0049] 因?yàn)榛バ畔⒛軌蚝芎玫囟攘刻卣髋c類(lèi)別之間的依賴(lài)關(guān)系的強(qiáng)弱程度,信息標(biāo)準(zhǔn) J(f) 一般都采取互信息I (S ;C)或其變種形式。計(jì)算特征子集和特征之間關(guān)聯(lián)信息量的同 時(shí)要考慮生理信息增長(zhǎng)率,因?yàn)樵谔卣鞑粩嗟剡x擇過(guò)程中,生理信息增長(zhǎng)率低的特征被選 入后,已選特征子集內(nèi)部的關(guān)聯(lián)程度會(huì)緩和。特征之間的冗余性和特征與類(lèi)別之間的相關(guān) 程度都是通過(guò)對(duì)稱(chēng)不確定性(Symmetrical Uncertainty,SU)度量的。所以對(duì)互信息進(jìn)行 歸一化處理,得到已選特征子集S與類(lèi)別子集C的相關(guān)性度量公式:
[0050]
(6)
[0051] 為了選擇出與類(lèi)別相關(guān)性強(qiáng),特征間互不冗余的特征子集,根據(jù)特征的最大相關(guān) 最小冗余原則,使用f與單個(gè)已選特征s之間的相關(guān)性對(duì)候選特征f進(jìn)行懲罰,減少已選子 集S的冗余程度和計(jì)算復(fù)雜度,提出特征選擇對(duì)于特征f的相關(guān)
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1