亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種數(shù)據(jù)周期性發(fā)布的隱私保護方法

文檔序號:6552558閱讀:307來源:國知局
一種數(shù)據(jù)周期性發(fā)布的隱私保護方法
【專利摘要】本發(fā)明涉及一種數(shù)據(jù)周期性發(fā)布的隱私保護方法。數(shù)據(jù)初次發(fā)布時,先掃描原始數(shù)據(jù)記錄確定個體并基于身份進行重新編碼,然后基于個體關聯(lián)SA分組和保持個體關聯(lián)的(k,l)匿名模型實現(xiàn)首次信息發(fā)布;在周期性后續(xù)發(fā)布時,先計算待發(fā)布數(shù)據(jù)和前次發(fā)布數(shù)據(jù)相同個體間的SA分組距離,再基于ε-分組不變性規(guī)則,利用局部重編碼方法泛化元組進行信息發(fā)布。本發(fā)明充分考慮前后兩次發(fā)布數(shù)據(jù)之間的個體關聯(lián)性,保證了個體的隱私信息。
【專利說明】一種數(shù)據(jù)周期性發(fā)布的隱私保護方法

【技術領域】
[0001]本發(fā)明屬于信息隱私保護發(fā)布安全領域,具體涉及一種數(shù)據(jù)周期性發(fā)布的隱私保護方法。

【背景技術】
[0002]大量醫(yī)療信息具有統(tǒng)計分析和病情研究的重要價值,為了滿足這些隱私信息共享、科學研究等多方面的需要,必須對這些信息進行隱私保護發(fā)布處理。K-匿名是傳統(tǒng)表數(shù)據(jù)領域的一類重要的隱私保護技術,但是這種技術僅適用于靜態(tài)數(shù)據(jù)的發(fā)布,而且該技術也容易受到攻擊。
[0003]醫(yī)療數(shù)據(jù)的發(fā)布通常具有周期性發(fā)布的特點,同時在待發(fā)布表中一個個體可能對應多條記錄,在發(fā)布時應該從個體的角度去考慮其隱私的保護,并且考慮多次發(fā)布時發(fā)布數(shù)據(jù)之間的關聯(lián)性。
[0004]醫(yī)療數(shù)據(jù)表屬性分為三類:顯式標識符(Identifier),指能清楚標識用戶身份的屬性,為了保護個人信息,常常在數(shù)據(jù)發(fā)布前將這些屬性刪除或加密;準標識符QI (Quasi
Ident ifier),即同時存在于隱私表與外表中,可以利用鏈接來標識個體信息的一組屬性稱為準標識符屬性;敏感屬性SA(Sensitive Attribute),該類屬性包含了個體的隱私信息。


【發(fā)明內容】

[0005]針對傳統(tǒng)表數(shù)據(jù)領域隱私保護技術存在的問題,本發(fā)明提供一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,從個體的角度保證了的隱私信息的安全,抵制了表間的鏈接攻擊,在保護隱私的同時最大程度地滿足了數(shù)據(jù)的可用性。
[0006]為實現(xiàn)上述目的,本發(fā)明具體技術方案如下:一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,包括如下步驟:
[0007](I)預處理待發(fā)布表T,生成數(shù)據(jù)表T (QI, GID, ID, SA);
[0008](2)初始化發(fā)布表作汀+為空匿名表’結構與?、萟瓜’瓜^么)相同;
[0009](3)判斷數(shù)據(jù)表T(QI,GID,ID,SA)是否為首次發(fā)布,如果是首次發(fā)布轉步驟(4),否則轉步驟(8);
[0010](4)設定安全保護參數(shù)k、I和ε ;
[0011](5)對表 T (QI,GID, ID, SA)進行泛化發(fā)布;
[0012](6)元組移回處理;
[0013](7)檢查表T(QI,GID, ID, SA)記錄是否已經全泛化,若未全泛化轉步驟(5),否則轉步驟(12);
[0014](8)計算T*(j_l)和T(j)中同一個體的SA分組距離;
[0015](9)根據(jù)SA分組距離將T(j)分成兩組T’和T” ;
[0016](10)基于ε -分組不變性規(guī)則發(fā)布T (j);
[0017](11)判斷T”是否已全泛化;如果完成轉步驟(12),否則轉步驟(5);
[0018](12)數(shù)據(jù)發(fā)布完成,表T*為最終隱私保護發(fā)布信息。
[0019]進一步地,上述步驟(1)中,預處理待發(fā)布表包括如下步驟:
[0020](1.1)根據(jù)醫(yī)療數(shù)據(jù)屬性的分類,對待發(fā)布的數(shù)據(jù)表中屬于同一個體的記錄進行ID標注,表示為三類屬性的表形式T (QI,ID, SA);
[0021](1.2)初始化每一個體為一個分組,添加分組標號GID,表示為T(QI,GID, ID, SA);
[0022](1.3)合并具有相同QI的分組;
[0023](1.4)刪除顯示標識符;
[0024]進一步地,上述步驟(5)中,泛化發(fā)布包括如下步驟:
[0025](5.1)采用自底向上的局部重編碼方法對表T(QI,GID,ID, SA)中的QI屬性進行泛化;
[0026](5.2)每泛化一次就會出現(xiàn)一些相同的QI分組,合并具有相同QI的分組,并重新標記GID ;
[0027](5.3)將滿足個體關聯(lián)的(k,I)-匿名約束的分組移除到匿名表T*中;
[0028]進一步地,上述步驟(5.3)中,個體關聯(lián)(k,l)_匿名約束條件是發(fā)布表T*(QI,GID, ID, SA)必須滿足表中的任何一個QI分組中至少包含k個不同的個體和I個距離大于一個設定值ε的個體關聯(lián)SA分組。
[0029]進一步地,上述步驟(8)中,計算分組距離的方法包括如下步驟:
[0030](8.1)根據(jù)醫(yī)療常識確認兩個敏感屬性值vl和ν2之間的關聯(lián)度,用RSA(vl,v2)表示,RSA e [O, I], RSA越接近I關聯(lián)度越強,當vl = v2時,RSA = I ;
[0031 ] (8.2)基于關聯(lián)度計算SA分組距離,設G11sa和G12sa分別為兩個體11和12的SA分組,兩分組之間的敏感屬性關聯(lián)度可表示為!L(v,叫I w,.eGWvy SG\J,用Rsa (II,12)表示,則個體SA分組間的距離可表示為min(l-RSA(Il,12)),用DisSA(Il, 12)表示。
[0032]進一步地,上述步驟(10)中,ε-分組不變性規(guī)則的要求是出現(xiàn)在表T*(j_l)和T*(j)中的同一個體I’和I”表示,如果DisSA(I’,I’’)( ε,那么在發(fā)布個體I”時,表T*(j)中含有I”的QI分組與T*(j_l)中含有I’的QI分組必須具有相同的個體數(shù),并且兩個QI分組間對應的個體分組距離都必須小于等于ε。
[0033]本發(fā)明充分考慮了醫(yī)療數(shù)據(jù)中一個個體可能對應多條記錄,且同一個體可能由于年齡等屬性的變化而具有不同的QI屬性的特點,在發(fā)布處理時利用個體關聯(lián)(k,I)-匿名約束模型盡可能地考慮個體的隱私而非記錄層次上的隱私,同時在后續(xù)發(fā)布時利用ε -分組不變性規(guī)則充分考慮前后兩次發(fā)布數(shù)據(jù)之間的個體關聯(lián)性,保證了個體的隱私信息。

【專利附圖】

【附圖說明】
[0034]圖1為本發(fā)明數(shù)據(jù)周期性發(fā)布的隱私保護方法流程圖。

【具體實施方式】
[0035]下面結合附圖和具體實施例對本發(fā)明作進一步描述。
[0036]如圖1所示,本發(fā)明提供了一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,包括以下步驟:
[0037](I)預處理待發(fā)布表,包括如下步驟:
[0038](1.1)根據(jù)醫(yī)療數(shù)據(jù)屬性的分類,對待發(fā)布的數(shù)據(jù)表中屬于同一個體的記錄進行ID標注,表不為三類屬性的表形式T(QI,ID, SA);作為本發(fā)明的一個具體實施例的待發(fā)布表如表1所不;
[0039]表1
[0040]

【權利要求】
1.一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,其特征在于,包括如下步驟: (1)預處理待發(fā)布表T,生成數(shù)據(jù)表T(QI,GID,ID,SA); (2)初始化發(fā)布表T*;T*為空匿名表,結構與T(QI,GID,ID, SA)相同; (3)判斷數(shù)據(jù)表T(QI,GID,ID,SA)是否為首次發(fā)布,如果是首次發(fā)布轉步驟(4),否則轉步驟⑶; (4)設定安全保護參數(shù)k、I和ε; (5)對表T(QI,GID, ID, SA)進行泛化發(fā)布; (6)元組移回處理; (7)檢查表T(QI,GID,ID,SA)記錄是否已經全泛化,若未全泛化轉步驟(5),否則轉步驟(12); (8)計算T*(j-1)和T(j)中同一個體的SA分組距離; (9)根據(jù)SA分組距離將T(j)分成兩組T,和T” ; (10)基于分組不變性規(guī)則發(fā)布T(j); (11)判斷Τ”是否已全泛化;如果完成轉步驟(12),否則轉步驟(5); (12)數(shù)據(jù)發(fā)布完成,表Τ*為最終隱私保護發(fā)布信息。
2.如權利要求1所述的一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,其特征在于:步驟(1)中,所述預處理待發(fā)布表包括如下步驟: (1.D根據(jù)醫(yī)療數(shù)據(jù)屬性的分類,對待發(fā)布的數(shù)據(jù)表中屬于同一個體的記錄進行ID標注,表示為三類屬性的表形式T (QI,ID,SA); (1.2)初始化每一個體為一個分組,添加分組標號GID,表示為T(QI,GID, ID, SA); (1.3)合并具有相同QI的分組; (1.4)刪除顯示標識符。
3.如權利要求1所述的一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,其特征在于:步驟(5)中,所述泛化發(fā)布包括如下步驟: (5.1)采用自底向上的局部重編碼方法對表T (QI,GID, ID, SA)中的QI屬性進行泛化; (5.2)每泛化一次就會出現(xiàn)一些相同的QI分組,合并具有相同QI的分組,并重新標記GID ; (5.3)將滿足個體關聯(lián)的(k,I) -匿名約束的分組移除到匿名表T*中。
4.如權利要求3所述的一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,其特征在于:步驟(5.3)中,所述個體關聯(lián)(k,I) -匿名約束條件是發(fā)布表T*(QI,GID, ID, SA)必須滿足表中的任何一個QI分組中至少包含k個不同的個體和I個距離大于一個設定值ε的個體關聯(lián)SA分組。
5.如權利要求1所述的一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,其特征在于:步驟(8)中,所述計算分組距離的方法包括如下步驟: (8.1)根據(jù)醫(yī)療常識確認兩個敏感屬性值Vl和ν2之間的關聯(lián)度,用RSA(vl,ν2)表示,RSA e [O, I],RSA越接近I關聯(lián)度越強,當vl = v2時,RSA = I ; (8.2)基于關聯(lián)度計算SA分組距離,設G11sa和G12sa分別為兩個體Il和12的SA分組,兩分組之間的敏感屬性關聯(lián)度可表示為表示,則個體SA分組間的距離可表示為min(1-Rsa(II,12)),用DisSA(Il, 12)表示。
6.如權利要求1所述的一種數(shù)據(jù)周期性發(fā)布的隱私保護方法,其特征在于:步驟(10)中,所述ε-分組不變性規(guī)則的要求是出現(xiàn)在表T*(j_l)和T*(j)中的同一個體I’和I”表示,如果DiSsA(r,I’’) ( ε,那么在發(fā)布個體I”時,表T*(j)中含有I”的QI分組與T*(j_l)中含有I’的QI分組必須具有相同的個體數(shù),并且兩個QI分組間對應的個體分組距離都必須小 于等于ε。
【文檔編號】G06F21/60GK104077538SQ201410321751
【公開日】2014年10月1日 申請日期:2014年7月7日 優(yōu)先權日:2014年7月7日
【發(fā)明者】張志祥, 金華, 華進, 韓小祥, 朱鵬程 申請人:南通大學杏林學院
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1