亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于低采樣率傳感信息的用戶環(huán)境分類方法與流程

文檔序號(hào):11708103閱讀:216來(lái)源:國(guó)知局

本發(fā)明涉及傳感信息興趣點(diǎn)分析,尤其是涉及了一種基于低采樣率傳感信息的用戶環(huán)境分類方法。



背景技術(shù):

伴隨著各種智能手機(jī)和相似智能移動(dòng)設(shè)備的出現(xiàn)與更新的,是一批又一批眾多而又無(wú)所不在的傳感設(shè)備大量地投入到日常生活中,它們產(chǎn)生各種海量傳感信息,促使人們對(duì)其進(jìn)行大數(shù)據(jù)分析。基于這類信息人們作出對(duì)用戶興趣點(diǎn)(poi,positionofinterest)、交通模式、移動(dòng)性等研究,從而形成一個(gè)針對(duì)特定用戶的專有模型,可以更好地了解用戶生活方式,并反過(guò)來(lái)改善用戶生活體驗(yàn)。包括社會(huì)科學(xué)家在內(nèi)的研究團(tuán)體對(duì)這類研究展現(xiàn)出越來(lái)越濃烈的興趣,因?yàn)檫@會(huì)多方面地影響到人們的生活并且應(yīng)用廣泛,例如行為模式研究、人員流動(dòng)研究、社交網(wǎng)絡(luò)發(fā)展、交通出行研究、內(nèi)容消費(fèi)制作等與人類日常生活息息相關(guān)的議題都能從中找到啟發(fā)。

然而,以往同類或相似研究中,為了保證信息的完整性及完備性,設(shè)備使用者大多采用高采樣率進(jìn)行信息的采集,但這將大大消耗作為日常使用而言的電池電量,使得數(shù)據(jù)量急劇下降并且只能作短期數(shù)據(jù)收集。因此數(shù)據(jù)量如今仍舊是一個(gè)具有挑戰(zhàn)性的問(wèn)題,同時(shí)在人群資源和感知環(huán)境下,不同的用戶使用不同的設(shè)備,不可能從所有用戶中檢索到所有的有用信息。

本發(fā)明提出了一種基于低采樣率傳感信息的用戶環(huán)境分類方法。使用超低采用率采集現(xiàn)實(shí)世界數(shù)據(jù),進(jìn)行適當(dāng)預(yù)處理后,利用基于停留點(diǎn)的驗(yàn)證算法檢測(cè)有效的停留點(diǎn),然后用具有噪聲的基于密度的聚類方法將其合并成軌跡,再運(yùn)用基于信息融合的環(huán)境分類框架進(jìn)行環(huán)境類型的分類判斷。本發(fā)明可以克服智能手機(jī)或智能移動(dòng)設(shè)備電池電量有限的劣勢(shì),使用超低采樣框架采集信息,引入基于停留點(diǎn)的驗(yàn)證算法算法檢測(cè)興趣點(diǎn)的有效性,提高了興趣點(diǎn)環(huán)境類型區(qū)分的精確性。



技術(shù)實(shí)現(xiàn)要素:

針對(duì)解決高采樣率對(duì)智能移動(dòng)設(shè)備時(shí)間及數(shù)據(jù)量的限制,以及對(duì)用戶興趣點(diǎn)有效性檢測(cè)及其環(huán)境類型分類準(zhǔn)確性低的問(wèn)題,本發(fā)明的目的在于提供一種超低采樣率數(shù)據(jù)采集框架,提出了一種基于低采樣率傳感信息且基于信息融合的用戶環(huán)境分類方法。

為解決上述問(wèn)題,本發(fā)明提供一種基于低采樣率傳感信息的用戶環(huán)境分類方法,其主要內(nèi)容包括:

(一)數(shù)據(jù)采集模塊;

(二)數(shù)據(jù)處理模塊;

(三)興趣點(diǎn)檢測(cè)模塊;

(四)興趣點(diǎn)分類模塊。

其中,所述的數(shù)據(jù)采集模塊,使用應(yīng)用程序從移動(dòng)設(shè)備中采集信息,其信息采樣間隔為5分鐘,具有三方面信息:

(1)位置信息:設(shè)備id、經(jīng)緯度、位置精確性、時(shí)間戳;

(2)社交信息:設(shè)備id、聲音強(qiáng)度、時(shí)間戳;

(3)活動(dòng)信息:設(shè)備id、交通方式、活動(dòng)、時(shí)間戳。

進(jìn)一步地,所述的數(shù)據(jù)處理模塊,包括獲取數(shù)據(jù)和處理數(shù)據(jù)兩部分:其中獲取數(shù)據(jù)通過(guò)兩種渠道獲取保存在移動(dòng)設(shè)備中的原始數(shù)據(jù);

1)當(dāng)移動(dòng)設(shè)備處于離線狀態(tài)時(shí),直接從移動(dòng)設(shè)備中讀取信息;

2)當(dāng)移動(dòng)設(shè)備處于在線狀態(tài)時(shí),先講移動(dòng)設(shè)備中的信息轉(zhuǎn)存至數(shù)據(jù)庫(kù),再?gòu)臄?shù)據(jù)庫(kù)中讀取信息。

進(jìn)一步地,所述的處理數(shù)據(jù)包括降噪處理、時(shí)間同步和數(shù)據(jù)對(duì)齊三部分:

(1)降噪處理:刪除由于移動(dòng)設(shè)備離線引起冗余信息保留而不上傳至數(shù)據(jù)庫(kù)所產(chǎn)生的具有同樣時(shí)間戳的信息;

(2)時(shí)間同步:將不同的數(shù)據(jù)連接成一個(gè)類似的時(shí)間戳,進(jìn)行數(shù)據(jù)融合計(jì)算;

(3)數(shù)據(jù)對(duì)齊:基于數(shù)據(jù)同步的時(shí)間,將來(lái)自不同數(shù)據(jù)庫(kù)的信息排列成單個(gè)矩陣的對(duì)齊形式。

進(jìn)一步地,所述的興趣點(diǎn)檢測(cè)模塊,包括使用基于停留點(diǎn)的驗(yàn)證算法驗(yàn)證提取興趣點(diǎn),使用具有噪聲的基于密度的聚類方法將興趣點(diǎn)軌跡進(jìn)行聚類。

進(jìn)一步地,所述的基于停留點(diǎn)的驗(yàn)證算法,包括驗(yàn)證興趣點(diǎn)和提取興趣點(diǎn),具有g(shù)ps定位的地點(diǎn)用表示,其中有效的值用表示,它被定義為:

其中,θl是閾值200;

根據(jù)公式(2)可計(jì)算出gps坐標(biāo)為a{ζ1,λ1}和b{ζ2,λ2}兩地點(diǎn)之間距離d,其中hav-1指harvesine逆函數(shù),r指地球半徑,

ab兩地之間的交通時(shí)間δt定義為兩個(gè)地點(diǎn)坐標(biāo)的時(shí)間戳差值,即:

δt=ti+1-ti(3)

根據(jù)公式(2)(3)結(jié)果,進(jìn)行興趣點(diǎn)有效性檢測(cè),當(dāng)δt<θt,d<θd(θt,θd為交通時(shí)間及地點(diǎn)距離閾值),則可認(rèn)為這兩個(gè)地點(diǎn)停留的gps坐標(biāo)為用戶興趣點(diǎn),從而添加進(jìn)興趣點(diǎn)軌跡。

進(jìn)一步地,所述的興趣點(diǎn)分類模塊,包括利用設(shè)備傳感器信息融合方法進(jìn)行io(室內(nèi)外)分類,即對(duì)于興趣點(diǎn)軌跡上的停留點(diǎn),根據(jù)應(yīng)用程序界面返回的gps精確性值來(lái)區(qū)分該停留點(diǎn)為室內(nèi)的還是室外的及私人的還是公共的。

進(jìn)一步地,所述的信息融合方法,包括使用置信百分比的方法去確定興趣點(diǎn)的環(huán)境類型;在興趣點(diǎn)的起止時(shí)間過(guò)程中,分類器需要獲得移動(dòng)設(shè)備的多種傳感信息,如gps精確性值、噪聲水平、電池能況、光照程度等,其中g(shù)ps精確性值由應(yīng)用程序界面自動(dòng)返回,其值越高,其gps精確性值越低;

興趣點(diǎn)的持續(xù)過(guò)程每5分鐘切為一個(gè)片段,每個(gè)片段都會(huì)給予一個(gè)上述四種分類環(huán)境中某一種類型的置信百分比,而這四種分類環(huán)境用數(shù)字作為標(biāo)簽記號(hào)說(shuō)明,即{1,2,3,4}分別表示室內(nèi)、室外、私人和公共。

進(jìn)一步地,某一種環(huán)境類型的總體置信水平由公式(4)定義:

若n>0(4)

其中,n是表示所有5分鐘片段的總共數(shù)目,表示在第個(gè)5分鐘片段中環(huán)境分類的標(biāo)簽為c的百分比置信水平,假如分類器中沒(méi)有片段的數(shù)據(jù),則p0用表示該片段“無(wú)分類”;由此利用百分比置信方法與基于傳感器的gps精確性值進(jìn)行環(huán)境類型的判斷。

進(jìn)一步地,所述的利用百分比置信方法與基于傳感器的gps精確性值進(jìn)行環(huán)境類型的判斷,包括使用四種含有不同因素權(quán)重分配的公式來(lái)判斷環(huán)境類型p1,p2,p3,p4,即對(duì)應(yīng)室內(nèi)、室外、私人和公共;

(1)對(duì)于室內(nèi)類型p1,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于gps精確性值(g);5%來(lái)自于電池能況(β),當(dāng)電池正在充電則β=1,否則β=0;5%來(lái)自于活動(dòng)是否靜止?fàn)顟B(tài)(αs),根據(jù)位置api回傳的信息來(lái)確定αs的值為0或者1;則p1的定義如下:

若x>thg(5)

其中thg是gps精確性值的閾值,x是該片段的gps精確性值的平均值;

(2)對(duì)于室外類型p2,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于gps精確性值(g);10%來(lái)自于光照程度(l),如果光照強(qiáng)度大于閾值thl則l=1,否則l=0;p2則的定義如下:

若x<thg(6)

同樣地,其中thg是gps精確性值的閾值,x是該片段的gps精確性值的平均值,根據(jù)經(jīng)驗(yàn),閾值thg設(shè)定為30,thl設(shè)定為1000;

(3)對(duì)于私人類型p3,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于噪聲水平;10%來(lái)自于活動(dòng)是否靜止?fàn)顟B(tài)(αs);則p3的定義如下:

若y<thn(7)

其中thn是噪聲水平的閾值,y是該片段噪聲水平的平均歸一化值;

(4)對(duì)于公共類型p4,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于噪聲水平;10%來(lái)自于活動(dòng)是否行走狀態(tài)(αw);則p4的定義如下:

若y>thn(8)

同樣地,其中thn是噪聲水平的閾值,y是該片段噪聲水平的平均歸一化值,根據(jù)經(jīng)驗(yàn),閾值thn設(shè)定為5。

附圖說(shuō)明

圖1是本發(fā)明一種基于低采樣率傳感信息的用戶環(huán)境分類方法的系統(tǒng)流程圖。

具體實(shí)施方式

需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互結(jié)合,下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。

圖1是本發(fā)明一種基于低采樣率傳感信息的用戶環(huán)境分類方法的系統(tǒng)流程圖。數(shù)據(jù)采集模塊;數(shù)據(jù)處理模塊;興趣點(diǎn)檢測(cè)模塊;興趣點(diǎn)分類模塊。

使用基于應(yīng)用程序從移動(dòng)設(shè)備中采集信息,其信息采樣間隔為5分鐘,具有三方面信息;

(1)位置信息:設(shè)備id、經(jīng)緯度、位置精確性、時(shí)間戳;

(2)社交信息:設(shè)備id、聲音強(qiáng)度、時(shí)間戳;

(3)活動(dòng)信息:設(shè)備id、交通方式、活動(dòng)、時(shí)間戳。

進(jìn)一步地,所述的數(shù)據(jù)處理模塊,包括獲取數(shù)據(jù)和處理數(shù)據(jù)兩部分:其中獲取數(shù)據(jù)通過(guò)兩種渠道獲取保存在移動(dòng)設(shè)備中的原始數(shù)據(jù);

1)當(dāng)移動(dòng)設(shè)備處于離線狀態(tài)時(shí),直接從移動(dòng)設(shè)備中讀取信息;

2)當(dāng)移動(dòng)設(shè)備處于在線狀態(tài)時(shí),先講移動(dòng)設(shè)備中的信息轉(zhuǎn)存至數(shù)據(jù)庫(kù),再?gòu)臄?shù)據(jù)庫(kù)中讀取信息;

進(jìn)一步地,所述的處理數(shù)據(jù)包括降噪處理、時(shí)間同步和數(shù)據(jù)對(duì)齊三部分:

(1)降噪處理:刪除由于移動(dòng)設(shè)備離線引起冗余信息保留而不上傳至數(shù)據(jù)庫(kù)所產(chǎn)生的具有同樣時(shí)間戳的信息;

(2)時(shí)間同步:將不同的數(shù)據(jù)連接成一個(gè)類似的時(shí)間戳,進(jìn)行數(shù)據(jù)融合計(jì)算;

(3)數(shù)據(jù)對(duì)齊:基于數(shù)據(jù)同步的時(shí)間,將來(lái)自不同數(shù)據(jù)庫(kù)的信息排列成單個(gè)矩陣的對(duì)齊形式。

進(jìn)一步地,所述的興趣點(diǎn)檢測(cè)模塊,包括使用基于停留點(diǎn)的驗(yàn)證算法驗(yàn)證提取興趣點(diǎn),使用具有噪聲的基于密度的聚類方法將興趣點(diǎn)軌跡進(jìn)行聚類。

進(jìn)一步地,所述的基于停留點(diǎn)的驗(yàn)證算法,包括驗(yàn)證興趣點(diǎn)和提取興趣點(diǎn),具有g(shù)ps定位的地點(diǎn)用表示,其中有效的值用表示,它被定義為:

其中,θl是閾值200;

根據(jù)公式(2)可計(jì)算出gps坐標(biāo)為a{ζ1,λ1}和b{ζ2,λ2}兩地點(diǎn)之間距離d,其中hav-1指harvesine逆函數(shù),r指地球半徑,

ab兩地之間的交通時(shí)間δt定義為兩個(gè)地點(diǎn)坐標(biāo)的時(shí)間戳差值,即:

δt=ti+1-ti(3)

根據(jù)公式(2)(3)結(jié)果,進(jìn)行興趣點(diǎn)有效性檢測(cè),當(dāng)δt<θt,d<θd(θt,θd為交通時(shí)間及地點(diǎn)距離閾值),則可認(rèn)為這兩個(gè)地點(diǎn)停留的gps坐標(biāo)為用戶興趣點(diǎn),從而添加進(jìn)興趣點(diǎn)軌跡;

進(jìn)一步地,所述的興趣點(diǎn)分類模塊,包括利用設(shè)備傳感器信息融合方法進(jìn)行io(室內(nèi)外)分類,即對(duì)于興趣點(diǎn)軌跡上的停留點(diǎn),根據(jù)程序界面返回的gps精確性值來(lái)區(qū)分該停留點(diǎn)為室內(nèi)的還是室外的及私人的還是公共的。

進(jìn)一步地,所述的信息融合方法,包括使用置信百分比的方法去確定興趣點(diǎn)的環(huán)境類型;在興趣點(diǎn)的起止時(shí)間過(guò)程中,分類器需要獲得移動(dòng)設(shè)備的多種傳感信息,如gps精確性值、噪聲水平、電池能況、光照程度等,其中g(shù)ps精確性值由程序界面自動(dòng)返回,其值越高,其gps精確性值越低;

興趣點(diǎn)的持續(xù)過(guò)程每5分鐘切為一個(gè)片段,每個(gè)片段都會(huì)給予一個(gè)上述四種分類環(huán)境中某一種類型的置信百分比,而這四種分類環(huán)境用數(shù)字作為標(biāo)簽記號(hào)說(shuō)明,即{1,2,3,4}分別表示室內(nèi)、室外、私人和公共。

某一種環(huán)境類型的總體置信水平由公式(4)定義:

若n>0(4)

其中,n是表示所有5分鐘片段的總共數(shù)目,表示在第個(gè)5分鐘片段中環(huán)境分類的標(biāo)簽為c的百分比置信水平,假如分類器中沒(méi)有片段的數(shù)據(jù),則p0用表示該片段“無(wú)分類”;由此利用百分比置信方法與基于傳感器的gps精確性值進(jìn)行環(huán)境類型的判斷。

進(jìn)一步地,所述的利用百分比置信方法與基于傳感器的gps精確性值進(jìn)行環(huán)境類型的判斷,包括使用四種含有不同因素權(quán)重分配的公式來(lái)判斷環(huán)境類型p1,p2,p3,p4,即對(duì)應(yīng)室內(nèi)、室外、私人和公共;

(1)對(duì)于室內(nèi)類型p1,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于gps精確性值(g);5%來(lái)自于電池能況(β),當(dāng)電池正在充電則β=1,否則β=0;5%來(lái)自于活動(dòng)是否靜止?fàn)顟B(tài)(αs),根據(jù)位置api回傳的信息來(lái)確定αs的值為0或者1;則p1的定義如下:

若x>thg(5)

其中thg是gps精確性值的閾值,x是該片段的gps精確性值的平均值;

(2)對(duì)于室外類型p2,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于gps精確性值(g);10%來(lái)自于光照程度(l),如果光照強(qiáng)度大于閾值thl則l=1,否則l=0;p2則的定義如下:

若x<thg(6)

同樣地,其中thg是gps精確性值的閾值,x是該片段的gps精確性值的平均值,根據(jù)經(jīng)驗(yàn),閾值thg設(shè)定為30,thl設(shè)定為1000;

(3)對(duì)于私人類型p3,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于噪聲水平;10%來(lái)自于活動(dòng)是否靜止?fàn)顟B(tài)(αs);則p3的定義如下:

若y<thn(7)

其中thn是噪聲水平的閾值,y是該片段噪聲水平的平均歸一化值;

(4)對(duì)于公共類型p4,傳感器信息對(duì)百分比的貢獻(xiàn)分別為:90%來(lái)自于噪聲水平;10%來(lái)自于活動(dòng)是否行走狀態(tài)(αw);則p4的定義如下:

若y>thn(8)

同樣地,其中thn是噪聲水平的閾值,y是該片段噪聲水平的平均歸一化值,根據(jù)經(jīng)驗(yàn),閾值thn設(shè)定為5。

對(duì)于本領(lǐng)域技術(shù)人員,本發(fā)明不限制于上述實(shí)施例的細(xì)節(jié),在不背離本發(fā)明的精神和范圍的情況下,能夠以其他具體形式實(shí)現(xiàn)本發(fā)明。此外,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍,這些改進(jìn)和變型也應(yīng)視為本發(fā)明的保護(hù)范圍。因此,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1