一種交通模式行為識別方法及相應(yīng)的識別模型構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及普適計算、移動互聯(lián)網(wǎng)及城市規(guī)劃等技術(shù)領(lǐng)域,具體地說,本發(fā)明涉及一種交通模式行為識別方法及相應(yīng)的識別模型構(gòu)建方法。
【背景技術(shù)】
[0002]利用傳感數(shù)據(jù)識別用戶的日常行為是普適計算領(lǐng)域的重要研究問題。交通模式行為(走路、騎單車、坐公交等)作為眾多日常行為的一個子類,蘊含大量與用戶的運動軌跡、生活規(guī)律等相關(guān)的信息。精準(zhǔn)而有效地捕捉用戶日常的交通模式行為,進而分析用戶行為習(xí)慣和日常生活軌跡,對智能移動服務(wù)、健康監(jiān)護、城市規(guī)劃等多個領(lǐng)域都具有重要的作用。例如:利用交通模式行為識別技術(shù),可以挖掘用戶的日常軌跡信息和具體的出行方式;可以針對開車或坐車等進行合理的勸導(dǎo),倡導(dǎo)綠色出行和健康出行。另外,大量用戶交通模式行為數(shù)據(jù)的積累有利于城市規(guī)劃、道路設(shè)計、公交路線優(yōu)化等,具有廣泛而重要的價值。隨著移動終端的日益普及和終端內(nèi)嵌的傳感器件的發(fā)展,基于傳感器非干擾地識別用戶日常的交通模式行為已成為普適計算領(lǐng)域的研究熱點。
[0003]近年來,基于傳感器的非干擾交通模式識別主要是:從傳感器所采集數(shù)據(jù)中提取一系列特征作為特征集,通過對特征集進行分析處理建立和訓(xùn)練識別模型,利用該模型識別用戶的多種交通模式行為,例如中國專利CN 201210185649等。這些方案都是試圖尋找由某些固定特征組成的最優(yōu)特征集以及尋找某個特定的最佳數(shù)學(xué)模型作為識別模型,然后再用這個最優(yōu)特征集和識別模型來識別出具體的交通模式。然而,交通模式行為的類別眾多,不同交通模式行為之間的相似度高,同種交通模式行為內(nèi)部的差異性大,這些因素導(dǎo)致目前的交通識別方案的識別精度均不能令人滿意,越來越難以滿足實際應(yīng)用的要求。
[0004]因此,當(dāng)前迫切需要一種能夠?qū)τ脩艚煌J降臏?zhǔn)確區(qū)分的基于傳感器數(shù)據(jù)的交通模式識別解決方案。
【發(fā)明內(nèi)容】
[0005]因此,本發(fā)明的任務(wù)是提供一種能夠克服現(xiàn)有技術(shù)的上述缺陷的交通模式解決方案。
[0006]根據(jù)本發(fā)明的一個方面,提供了一種交通模式行為識別模型構(gòu)建方法,其特征在于,包括下列步驟:
[0007]1)對具體交通模式行為進行多層次的歸類,建立相應(yīng)的分類樹,其中所述分類樹的每一個節(jié)點都代表一個類別,所述分類樹的父節(jié)點下的子節(jié)點代表對該父節(jié)點對應(yīng)類別進一步分類后所得到的子類,所述分類樹的葉節(jié)點代表具體交通模式行為;
[0008]2)對于分類樹中每一個父節(jié)點的分類問題,基于隨機森林模型,根據(jù)識別精度選擇對應(yīng)該分類問題的測試樣本的最優(yōu)特征集;其中所述父節(jié)點的分類問題是如何將樣本從該父節(jié)點對應(yīng)類別劃分至其子節(jié)點對應(yīng)類別的分類問題;
[0009]3)對于分類樹中每一個父節(jié)點的分類問題,基于步驟2)所得出的該父節(jié)點所對應(yīng)的最優(yōu)特征集,選擇一個最優(yōu)分類模型作為該父節(jié)點所對應(yīng)的子分類模型。
[0010]其中,所述步驟2)中,所述識別精度是:基于隨機森林模型準(zhǔn)確識別出類別的測試樣本個數(shù)除以測試樣本總個數(shù);所述測試樣本是:對已知的具體交通模式行為所采集的多種傳感器數(shù)據(jù)的特征向量;所述特征向量包括所述傳感器數(shù)據(jù)的多個特征,所述最優(yōu)特征集中的特征在所述特征向量的范圍內(nèi)選擇。
[0011]其中,所述步驟2)中,所述傳感器數(shù)據(jù)包括:加速度計、陀螺儀和磁力計數(shù)據(jù)。
[0012]其中,所述步驟2)中,所述傳感器數(shù)據(jù)還包括:基于衛(wèi)星定位技術(shù)獲得的速度數(shù)據(jù)。
[0013]其中,所述步驟1)中,所述分類樹的第一層子類包括“靜止”和“非靜止行為”;所述“非靜止行為”的子類包括:“機動行為”和“非機動行為”。
[0014]其中,所述步驟1)中,所述“非機動行為”的子類包括:“走路”、“跑步”和“騎車”;所述“機動行為”的子類包括:“乘公交”、“乘地鐵”和“乘火車”。
[0015]其中,所述步驟2)中,選擇最優(yōu)特征集的過程包括:
[0016]2 1 )根據(jù)基于特征集F e a t u r e S e t 1的訓(xùn)練樣本集訓(xùn)練隨機森林模型RandomForestl,并計算模型的識別精度Accuracy 1;所述訓(xùn)練樣本集是所述測試樣本所組成的集合;
[0017]22)統(tǒng)計特征集FeatureSetl中各個特征在模型RandomForestl中的特征使用頻率,將特征按照頻率從大到小排序;其中特征使用頻率是:隨機森林中使用該特征的決策樹個數(shù)除以隨機森林中包含的決策樹總個數(shù);
[0018]23)從特征集FeatureSetl中刪掉使用頻率取值較小的特征,剩余的特征組成特征集FeatureSet2;
[0019]2 4 )根據(jù)基于特征集F e a t u r e S e t 2的訓(xùn)練樣本集訓(xùn)練隨機森林模型RandomForest2,計算該隨機森林模型RandomForest2的識別精度Accuracy2 ;
[0020]25)對比Accuracy2與Accuracyl,若Accuracy2小于Accuracyl,則進入步驟26);反之,用特征集FeatureSet2替換FeatureSetl,模型RandomForest2替換模型RandomForestl,精度Accuracy2替換精度Accuracyl,重新執(zhí)行步驟22);
[0021 ] 26)將特征集FeatureSetl作為最優(yōu)特征集。
[0022]其中,所述步驟2)中,測試樣本中初始的特征向量包括:均值、標(biāo)準(zhǔn)方差、過零率、百分位數(shù)、關(guān)聯(lián)系數(shù)、功率譜密度、頻域熵和譜峰位置。
[0023]根據(jù)本發(fā)明的另一方面,提供了一種交通模式行為識別方法,其特征在于,包括下列步驟:
[0024]a)獲取基于多種傳感器數(shù)據(jù)的待識別樣本;
[0025]b)讀取多層次異構(gòu)的交通模式行為識別模型的分類樹,將根節(jié)點作為當(dāng)前節(jié)點;
[0026]c)根據(jù)當(dāng)前節(jié)點子分類問題所對應(yīng)的最優(yōu)特征子集,生成基于最優(yōu)特征子集的測試樣本;
[0027]d)根據(jù)當(dāng)前子分類問題所對應(yīng)的最優(yōu)分類模型,對基于最優(yōu)特征子集的測試樣本進行分類,得到下一層的類別;
[0028]e)如果所識別出的下一層類別為最底層類別,輸出識別結(jié)果,轉(zhuǎn)步驟f);否則,將所識別出的下一層類別的節(jié)點作為當(dāng)前節(jié)點,待識別樣本進入當(dāng)前節(jié)點,轉(zhuǎn)步驟c);
[0029]其中所述交通模式行為識別模型是根據(jù)前文所述的識別模型構(gòu)建方法所生成的識別模型。
[0030]與現(xiàn)有技術(shù)相比,本發(fā)明具有下列技術(shù)效果:
[0031]1、本發(fā)明能夠更加準(zhǔn)確地區(qū)分具體的交通模式行為,例如:走路、跑步、騎車、乘公交車、開車、乘地鐵、乘火車、乘輕軌等。
[0032]2、本發(fā)明的計算復(fù)雜度相對較小。
【附圖說明】
[0033]以下,結(jié)合附圖來詳細說明本發(fā)明的實施例,其中:
[0034]圖1示出了本發(fā)明一個實施例中建立和訓(xùn)練該識別模型的過程的流程圖;
[0035]圖2示出了本發(fā)明一個實施例中的多層次交通模式行為識別的構(gòu)架圖;
[0036]圖3示出了本發(fā)明一個實施例中每個特定分類的特征選擇過程的流程圖。
【具體實施方式】
[0037]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖,對本發(fā)明提出的基于多源傳感器的層次異構(gòu)交通模式行為識別模型及相應(yīng)的交通模式行為識別方法進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施方法僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0038]根據(jù)本發(fā)明的一個實施例,提供了一種基于多源傳感器的層次異構(gòu)交通模式行為識別模型,圖1示出了建立和訓(xùn)練該識別模型的過程,它主要包括三個步驟:層次劃分、特征選擇、模型選擇。下面分別介紹這三個步驟。
[0039]—、層次劃分
[0