亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種應(yīng)用k-means和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法

文檔序號(hào):7745233閱讀:245來(lái)源:國(guó)知局

專(zhuān)利名稱(chēng)::一種應(yīng)用k-means和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種應(yīng)用K-MEANS和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法,屬于移動(dòng)通信領(lǐng)域。
背景技術(shù)
:ARMA模型是一種最常見(jiàn)的重要的時(shí)間序列模型,它被廣泛應(yīng)用到各種行業(yè)預(yù)測(cè)中,比如股票、GDP增長(zhǎng)等,同時(shí)它也是一種最為經(jīng)典的時(shí)間序列預(yù)測(cè)方法。下面簡(jiǎn)單介紹這兩種模型的原理。ARMA系列模型的建模理論基礎(chǔ)是利用歷史數(shù)據(jù)序列的信息,根據(jù)統(tǒng)計(jì)獲得的數(shù)據(jù)序列中存在的相關(guān)關(guān)系找到序列值之間相關(guān)關(guān)系的規(guī)律,擬合出可以描述這種關(guān)系的模型,進(jìn)而利用模型對(duì)序列的未來(lái)走勢(shì)進(jìn)行預(yù)測(cè)。對(duì)一個(gè)線性系統(tǒng),輸入白噪聲序列at,輸出一個(gè)平穩(wěn)序列xt,輸入輸出關(guān)系可以表示為ARMA模型,將時(shí)間序列Xt表示為當(dāng)前時(shí)間之前的序列值、白噪聲的過(guò)去值以及當(dāng)前值的加權(quán)和的形式。Xt=ΦιΧη+Φ2xt_2+L+Φpxt_p+at_θΑ_「-θqat_q(1)式(1)稱(chēng)為自回歸滑動(dòng)平均(Autoregressive-movingaverage)模型,記為ARMA(p,q)。其中,ρ和q分別為自回歸項(xiàng)和滑動(dòng)平均項(xiàng)的階數(shù)。針對(duì)一些數(shù)據(jù)序列中通常存在的趨勢(shì)性和季節(jié)性的處理問(wèn)題,Box和Jenkins提出了差分運(yùn)算處理和ARMA模型相結(jié)合的ARIMA模型和季節(jié)ARIMA模型,并在實(shí)際應(yīng)用中取得了良好的效果。為了闡述的方便,定義延遲算子B。Xt—P=BpXt,V/>1(2)一階差分的概念就是取序列中前后相鄰兩個(gè)值之間的差值。Vxi=x,-=(1-B)xt(3)依此類(lèi)推,可以得到多階差分。VrfXi=Vrf-1JCi-Vd-lXt^=(I-B)dXt(4)與普通的差分運(yùn)算不同的是,延遲差分取得的不是相鄰序列值的差值,而是間隔為S的序列值的差值。VsXi=Xi-xt_s=(I-Bs)Xt(5)對(duì)于某些時(shí)間序列,進(jìn)行d階差分后,符合ARMA模型。模型結(jié)構(gòu)如下Φ{Β)^χ(=0{B)at(6)其中φ(B)=1-φ1Β-φ2Β2--φρΒρθ(B)=1-θθ2B2-L-θqBq(7)禾爾為求禾口自回歸滑云J]平均(Autoregressive—Integratedmovingaverage)HM記為ARIMA(p,d,q)。對(duì)于一些具有周期變化特點(diǎn)時(shí)間序列,進(jìn)行以周期s為間隔的延遲差分處理后,符合ARMA模型,這類(lèi)模型稱(chēng)為季節(jié)ARIMA模型。模型結(jié)構(gòu)如下,O(^s)Vfxi={Bs)a,(8)其中Φ(Bs)和θ(Bs)是Bs的P次和Q次多項(xiàng)式,形如式(7)。實(shí)際上,季節(jié)ARIMA模型體現(xiàn)了以周期s為間隔的各個(gè)序列值之間的相關(guān)關(guān)系。而對(duì)于序列值之間存在更加復(fù)雜關(guān)聯(lián)性的情況,在考慮周期性的相關(guān)關(guān)系的基礎(chǔ)上,應(yīng)同時(shí)考慮非周期間隔的序列值之間的相關(guān)關(guān)系。假定at滿足ARIMA模型φ(Β)να,=θ(Β)β,(9)結(jié)合季節(jié)ARIMA模型,得到乘積季節(jié)ARIMA模型φ(Β)Φ(Β)νΙ^χι=e{B){Bs)et(10)記為ARIMA(p,d,q)X(P,D,Q)s。實(shí)際上,可以把乘積季節(jié)ARIMA模型看作為疏系數(shù)ARIMA(p+sP,d+sD,q+sQ)模型。應(yīng)用ARIMA模型進(jìn)行時(shí)間序列預(yù)測(cè)的過(guò)程主要包括模型識(shí)別——判斷時(shí)間序列數(shù)據(jù)符合的模型類(lèi)別;參數(shù)估計(jì)與檢驗(yàn)——估計(jì)模型中的參數(shù),建立模型并對(duì)模型進(jìn)行檢驗(yàn),判斷模型是否適用;預(yù)測(cè)——基于建立的模型對(duì)時(shí)間序列的未來(lái)值進(jìn)行預(yù)測(cè)。在移動(dòng)通信領(lǐng)域采用ARIMA模型進(jìn)行話務(wù)量預(yù)測(cè)時(shí),首先要對(duì)話務(wù)小區(qū)進(jìn)行分類(lèi)劃分,其劃分的主要方式是根據(jù)專(zhuān)家的歷史經(jīng)驗(yàn),根據(jù)以往小區(qū)的特點(diǎn)以及小區(qū)的相似性人為對(duì)話務(wù)小區(qū)進(jìn)行劃分,這種劃分方法結(jié)合專(zhuān)家經(jīng)驗(yàn),在某些情況下可以較好的反映小區(qū)特點(diǎn),但是這種方式也會(huì)帶有很大的主觀性,不夠科學(xué),劃分不準(zhǔn)確。
發(fā)明內(nèi)容本發(fā)明的目的是解決進(jìn)行話務(wù)量預(yù)測(cè)時(shí),根據(jù)專(zhuān)家的歷史經(jīng)驗(yàn)對(duì)話務(wù)小區(qū)進(jìn)行劃分的方式帶有很大的主觀性、劃分不準(zhǔn)確的問(wèn)題,提供了一種應(yīng)用K-MEANS和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法。本發(fā)明方法包括以下步驟步驟一、按照先驗(yàn)知識(shí)將話務(wù)小區(qū)劃分為四種類(lèi)型,所述四種類(lèi)型分別為交通主干線、繁華商業(yè)區(qū)、高等院校和居民住宅區(qū);步驟二、對(duì)每種類(lèi)型中的每個(gè)話務(wù)小區(qū)的話務(wù)數(shù)據(jù)進(jìn)行預(yù)處理,獲取每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,所述聚類(lèi)特征包括相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值和標(biāo)準(zhǔn)差;步驟三、根據(jù)每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,并采用K-MEANS聚類(lèi)算法依次對(duì)每種類(lèi)型中的話務(wù)小區(qū)進(jìn)行聚類(lèi),將每種類(lèi)型中的話務(wù)小區(qū)細(xì)化成多個(gè)具有相似聚類(lèi)特征的類(lèi)另|J,完成對(duì)所有話務(wù)小區(qū)的分類(lèi)。本發(fā)明的優(yōu)點(diǎn)結(jié)合先驗(yàn)知識(shí),使用聚類(lèi)算法對(duì)話務(wù)小區(qū)進(jìn)行細(xì)化的準(zhǔn)確度有了很大的提高,能夠清晰的將性質(zhì)不同的小區(qū)分開(kāi),被細(xì)分為同一類(lèi)的話務(wù)小區(qū)在預(yù)測(cè)模型確定以及參數(shù)選取上具有相似性,使得預(yù)測(cè)效率高。圖1是本發(fā)明方法流程圖,圖2是基于K-means方法對(duì)一組對(duì)象進(jìn)行聚類(lèi)的初始分布圖,圖3是基于K-means方法對(duì)一組對(duì)象進(jìn)行聚類(lèi)根據(jù)平均值的再分布圖,圖4是基于K-means方法對(duì)一組對(duì)象進(jìn)行聚類(lèi)的最終分布圖。具體實(shí)施例方式具體實(shí)施方式一下面結(jié)合圖1至圖4說(shuō)明本實(shí)施方式,本實(shí)施方式方法包括以下步驟步驟一、按照先驗(yàn)知識(shí)將話務(wù)小區(qū)劃分為四種類(lèi)型,所述四種類(lèi)型分別為交通主干線、繁華商業(yè)區(qū)、高等院校和居民住宅區(qū);步驟二、對(duì)每種類(lèi)型中的每個(gè)話務(wù)小區(qū)的話務(wù)數(shù)據(jù)進(jìn)行預(yù)處理,獲取每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,所述聚類(lèi)特征包括相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值和標(biāo)準(zhǔn)差;步驟三、根據(jù)每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,并采用K-MEANS聚類(lèi)算法依次對(duì)每種類(lèi)型中的話務(wù)小區(qū)進(jìn)行聚類(lèi),將每種類(lèi)型中的話務(wù)小區(qū)細(xì)化成多個(gè)具有相似聚類(lèi)特征的類(lèi)另IJ,完成對(duì)所有話務(wù)小區(qū)的分類(lèi)。其中,步驟一將話務(wù)小區(qū)分為四種類(lèi)型的方法為根據(jù)先驗(yàn)知識(shí),人為對(duì)每個(gè)話務(wù)小區(qū)所屬類(lèi)別進(jìn)行標(biāo)定。標(biāo)定的方式采用模糊隸屬函數(shù)方式給定。本方法首先根據(jù)先驗(yàn)知識(shí)將話務(wù)小區(qū)劃分為四種類(lèi)型,再將每個(gè)類(lèi)型中的話務(wù)小區(qū)通過(guò)聚類(lèi)的方式進(jìn)行細(xì)化,如將屬于繁華商業(yè)區(qū)的197個(gè)話務(wù)小區(qū)進(jìn)行聚類(lèi),繁華商業(yè)區(qū)的197個(gè)話務(wù)小區(qū)被細(xì)化成4小類(lèi)具有相似聚類(lèi)特征的類(lèi)別,這樣,細(xì)化后的每個(gè)小類(lèi)里的話務(wù)小區(qū)進(jìn)行話務(wù)量預(yù)測(cè)時(shí)可以選用相同的建模參數(shù),預(yù)測(cè)的效果好,準(zhǔn)確性高。聚類(lèi)方法的職能是建立一種分類(lèi)方法,與其它的分類(lèi)方法不同,聚類(lèi)分析是在有了一批樣本數(shù)據(jù),但不知道它們的分類(lèi),甚至連分成幾類(lèi)也不知道的情況下,希望用某種方法把樣本進(jìn)行合理的分類(lèi),使得同一類(lèi)的樣本比較接近,不同類(lèi)的樣本相差較多。聚類(lèi)方法完全根據(jù)樣本數(shù)據(jù)特征對(duì)樣本進(jìn)行分類(lèi),由于沒(méi)有有效利用樣本數(shù)據(jù)的先驗(yàn)知識(shí),雖然可以對(duì)某些問(wèn)題取得較好的效果,但是存在一定問(wèn)題。目前,在移動(dòng)通信領(lǐng)域,采用話務(wù)量數(shù)據(jù)特征,對(duì)小區(qū)的劃分研究還相對(duì)較少。但是,根據(jù)各個(gè)小區(qū)的不同特征對(duì)采取不同的管理以及調(diào)度措施,分配不同的通信信道在實(shí)際中卻有極大的實(shí)際意義。比如,可以根據(jù)不同特點(diǎn)的小區(qū)采取不同的管理機(jī)制。將物理或抽象對(duì)象的集合分組成為有類(lèi)似的對(duì)象組成的多個(gè)簇的過(guò)程被稱(chēng)為聚類(lèi)。由聚類(lèi)所生成的簇是一組數(shù)據(jù)對(duì)象的集合,這些對(duì)象與同一個(gè)簇中的對(duì)象彼此相似,與其它簇中的對(duì)象相異。在許多應(yīng)用中,可以將一個(gè)簇中的數(shù)據(jù)對(duì)象作為一個(gè)整體來(lái)對(duì)待。通俗地講,聚類(lèi)就是對(duì)包含有多個(gè)屬性的數(shù)據(jù)集進(jìn)行分類(lèi)的方法。目前在文獻(xiàn)中存在大量的聚類(lèi)算法。算法的選擇取決于數(shù)據(jù)的類(lèi)型、聚類(lèi)的目的和應(yīng)用。根據(jù)話務(wù)量數(shù)據(jù)的特點(diǎn)以及對(duì)小區(qū)進(jìn)行劃分所要達(dá)到的目的,本實(shí)施方式選取最經(jīng)典的K-MEANS聚類(lèi)算法。下面對(duì)K-MEANS算法簡(jiǎn)介如下給定一個(gè)對(duì)象或元組的數(shù)據(jù)庫(kù),一個(gè)劃分方法構(gòu)建數(shù)據(jù)的k個(gè)劃分,每個(gè)劃分表示一個(gè)聚簇,并且k<η。也就是說(shuō),它將數(shù)據(jù)劃分為k個(gè)組,同時(shí)滿足如下要求(i)每個(gè)組至少包含一個(gè)對(duì)象;(ii)每個(gè)對(duì)象必須屬于且只屬于一個(gè)組。給定要構(gòu)建的劃分?jǐn)?shù)目k,劃分方法首先創(chuàng)建一個(gè)初始劃分。然后采用一種迭代的重定位技術(shù),嘗試通過(guò)對(duì)象在劃分間移動(dòng)來(lái)改進(jìn)劃分。一個(gè)好的劃分的一般準(zhǔn)則是在同一類(lèi)中的對(duì)象之間盡可能“接近”或相關(guān),而不同類(lèi)中的對(duì)象之間盡可能“遠(yuǎn)離”或不同,還有許多其它劃分質(zhì)量評(píng)判準(zhǔn)則。為了達(dá)到全局最優(yōu),基于劃分的聚類(lèi)會(huì)要求窮舉所有可能的劃分。實(shí)際上,絕大多數(shù)應(yīng)用采用了以下比較流行的啟發(fā)式方法聚于質(zhì)心的技術(shù)——K-MEANS算法,K-MEANS算法以k為參數(shù),把η個(gè)對(duì)象分為k個(gè)簇,以使簇內(nèi)具有較高的相似度,而簇間的相似度較低。相似度的計(jì)算根據(jù)一個(gè)簇中對(duì)象的平均值來(lái)進(jìn)行,所述平均值被看作簇的中心。K-MEANS算法的處理流程如下首先,隨機(jī)地選擇k個(gè)對(duì)象,每個(gè)對(duì)象初始地代表1個(gè)簇的平均值或中心。對(duì)剩余的每個(gè)對(duì)象,根據(jù)其與各個(gè)簇中心的距離,將它賦給最近的簇。然后重新計(jì)算每個(gè)簇的平均值。這個(gè)過(guò)程不斷重復(fù),直到準(zhǔn)則函數(shù)收斂。通常采用平方誤差準(zhǔn)則,其定義如下kE=ZZ|p-mil2doi=lP=Ci這里的E是數(shù)據(jù)庫(kù)中所有對(duì)象的平方誤差的總和,ρ是空間的點(diǎn),表示給定的數(shù)據(jù)對(duì)象,Hli是簇Ci的平均值(P和Hli都是多維的)。這個(gè)準(zhǔn)則是使生成的結(jié)果簇盡可能的緊湊和獨(dú)立。假設(shè)有一個(gè)分布在空間中的對(duì)象集合,如圖2至圖4所示。給出一個(gè)具體實(shí)施例,給定k=3,即要求將這些對(duì)象聚類(lèi)為三個(gè)簇。根據(jù)K-MEANS算法,我們?nèi)我膺x擇三個(gè)對(duì)象作為初始簇的中心,簇中心在圖中用“+”來(lái)標(biāo)示。根據(jù)與簇中心的距離,每個(gè)對(duì)象分配給離其最近的一個(gè)簇。這樣分布形成如圖2中所繪的圖形。這樣的分組會(huì)改變聚類(lèi)的中心,也就是說(shuō),每個(gè)聚類(lèi)的平均值會(huì)根據(jù)類(lèi)中的對(duì)象重新計(jì)算。依據(jù)這些新的聚類(lèi)中心,對(duì)象被重新分配到各個(gè)類(lèi)中。這樣重新分配形成了圖3中描繪的輪廓。以上的過(guò)程重復(fù)產(chǎn)生了圖4的情況。最后,當(dāng)沒(méi)有對(duì)象重新分配發(fā)生時(shí),處理過(guò)程結(jié)束,聚類(lèi)的結(jié)果被返回。為了驗(yàn)證采用K-MEANS算法對(duì)小區(qū)進(jìn)行劃分的有效性,需要對(duì)每個(gè)小區(qū)話務(wù)量數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析,根據(jù)預(yù)測(cè)過(guò)程中確定的模型參數(shù)以及誤差評(píng)價(jià)指標(biāo),結(jié)合聚類(lèi)劃分結(jié)果,分析細(xì)分后的每個(gè)小區(qū)數(shù)據(jù)的在預(yù)測(cè)實(shí)驗(yàn)中的模型參數(shù)以及誤差評(píng)價(jià)指標(biāo)的特點(diǎn),即分析被劃分為同一類(lèi)的小區(qū)的模型參數(shù)以及誤差評(píng)價(jià)指標(biāo)的相似性以及不同類(lèi)小區(qū)的預(yù)測(cè)模型參數(shù)以及誤差評(píng)價(jià)的差異性,再結(jié)合先驗(yàn)知識(shí),確定使用聚類(lèi)方法進(jìn)行小區(qū)劃分的有效性。本實(shí)施方式中為了驗(yàn)證采用聚類(lèi)算法進(jìn)行小區(qū)細(xì)分的有效性,進(jìn)行話務(wù)量預(yù)測(cè)時(shí)采用乘積季節(jié)ARIMA模型,所以評(píng)價(jià)ARIMA模型的預(yù)測(cè)效果顯得尤為重要。為了全面和有效的評(píng)價(jià)ARIMA模型的預(yù)測(cè)效果,實(shí)驗(yàn)過(guò)程中采用了多個(gè)誤差評(píng)價(jià)指標(biāo)對(duì)ARIMA模型的預(yù)測(cè)效果進(jìn)行評(píng)價(jià)。1、實(shí)驗(yàn)中實(shí)際計(jì)算絕對(duì)誤差平均值pmae<formula>formulaseeoriginaldocumentpage7</formula>其中N代表預(yù)測(cè)步數(shù),本實(shí)驗(yàn)中N=24。2、實(shí)驗(yàn)中實(shí)際計(jì)算的平均相對(duì)誤差pmape<formula>formulaseeoriginaldocumentpage7</formula>(13)式中N,yi,^分別代表預(yù)測(cè)步數(shù)、話務(wù)量數(shù)據(jù)真值及其對(duì)應(yīng)的預(yù)測(cè)值。3、誤差pmapes<formula>formulaseeoriginaldocumentpage7</formula>(⑷其中,<formula>formulaseeoriginaldocumentpage7</formula>即在相對(duì)誤差的表達(dá)式中用話務(wù)量數(shù)據(jù)的平均值替代話務(wù)量數(shù)據(jù)的真值71,其中N,y”;^分別代表預(yù)測(cè)步數(shù)、話務(wù)量數(shù)據(jù)真值及其對(duì)應(yīng)的預(yù)測(cè)值。4、均方誤差pmse<formula>formulaseeoriginaldocumentpage7</formula>5、均方根誤差prmse<formula>formulaseeoriginaldocumentpage7</formula>(Π)6、歸一化均方根誤差pnrmse<formula>formulaseeoriginaldocumentpage8</formula>7、歸一化均方誤差pne<formula>formulaseeoriginaldocumentpage8</formula>實(shí)驗(yàn)中提取每個(gè)小區(qū)2008年4月內(nèi)話務(wù)量數(shù)據(jù)計(jì)算的統(tǒng)計(jì)量以及最終數(shù)據(jù)的保存格式見(jiàn)表4,表4給出數(shù)據(jù)預(yù)處理后得到的數(shù)據(jù)存儲(chǔ)格式,其中每個(gè)樣本點(diǎn)包含一個(gè)小區(qū)的小區(qū)ID屬性、話務(wù)量數(shù)據(jù)的各種統(tǒng)計(jì)量,包括相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值以及標(biāo)準(zhǔn)差等統(tǒng)計(jì)量,該數(shù)據(jù)用于后續(xù)的小區(qū)劃分實(shí)驗(yàn)。實(shí)驗(yàn)過(guò)程中,第一步從原始的話務(wù)量數(shù)據(jù)中提取出每個(gè)小區(qū)從2007年9月到2008年10月所有的話務(wù)量數(shù)據(jù),以小區(qū)為單位進(jìn)行保存。以小區(qū)為單位進(jìn)行的話務(wù)量數(shù)據(jù)的預(yù)測(cè)實(shí)驗(yàn)采用這些數(shù)據(jù)進(jìn)行。第二步以第一步保存的數(shù)據(jù)為對(duì)象,讀取每個(gè)小區(qū)2008年4月內(nèi)話務(wù)量數(shù)據(jù),計(jì)算相應(yīng)統(tǒng)計(jì)量,包括相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值以及標(biāo)準(zhǔn)差,并將數(shù)據(jù)保存到數(shù)據(jù)文件,這樣我們得到的實(shí)驗(yàn)數(shù)據(jù)就是包含每個(gè)小區(qū)2008年4月的話務(wù)量數(shù)據(jù)統(tǒng)計(jì)量的數(shù)據(jù)。數(shù)據(jù)提取工作分別采用SAS和Matlab兩種工具軟件進(jìn)行,其中第一步使用SAS軟件實(shí)現(xiàn),第二步使用Matlab軟件完成。對(duì)選定的繁華商業(yè)區(qū)類(lèi)內(nèi)的197個(gè)小區(qū)的數(shù)據(jù)進(jìn)行聚類(lèi),細(xì)化成4小類(lèi),屬于細(xì)分結(jié)果中的第1類(lèi)的共8個(gè)小區(qū),屬于細(xì)分結(jié)果中第2類(lèi)的共19個(gè)小區(qū)。第1類(lèi)和第2類(lèi)小區(qū)所獲得的實(shí)驗(yàn)結(jié)果基本相似,屬于細(xì)分結(jié)果中第3類(lèi)的共123個(gè)小區(qū)。模型參數(shù)統(tǒng)計(jì)結(jié)果如表1,誤差評(píng)價(jià)指標(biāo)統(tǒng)計(jì)結(jié)果如表3所示。表1第3類(lèi)數(shù)據(jù)模型參數(shù)選取情況<table>tableseeoriginaldocumentpage8</column></row><table>表中參數(shù)P,q,P,Q代表預(yù)測(cè)模型參數(shù),它們的取值決定ARIMA模型的階數(shù),四個(gè)參數(shù)分別可以取值為0,1,2。頻數(shù)代表某一參數(shù)取對(duì)應(yīng)值的個(gè)數(shù),比如P=1所對(duì)應(yīng)的頻數(shù)值為59的含義是在整個(gè)123個(gè)小區(qū)中,最終預(yù)測(cè)模型中ρ=1的共有59次,%—項(xiàng)為對(duì)應(yīng)的百分比,以上例子為100X59/123。從表1中數(shù)據(jù)可以看出參數(shù)P和Q取值相對(duì)穩(wěn)定,而P和q取值則不具有穩(wěn)定性。屬于第4類(lèi)的共47個(gè)小區(qū)。模型參數(shù)統(tǒng)計(jì)結(jié)果如表2所示表2第4類(lèi)數(shù)據(jù)模型參數(shù)選取情況<table>tableseeoriginaldocumentpage9</column></row><table>表2中各數(shù)值含義與表1相同。從表2中數(shù)據(jù)可以看出參數(shù)P和Q取值相對(duì)穩(wěn)定,而P和q取值則不具有穩(wěn)定性。說(shuō)明在選擇聚類(lèi)數(shù)目時(shí)應(yīng)該加以注意。但通過(guò)以上分析,我們發(fā)現(xiàn)在同一類(lèi)數(shù)據(jù)中,預(yù)測(cè)模型的P和Q參數(shù)確實(shí)具有一定的穩(wěn)定性,說(shuō)明可以通過(guò)聚類(lèi)方法確定某些模型參數(shù)。表3各類(lèi)數(shù)據(jù)預(yù)測(cè)誤差平均值<table>tableseeoriginaldocumentpage9</column></row><table>表3給出的是4類(lèi)數(shù)據(jù)的預(yù)測(cè)誤差評(píng)價(jià)的平均值。結(jié)合表2數(shù)據(jù)表,可以看出第3類(lèi)數(shù)據(jù)和第4類(lèi)數(shù)據(jù)預(yù)測(cè)誤差評(píng)價(jià)指標(biāo)明顯小于第1類(lèi)和第2類(lèi)數(shù)據(jù),說(shuō)明第1類(lèi)和第2類(lèi)數(shù)據(jù)需要更高階模型或者需要改用其它預(yù)測(cè)模型才有可能給出更加準(zhǔn)確的預(yù)測(cè)。說(shuō)明聚類(lèi)方法在確定預(yù)測(cè)模型階數(shù)時(shí)確實(shí)具有一定的指導(dǎo)意義。表4<table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>表5<table>tableseeoriginaldocumentpage16</column></row><table><table>tableseeoriginaldocumentpage17</column></row><table><table>tableseeoriginaldocumentpage18</column></row><table><table>tableseeoriginaldocumentpage19</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table>權(quán)利要求一種應(yīng)用K-MEANS和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法,其特征在于,該方法包括以下步驟步驟一、按照先驗(yàn)知識(shí)將話務(wù)小區(qū)劃分為四種類(lèi)型,所述四種類(lèi)型分別為交通主干線、繁華商業(yè)區(qū)、高等院校和居民住宅區(qū);步驟二、對(duì)每種類(lèi)型中的每個(gè)話務(wù)小區(qū)的話務(wù)數(shù)據(jù)進(jìn)行預(yù)處理,獲取每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,所述聚類(lèi)特征包括相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值和標(biāo)準(zhǔn)差;步驟三、根據(jù)每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,并采用K-MEANS聚類(lèi)算法依次對(duì)每種類(lèi)型中的話務(wù)小區(qū)進(jìn)行聚類(lèi),將每種類(lèi)型中的話務(wù)小區(qū)細(xì)化成多個(gè)具有相似聚類(lèi)特征的類(lèi)別,完成對(duì)所有話務(wù)小區(qū)的分類(lèi)。2.根據(jù)權(quán)利要求1所述的一種應(yīng)用K-MEANS和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法,其特征在于,步驟一將話務(wù)小區(qū)分為四種類(lèi)型的方法為根據(jù)先驗(yàn)知識(shí),人為對(duì)每個(gè)話務(wù)小區(qū)所屬類(lèi)別進(jìn)行標(biāo)定。3.根據(jù)權(quán)利要求2所述的一種應(yīng)用K-MEANS和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法,其特征在于,標(biāo)定的方式采用模糊隸屬函數(shù)方式給定。全文摘要一種應(yīng)用K-MEANS和先驗(yàn)知識(shí)的話務(wù)小區(qū)自適應(yīng)分類(lèi)方法,屬于移動(dòng)通信領(lǐng)域,本發(fā)明是為了解決進(jìn)行話務(wù)量預(yù)測(cè)時(shí),根據(jù)專(zhuān)家的歷史經(jīng)驗(yàn)對(duì)話務(wù)小區(qū)進(jìn)行劃分的方式帶有很大的主觀性、劃分不準(zhǔn)確的問(wèn)題。本發(fā)明方法包括一、按照先驗(yàn)知識(shí)將話務(wù)小區(qū)劃分為四種類(lèi)型交通主干線、繁華商業(yè)區(qū)、高等院校和居民住宅區(qū);二、預(yù)處理,獲取每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,所述聚類(lèi)特征包括相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值和標(biāo)準(zhǔn)差;三、根據(jù)每個(gè)話務(wù)小區(qū)的聚類(lèi)特征,并采用K-MEANS聚類(lèi)算法依次對(duì)每種類(lèi)型中的話務(wù)小區(qū)進(jìn)行聚類(lèi),將每種類(lèi)型中的話務(wù)小區(qū)細(xì)化成多個(gè)具有相似聚類(lèi)特征的類(lèi)別,完成對(duì)所有話務(wù)小區(qū)的分類(lèi)。文檔編號(hào)H04W16/22GK101808339SQ201010139258公開(kāi)日2010年8月18日申請(qǐng)日期2010年4月6日優(yōu)先權(quán)日2010年4月6日發(fā)明者劉大同,彭宇,王少軍,王建民,郭嘉,雷苗申請(qǐng)人:哈爾濱工業(yè)大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1