本發(fā)明屬于智能樓宇微網(wǎng)用電技術(shù)領(lǐng)域,涉及一種智能樓宇微網(wǎng)用電行為的識別方法。
背景技術(shù):
隨著智能電網(wǎng)的不斷建設(shè)和發(fā)展,用戶用電數(shù)據(jù)逐漸積累成大數(shù)據(jù),雖然這些用電大數(shù)據(jù)中看似十分混亂,但是卻隱藏著用戶用電行為方式,并且數(shù)據(jù)之間也存在著一定聯(lián)系。對散亂的海量數(shù)據(jù)進(jìn)行挖掘并識別出用戶用電行為類型,可以幫助電網(wǎng)了解用戶的個性化、差異化服務(wù)需求,為電網(wǎng)對智能樓宇微網(wǎng)用電負(fù)荷調(diào)度提供依據(jù)和參考,進(jìn)而促進(jìn)居民生活節(jié)約用電減少費(fèi)電行為。
目前,一些研究人員將用戶用電負(fù)荷分解為基本負(fù)荷和季節(jié)性負(fù)荷,采用基于自適應(yīng)模糊c均值聚類算法對用戶基本負(fù)荷和季節(jié)性負(fù)荷進(jìn)行聚類分析,但是在實(shí)際應(yīng)用中某些用戶使用用電總負(fù)荷一樣,然而基本負(fù)荷和所用設(shè)備也不盡相同,進(jìn)行用戶用電行為不能做到高精度識別分類;另外其他學(xué)者采用熵權(quán)法計算用戶用電特征信息熵和權(quán)重,然后在通過聚類算法對用戶進(jìn)行聚類分析,但是該方法不能從總體上計算用戶用電行為的概率,在判斷用戶用電行為準(zhǔn)確性上存在著不足。
核主元分析法是一種非線性數(shù)據(jù)處理方法,核主元分析法在主元分析的基礎(chǔ)上借助核函數(shù)來完成非線性變換,將原始數(shù)據(jù)映射到高維線性特征空間,在特征空間中利用主元分析方法進(jìn)行特征提取。與其他非線性主元分析方法相比,核主元分析法具有標(biāo)準(zhǔn)主元分析簡單的特點(diǎn),求解過程中沒有非線性優(yōu)化,只需利用線性代數(shù)求解特征值問題,目前已經(jīng)在入侵檢測、圖像處理、過程監(jiān)控、故障診斷等領(lǐng)域得到了成功應(yīng)用。多變量多尺度樣本熵在多變量隨機(jī)序列的mmse值在高尺度上急劇下降,而多變量混沌序列在高尺度上仍具有很高的mmse結(jié)果,自其提出以來,mmse已在物理、生理等多種領(lǐng)域中獲得應(yīng)用。模糊c-均值算法,是大數(shù)據(jù)應(yīng)用最廣泛的模糊聚類方法之一,該算法的優(yōu)點(diǎn)是理解簡單,收斂速度快,局部搜索能力強(qiáng),適用于大型數(shù)據(jù)集。本發(fā)明在模糊c均值聚類模型中引入多變量多尺度樣本熵權(quán)的權(quán)重,從而提高模型的精確度和降低算法運(yùn)行時間。
技術(shù)實(shí)現(xiàn)要素:
針對上述智能樓宇微網(wǎng)用電大數(shù)據(jù)中用電設(shè)備電氣特征參數(shù)提取,對用戶用電行為進(jìn)行識別判定,本發(fā)明公開了一種智能樓宇微網(wǎng)用電行為的識別方法,該方法通過對智能樓宇微網(wǎng)用電數(shù)據(jù)采集終端獲的用電大數(shù)據(jù)進(jìn)行家用電器設(shè)備負(fù)荷特征參數(shù)提取,特征分析選擇及權(quán)重計算,便可以降低特征維度,從而提高模糊聚類分析模型的精確度和降低算法運(yùn)行時間,該方法有效的識別出用戶用電行為。
本發(fā)明的特點(diǎn)首先是對通過wifi樓宇微網(wǎng)用電數(shù)據(jù)采集終端獲得用電大數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后對預(yù)處理后的數(shù)據(jù)樣本運(yùn)用核主元分析法提取各用電器設(shè)備的負(fù)荷特征參數(shù),不同的用電器設(shè)備用電功率、電壓、電流等各不相同并表現(xiàn)出不同的特征。從用電數(shù)據(jù)樣本中區(qū)分各用電設(shè)備,具體提取電氣特征參數(shù)包括:電壓諧波特征、電流諧波特征、電流諧波畸變率、功率曲線特征、啟動時產(chǎn)生的負(fù)荷和啟動時間的特征、溫度、濕度、空氣指數(shù)等特征參數(shù);然后利用多變量多尺度樣本熵權(quán)方法確定用戶各用電行為特征的環(huán)境因素和不同用電設(shè)備的貢獻(xiàn)率(即為模糊c-均值聚類的各影響因素的特征權(quán)重),最后通過模糊c均值聚類法對獲得的特征數(shù)據(jù)組進(jìn)行聚類分析,提高了用戶用電行為識別的準(zhǔn)確性和快速性。
本發(fā)明的具體通過如下方案實(shí)現(xiàn):
1)通過wifi用戶采集終端模塊獲取智能樓宇微網(wǎng)用電設(shè)備用電大數(shù)據(jù),主要包括:實(shí)時電壓、電壓有效值、實(shí)時電流、電流有效值、實(shí)時功率、功率因數(shù)、啟動電壓和電流、啟動時產(chǎn)生的負(fù)荷、啟動時間、用電設(shè)備的溫度等大數(shù)據(jù);通過各傳感器監(jiān)測外界環(huán)境數(shù)據(jù),主要包括:環(huán)境溫度、環(huán)境濕度、空氣指數(shù)、風(fēng)速、氣壓、用戶用電習(xí)慣、用戶生活水平等數(shù)據(jù)。
2)對上述步驟1)中所獲得的各個用電設(shè)備的用電數(shù)據(jù)進(jìn)行預(yù)處理,并對不同屬性數(shù)據(jù)構(gòu)建子陣xi,進(jìn)而對采集到的用電大數(shù)據(jù)構(gòu)建出數(shù)據(jù)增廣矩陣x(m):
然后按列分解成(n+1)個子陣,即包含n+1個設(shè)備的用電數(shù)據(jù)。
3)運(yùn)用核主元分析法提取各用電設(shè)備特征向量組集t(n),其中特征向量組集矩陣包括電壓、電流、電壓諧波特征、電流諧波特征、電流諧波畸變率、有功功率、無功功功率、功率曲線特征、功率因數(shù)、啟動時產(chǎn)生的負(fù)荷、啟動時間的特征、溫度、濕度、空氣指數(shù)。
核主元分析模型把預(yù)處理后的用電數(shù)據(jù)矩陣x(n)經(jīng)過核函數(shù)一一映射到更高維度的特征空間,在特征空間內(nèi)對輸入用電數(shù)據(jù)的各子陣進(jìn)行線性核主元分析,并提取用電器設(shè)備的非線性特征參數(shù),獲取各用電器設(shè)備識別能力強(qiáng)的主要特征參數(shù)。
4)利用相關(guān)性分析模塊對步驟3所得到的特征數(shù)據(jù)組集采用多變量多尺度樣本熵法計算熵權(quán)。
將步驟3)中提取的狀態(tài)量的特征參數(shù)進(jìn)行標(biāo)準(zhǔn)化并獲得時間序列向量xm={xm1,xm2,...,xmn,…,xmn},m=1,2,…,m,m代表不同通道獲得的特征狀態(tài)量,n為檢測數(shù)據(jù)的數(shù)量。根據(jù)尺度因子τ對各特征狀態(tài)量時間序列進(jìn)行粗粒變換,由式(2)得不同尺度的時間序列
式中1≤i≤n/τ,對m個狀態(tài)量粗?;蟮臅r間序列yim進(jìn)行多維時延嵌入重構(gòu),得復(fù)合延遲向量:
式中d=[d1,d2,…,dm,…,dm]是嵌入維數(shù)向量,λ=[λ1,λ2,…,λm,…,λm]是時間間隔向量用于壓縮監(jiān)測狀態(tài)量的數(shù)據(jù),
由式(4)得每一個向量與所有向量
由式(5)計算得不同距離
式中r為兩兩向量之間相似性系數(shù)。
根據(jù)式(6)計算不同狀態(tài)量之間的相似概率
根據(jù)式(7)計算得智能微網(wǎng)多通道監(jiān)測數(shù)據(jù)的多變量多尺度樣本熵權(quán)值為
在一定的智能微網(wǎng)用戶用電行為條件下同一時間的多變量多尺度樣本熵權(quán)權(quán)重ma越高,該用電行為對應(yīng)的多通道數(shù)據(jù)復(fù)雜度和相關(guān)性越強(qiáng),進(jìn)而確定用電行為特征的環(huán)境因素和不同用電設(shè)備貢獻(xiàn)率。
4)利用多變量多尺度樣本熵權(quán)的模糊c-均值聚類算法建立多變量多尺度樣本熵權(quán)的模糊c均值聚類模型,根據(jù)此模型進(jìn)行智能樓宇微網(wǎng)用電行為進(jìn)行分類識別
多變量多尺度樣本熵權(quán)的模糊c-均值聚類模型將經(jīng)過步驟3)核主元分析提取的各用電設(shè)備狀態(tài)量的特征向量組數(shù)據(jù)樣本劃分為若干個模糊類,通過多變量多尺度樣本熵權(quán)的模糊c-均值聚類模型,根據(jù)上述步驟4)求得的多變量多尺度樣本熵權(quán)ma確定各影響因素的貢獻(xiàn)率,增加可分性好的屬性權(quán)重,并運(yùn)用模糊c-均值聚類算法得到的最優(yōu)聚類中心、各個特征屬性的熵值和權(quán)重、隸屬度矩陣;通過模糊c均值聚類模型并引入多變量多尺度樣本熵權(quán)權(quán)重不斷迭代步驟完成對用電行為進(jìn)行聚類識別。
本發(fā)明提出的基于核主元分析和多變量多尺度樣本熵權(quán)模糊c-均值聚類的智能樓宇微網(wǎng)用電行為識別方法具有以下優(yōu)良的效果:
1)通過智能樓宇微網(wǎng)多通道用電信息實(shí)時采集平臺獲取各個用電設(shè)備用電大數(shù)據(jù),充分考慮了多變量因素對用戶用電行為的影響,提高了用戶用電行為識別的準(zhǔn)確度。
2)運(yùn)用核主元分析方法在特征提取方面的優(yōu)勢,對智能樓宇微網(wǎng)用戶用電行為的影響因素進(jìn)行處理,并提取各影響因素的特征數(shù)據(jù)。
3)利用多變量多尺度樣本熵權(quán)方法確定用戶各用電行為特征的環(huán)境因素和不同用電設(shè)備貢獻(xiàn)率,基于上述所求的多變量多尺度樣本熵權(quán)貢獻(xiàn)率作為模糊c-均值聚類的各影響因素的特征權(quán)重,提高了模糊c-均值聚類結(jié)果的準(zhǔn)確性和快速性。
附圖說明
圖1是本發(fā)明智能樓宇微網(wǎng)用電行為識別方法的結(jié)構(gòu)框圖
圖2是本發(fā)明智能樓宇微網(wǎng)用電行為識別方法的原理框圖。
具體實(shí)施方式
以下結(jié)合附圖和具體實(shí)施過程對本發(fā)明進(jìn)一步的說明。
如圖1所示通過智能樓宇微網(wǎng)用電數(shù)據(jù)采集終端和環(huán)境各傳感器監(jiān)測獲得用電大數(shù)據(jù);然后對獲得數(shù)據(jù)進(jìn)行預(yù)處理(數(shù)據(jù)整合、數(shù)據(jù)填充、特征規(guī)范化);利用核主元分析法對預(yù)處理后的數(shù)據(jù)樣本提取各用電設(shè)備的負(fù)荷特征參數(shù),不同的用電器設(shè)備用電功率、電壓、電流等各不相同并表現(xiàn)出不同的特征,進(jìn)而可以從提取的用電數(shù)據(jù)特征中區(qū)分各用電設(shè)備;然后利用多變量多尺度樣本熵權(quán)方法確定用戶各用電行為特征的環(huán)境因素和不同用電設(shè)備的貢獻(xiàn)率(即為模糊c-均值聚類的各影響因素的特征權(quán)重);最后通過模糊c均值聚類法對獲得的特征數(shù)據(jù)組進(jìn)行聚類分析,提高了用戶用電行為識別的準(zhǔn)確性和快速性。
如圖2所示本發(fā)明的智能樓宇微網(wǎng)用電行為的識別方法的具體實(shí)施過程如下:
1)智能樓宇微網(wǎng)用電設(shè)備和環(huán)境因素的大數(shù)據(jù)采集
通過wifi用戶采集終端模塊獲取智能樓宇微網(wǎng)用電設(shè)備用電大數(shù)據(jù),主要包括:實(shí)時電壓、電壓有效值、實(shí)時電流、電流有效值、實(shí)時功率、功率因數(shù)、啟動電壓和電流、啟動時產(chǎn)生的負(fù)荷、啟動時間、用電設(shè)備的溫度等大數(shù)據(jù);通過各傳感器監(jiān)測外界環(huán)境數(shù)據(jù),主要包括:環(huán)境溫度、環(huán)境濕度、空氣指數(shù)、風(fēng)速、氣壓、用戶用電習(xí)慣、用戶生活水平等數(shù)據(jù)。
2)針對上述步驟1)獲得的數(shù)據(jù)進(jìn)行預(yù)處理,主要包括對原始數(shù)據(jù)中用戶用電若干特征的數(shù)據(jù)缺失(為空值)或明顯異常的數(shù)據(jù)(如用電量為負(fù)數(shù))進(jìn)行數(shù)據(jù)填充;對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)規(guī)范化處理。
對各個用電設(shè)備的用電數(shù)據(jù)建立組成子陣xi,進(jìn)而對采集到的用電設(shè)備用電大數(shù)據(jù)構(gòu)建出數(shù)據(jù)增廣矩陣x(m)
然后按列分解成m個子陣,即包含m個設(shè)備的用電數(shù)據(jù),p為用電設(shè)備的狀態(tài)量。
3)利用核主元分析法對經(jīng)步驟2)預(yù)處理后的數(shù)據(jù)提取各用電設(shè)備特征向量組集t(k),其中特征向量組集矩陣包括電壓有效值、電流有效值、電壓諧波特征、電流諧波特征、電流諧波畸變率、有功功率、無功功功率、功率曲線特征、功率因數(shù)、啟動電壓和電流、啟動時產(chǎn)生的負(fù)荷、啟動時間的特征、用電設(shè)備溫度等。
核主元分析法是主元特征分析的非線性推廣,通過一個非線性變換ф,將輸入數(shù)據(jù)空間中的m個子陣的樣本xi(k=1,2,…,,m),映射到高維特征空間f中,得到高維空間的樣本點(diǎn)ф(x1),ф(x2),…,ф(xm),然后在高維空間使用主元分析提取更好的可分性的非線性主元特征,實(shí)現(xiàn)非線性數(shù)據(jù)降維,進(jìn)而實(shí)現(xiàn)各用電設(shè)備特征參數(shù)的提取,獲取各用電設(shè)備分類的主要特征向量組集。
根據(jù)式(1)數(shù)據(jù)預(yù)處理得到的增廣矩陣x(m),然后按列分解成(m+1)個子陣,然后計算每個子陣各自的核矩陣(k1,k2,…,km+1)
映射后數(shù)據(jù)的協(xié)方差矩陣cf為:
其中ф是映射函數(shù),s是個狀態(tài)量數(shù)據(jù)個數(shù),
根據(jù)式(3)對cf進(jìn)行特征分解并標(biāo)準(zhǔn)化特征向量
求解式(3)中的特征值λ(λ≥0)和特征向量v,并將映射后的每個樣本與式(3)做內(nèi)積處理,進(jìn)而有
式(4)中的v可用線性組合表示如下:
其中αi是相關(guān)系數(shù),將(2),(5)帶入式(3)中得:
定義對稱核矩陣k為:
因k是對稱矩陣,上式可簡化為:
sλα=kα(8)
本發(fā)明選擇高斯徑向基核函數(shù)即:
通過上述的求解,可得到所要求的的特征值和特征向量,歸一化特征向量,確定各子陣的主元數(shù)目,取li的最大值l作為主元數(shù)目,根據(jù)式(10)計算各個子陣特征向量vi(i=1,2,…,p)在各自特征空間上的投影,即得各子陣的主元矩陣(t1,t2,…,tm),
進(jìn)而通過核主元分析所提取的各用電設(shè)備特征向量組數(shù)據(jù)為(t1,t2,…,tm)
4)利用相關(guān)性分析模塊對步驟3所得到的特征數(shù)據(jù)組集采用多變量多尺度樣本熵法計算熵權(quán),在一定的智能微網(wǎng)用戶用電行為條件下同一時間的多變量多尺度樣本熵權(quán)權(quán)重ma越高,該用電行為對應(yīng)的多通道數(shù)據(jù)復(fù)雜度和相關(guān)性越強(qiáng),進(jìn)而確定用電行為特征的環(huán)境因素和不同用電設(shè)備貢獻(xiàn)率。
將步驟3)中提取的狀態(tài)量的特征數(shù)據(jù)參數(shù)進(jìn)行標(biāo)準(zhǔn)化,并進(jìn)行時間序列向量tm={tm1,tm2,...,tmn,…,tmn},m=1,2,…,m,m代表不同通道獲得的特征狀態(tài)量,n為獲得特征數(shù)據(jù)的數(shù)量。根據(jù)尺度因子τ對各特征狀態(tài)量時間序列進(jìn)行粗粒變換,由式(11)得不同尺度的時間序列
其中1≤i≤n/τ,對m個狀態(tài)量粗粒化后的時間序列yim進(jìn)行多維時延嵌入重構(gòu),得復(fù)合延遲向量:
其中d=[d1,d2,…,dm,…,dm]是嵌入維數(shù)向量,λ=[λ1,λ2,…,λm,…,λm]是時間間隔向量用于壓縮監(jiān)測狀態(tài)量的數(shù)據(jù),
由式(13)得每一個向量
由式(14)計算得不同距離
式中r為兩兩向量之間相似性系數(shù)。
根據(jù)式(15)計算不同狀態(tài)量之間的相似概率
根據(jù)(16)式計算得智能微網(wǎng)多通道監(jiān)測數(shù)據(jù)的多變量多尺度樣本熵權(quán)值為
5)利用模糊c-均值聚類算法建立模糊c-均值聚類模型,然后運(yùn)用該模型識別用戶用電行為:
根據(jù)上述步驟3)得到的智能樓宇微網(wǎng)各用電設(shè)備特征向量組數(shù)據(jù)矩陣
fcm算法的目標(biāo)函數(shù)建立如下:
本發(fā)明引入拉格朗日乘子的目標(biāo)函數(shù)如下:
其中,
模糊聚類第j組樣本的聚類中心選擇
通過不斷迭代調(diào)整使目標(biāo)函數(shù)小于類別區(qū)分精度ε,進(jìn)而完成對所有智能樓宇微網(wǎng)用戶用電行為的識別分類。
本發(fā)明構(gòu)建的基于核主元分析和多變量多尺度樣本熵權(quán)模糊c-均值聚類相結(jié)合的智能樓宇微網(wǎng)用戶用電行為識別模型訓(xùn)練實(shí)施步驟如下:
step1選取wifi智能樓宇微網(wǎng)用電數(shù)據(jù)采集終端和環(huán)境各傳感器監(jiān)測獲得用電樣本大數(shù)據(jù),并對樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理。
step2對各個用電設(shè)備的用電數(shù)據(jù)建立組成子陣xi,利用公式(1)對經(jīng)過預(yù)處理后的用電設(shè)備用電大數(shù)據(jù)構(gòu)建出數(shù)據(jù)增廣矩陣x(m)。
step3利用式(9)計算各個子陣核矩陣(k1,k2,…,km+1),并根據(jù)式(2)進(jìn)行中心化得(k*1,k*2,…,k*m+1)。
step4根據(jù)式(8)分別對各個中心化后子陣的核矩陣進(jìn)行特征分解,并標(biāo)準(zhǔn)化特征量α。
step5根據(jù)式(10)計算各個子陣特征向量在各自特征空間上的投影,得到各個子陣的主元矩陣
step6利用式(16)多變量多尺度樣本熵權(quán)算法計算用戶用電行為特征的環(huán)境因素和用電設(shè)備的多變量多尺度貢獻(xiàn)率ma。
step7確定用電行為類的個數(shù)c,初始化聚類中心v0、模糊權(quán)重指數(shù)n和隸屬度矩陣u0
step8將聚類中心vj和step6求得的多變量多尺度影響因素的貢獻(xiàn)率ma帶入公式(19)得到新的隸屬度矩陣uij。
step9將上述得到的隸屬度矩陣uij和step6求得的多變量多尺度影響因素的貢獻(xiàn)率ma帶入式(20)得到新的聚類中心vj。
step10根據(jù)式(18)計算目標(biāo)函數(shù)值,通過不斷迭代調(diào)整使目標(biāo)函數(shù)小于類別區(qū)分精度ε>0,并計算相鄰兩聚類中心的距離e,若原聚類中心與更新后的聚類中心之間的距離e小于ε,則迭代停止,否則轉(zhuǎn)至step8。
通過上述步驟不斷迭代,運(yùn)用核主元分析法和多變量多尺度熵權(quán)模糊c-均值聚類模型進(jìn)而可以精準(zhǔn)的完成對智能樓宇微網(wǎng)用戶用電行為的識別。