本發(fā)明涉及大數(shù)據(jù)的數(shù)據(jù)填補領(lǐng)域,具體講涉及一種電網(wǎng)用戶用電功率曲線數(shù)據(jù)填補方法和裝置。
背景技術(shù):
隨著大數(shù)據(jù)時代的到來和電力系統(tǒng)信息化程度的不斷提高,電力大數(shù)據(jù)呈爆炸式增長,且種類也越來越多?,F(xiàn)有電力系統(tǒng)分析中多用采集的數(shù)據(jù)建立模型實現(xiàn)用戶用電分析,對后續(xù)竊電檢測、負荷預(yù)測等提供幫助,對智能電網(wǎng)業(yè)務(wù)模式創(chuàng)新和發(fā)展極為重要。
電力系統(tǒng)中的各類數(shù)據(jù)的監(jiān)控與采集是電力系統(tǒng)調(diào)度運行、安全穩(wěn)定分析、設(shè)備狀態(tài)與風(fēng)險評估的基礎(chǔ)。然而,在電力系統(tǒng)的實際運行中,由于數(shù)據(jù)采集通道錯誤、遠程終端單元故障等原因會導(dǎo)致觀測數(shù)據(jù)出現(xiàn)反常態(tài)勢,與大多數(shù)觀測值不一致,此外由于線路的檢修、切負荷停電和大事件沖擊有可能會導(dǎo)致觀測數(shù)據(jù)違背常規(guī),使電力系統(tǒng)數(shù)據(jù)對智能電網(wǎng)系統(tǒng)的分析造成困難,因此在數(shù)據(jù)分析前需采用一種數(shù)據(jù)補充方法將缺失的數(shù)據(jù)補充完整,提高電力系統(tǒng)數(shù)據(jù)分析的準確性和曲線類數(shù)據(jù)的可用性,為后續(xù)分析提供支持。
技術(shù)實現(xiàn)要素:
為滿足現(xiàn)有技術(shù)發(fā)展的需要,本發(fā)明提供了一種電網(wǎng)用戶用電功率曲線數(shù)據(jù)填補方法。
本發(fā)明提供的電網(wǎng)用戶用電功率曲線數(shù)據(jù)填補方法,其改進之處在于,所述方法包括:
根據(jù)臺區(qū)線路T的狀態(tài)估計線損率,并根據(jù)用戶日曲線狀態(tài)估計缺失的用戶功率;
微調(diào)線損率估計值和缺失的用戶功率估計值。
進一步的,所述線損率的估計包括:
按下式計算樣本Rdm在時刻(d,m)∈G時的線損率rdm0:
其中,樣本Rdm=[rdm1,rdm2,…,rdmN],PdmT:臺區(qū)總功率;rdmn:用戶n在d天時刻m的功率占臺區(qū)總功率的比率,Pdmn:用戶n的功率;Pdm0:線損功率;N:臺區(qū)下的用戶數(shù)目;n:用戶編號,為從1到N的整數(shù);時刻(d,m):第d天的時刻m的記錄,d∈D,D:記錄日的集合;m∈M,M:記錄時刻的集合;G:臺區(qū)所有用戶功率記錄的時刻集合。
進一步的,所述線損率的估計包括:
時刻樣本Rdm不完整,則通過“城市塊距離”的K-近鄰算法在u個用戶有記錄的數(shù)據(jù)中節(jié)選最近的k1個樣本按下式估計樣本Rdm的線損率
式中,i:天數(shù),i∈D;j:時刻數(shù),j∈M;n1,n2,…,nu:表示u個用戶;第i天第j時刻用戶nu的功率占臺區(qū)總功率的比率;u個用戶在第i天第j時刻的線損率。
進一步的,所述缺失的用戶功率的估計包括:
設(shè)第d天用戶n的功率日曲線記錄為Ldn=[Pd1n,Pd2n,…,PdMn],在時刻通過“相關(guān)性距離”的K-近鄰算法在第i天用戶t的功率日曲線記錄中節(jié)選相關(guān)性最大的k2個樣本按下式估計缺失的用戶功率數(shù)據(jù)
式中,ml:采集數(shù)據(jù)的時刻;第i天t個用戶記錄mw時刻點的功率,w=1,2,3…,l;l:樣本數(shù)量;
進一步的,在所述微調(diào)前,根據(jù)用戶功率記錄和估計的線損率按下式估計缺失功率的總和
其中,e:記錄了功率的用戶n1,n2,…,nu;f:缺失功率記錄的用戶q1,q2,…,qv;有不完整記錄時刻時,樣本Rdm的線損率。
進一步的,所述微調(diào)包括:
在時刻選擇k2個中的值作為需要填補的的估計值分別計算并與比較,設(shè)差值最小的為
進一步的,計算線損率設(shè)置閾值r1,r2并與比較,確定最終估計的線損率:
若則線損率的估計值為
若則線損率的估計值為
若則線損率的估計值為
進一步的,根據(jù)估計的線損率按下式計算缺失用戶功率的和
對估計的用戶功率按比例縮放,得最終的缺失功率估計
一種電網(wǎng)用戶用電功率曲線的數(shù)據(jù)填補裝置,所述裝置包括:
估計單元,用于根據(jù)臺區(qū)線路T的狀態(tài)估計線損率,并根據(jù)用戶日曲線狀態(tài)估計缺失的用戶功率數(shù)據(jù);
調(diào)節(jié)單元,用于微調(diào)線損率估計和缺失的用戶功率估計,完成缺失數(shù)據(jù)的填補。
進一步的,所述估計單元包括:
第一估計子單元,用于根據(jù)臺區(qū)線路T的狀態(tài)估計線損率;
第二估計子單元,用于根據(jù)用戶日曲線狀態(tài)估計缺失的用戶功率數(shù)據(jù);
所述調(diào)節(jié)單元包括:
第一調(diào)節(jié)子單元,用于根據(jù)設(shè)置的閾值和修正的線損率確定線損率的最終估計值;
第二調(diào)節(jié)子單元,用于根據(jù)線損率的最終估計值計算缺失用戶功率值的最終估計值。
與最接近的現(xiàn)有技術(shù)比,本發(fā)明提供的技術(shù)方案具有以下優(yōu)異效果:
(1)本發(fā)明提供的技術(shù)方案不對臺區(qū)狀態(tài)進行分類即可估計線路線損,可通過近鄰算法快速便捷的找到狀態(tài)最接近的臺區(qū)時刻;不必對用戶日曲線進行用電行為分類,可直接匹配最相似的日曲線進行缺失功率數(shù)據(jù)填補,有效提高數(shù)據(jù)填補的準確性和實效性,為電力系統(tǒng)數(shù)據(jù)分析提供數(shù)據(jù)支撐。
(2)本發(fā)明提供的技術(shù)方案用橫縱結(jié)合的方式,通過兩個維度方向分別對狀態(tài)和缺失數(shù)據(jù)進行估計,并綜合考慮進行微調(diào),能夠得到更優(yōu)更穩(wěn)健的結(jié)果,能有效提高曲線數(shù)據(jù)填補的正確性。
附圖說明
圖1為本發(fā)明提供的數(shù)據(jù)填補方法流程圖;
圖2為本發(fā)明提供的對缺失率和線損率微調(diào)的細節(jié)圖。
具體實施方式
以下將結(jié)合說明書附圖,以具體實施例的方式詳細介紹本發(fā)明提供的技術(shù)方案。
本發(fā)明提供的技術(shù)方案針對電網(wǎng)臺區(qū)用戶的用電曲線類數(shù)據(jù)的缺失問題,進行數(shù)據(jù)填補。在用電用戶的電流、功率等曲線類數(shù)據(jù)的采集過程中,通常會出現(xiàn)缺失現(xiàn)象,以功率曲線類數(shù)據(jù)為例,本發(fā)明提供的技術(shù)方案包括:
已知一個電網(wǎng)單相臺區(qū)或多相臺區(qū)的某一相線T,下面接有N個用電用戶C1,C2,…,CN。智能電表每隔一定時間t0分鐘記錄臺區(qū)和每個用戶的功率,每天記錄M點,其中M×t0=1440,共連續(xù)記錄D天,即M×D個記錄時刻的數(shù)據(jù)。對時刻(d,m),即第d天的第m時刻的記錄,T的輸出功率為PdmT,為全部已知;N個用戶的功率分別為Pdm1,Pdm2,…,PdmN,為全部已知或部分已知;線損功率為Pdm0≥0,并滿足Pdm0=PdmT-(Pdm1+Pdm2+…+PdmN),當臺區(qū)所有用戶的功率都已知時,可以通過計算得到線損。問題需求就是要填補缺失部分的用戶功率數(shù)據(jù)Pdmn。
本發(fā)明提供的電網(wǎng)用戶用電功率曲線數(shù)據(jù)缺失的填補方法基于K-近鄰算法,該方法中,為防止出現(xiàn)分母為0的情況,僅對臺區(qū)總功率PdmT>0的記錄進行后續(xù)工作,對于總功率PdmT=0的記錄,下面所有缺失的用戶功率全部記為0。首先通過估計臺區(qū)T的狀態(tài)來估計線損率,然后通過估計用戶日曲線的狀態(tài)來估計缺失的用戶功率數(shù)據(jù),技術(shù)路線圖如附圖1所示,具體流程如下:
(1)根據(jù)臺區(qū)線路T的狀態(tài)估計線損率rdm0
對于時刻(d,m)的功率記錄,用戶n的功率占臺區(qū)總功率的比率為通過每個用戶功率占臺區(qū)總功率的比率來估計當前時刻的線損率,具體細節(jié)如下:
設(shè)時刻(d,m)對應(yīng)的樣本數(shù)據(jù)為Rdm=[rdm1,rdm2,…,rdmN],其中N表示用電用戶數(shù)量,設(shè)G是臺區(qū)所有用戶功率記錄完整的時刻集合,即對于時刻(d,m)∈G,臺區(qū)下所有用戶的功率都已知,所以此時樣本數(shù)據(jù)Rdm是完整的,線損率可按下式計算得到:
將{(Rij,rij0)|(i,j)∈}作為已知的(樣本,線損率)集合,其中,i:天數(shù),i∈D;j:時刻,j∈M。
而對于時刻臺區(qū)下用戶功率記錄不完整,因此樣本Rdm不完整,線損率未知,下面對Rdm進行線損率估計。設(shè)某時刻記錄了u個用戶n1,n2,…,nu的功率,節(jié)選Rdm中有記錄的部分并對所有已知樣本進行相同的節(jié)選操作,通過“城市塊距離”的K-近鄰方法,在節(jié)選的已知樣本中尋找最近的k1個節(jié)選樣本用它們對應(yīng)的原樣本的線損率的算術(shù)平均值來對樣本Rdm的線損率進行初步估計,即
(2)根據(jù)用戶日曲線狀態(tài)估計缺失的用戶功率數(shù)據(jù)
設(shè)用戶n的第d天的功率日曲線記錄為Ldn=[Pd1n,Pd2n,…,PdMn],根據(jù)已知完整的用戶日功率曲線,來估計不完整日曲線的缺失部分功率,具體細節(jié)如下:
對某一記錄不完整的時刻分別估計每個缺失的用戶功率記錄Pdmq。由于Pdmq的缺失,日曲線Ldq一定不完整,節(jié)選Ldq中有記錄的部分為:
設(shè)Hdq為Lit中所有和Pimt都有記錄的日曲線集合,并對其進行節(jié)選其中,ml:采集數(shù)據(jù)的時刻;Pimlj:第i天t個用戶記錄ml時刻點的功率;l:樣本數(shù)量;得到已知(樣本,標簽)集合{(Lit,Pimt)|,t)∈Hdq}。通過“相關(guān)性距離”的K-近鄰方法,在已知樣本中尋找相關(guān)性最大的k2個樣本按樣本總功率比例估計Pdmq的k2個候選值,
(3)填補數(shù)據(jù)的微調(diào)修正
設(shè)某時刻記錄了u個用戶n1,n2,…,nu的功率,缺失v個用戶q1,q2,…,qv。根據(jù)已知的用戶功率記錄和由(1)估計的線損率,可以估計缺失功率的總和
,其中,缺失的用戶qf的功率;不完整樣本數(shù)據(jù)的線損率平均值。根據(jù)(2)中對缺失功率的估計,得到若干個估計j=1,2,…,v,u=1,2,…,k2;其中,缺失用戶qf的估計值。下面以線損率估計為主導(dǎo),對缺失功率估計和線損率估計進行微調(diào),得到最終的線損率和用戶功率數(shù)據(jù)的估計,技術(shù)圖如附圖2所示,具體細節(jié)如下:
在時刻對于每個需要填補的可以選擇k2個中的某一個作為估計值共有k2v種估計值。分別計算并跟進行比較,設(shè)差值最小的為
計算由此估計得到的線損率與進行比較,并設(shè)置2個閾值r1,r2:
如果則對線損率的最終估計為
如果則對線損率的最終估計修改為
如果則對線損率的最終估計修改為
根據(jù)最終估計的線損率計算缺失用戶功率的和:
再對初步估計的用戶功率按比例縮放,得到最終的缺失功率估計:
最終完成所有缺失數(shù)據(jù)的填補工作。
一種電網(wǎng)用戶用電功率曲線數(shù)據(jù)填補裝置,該裝置包括:
估計單元,用于根據(jù)臺區(qū)線路T的狀態(tài)估計線損率,并根據(jù)用戶日曲線狀態(tài)估計缺失的用戶功率數(shù)據(jù);
所述估計單元包括:
第一估計子單元,用于根據(jù)臺區(qū)線路T的狀態(tài)估計線損率;
第二估計子單元,用于根據(jù)用戶日曲線狀態(tài)估計缺失的用戶功率數(shù)據(jù);
調(diào)節(jié)單元,用于微調(diào)線損率估計和缺失的用戶功率估計,完成缺失數(shù)據(jù)的填補。
所述調(diào)節(jié)單元包括:
第一調(diào)節(jié)子單元,用于根據(jù)設(shè)置的閾值和修正的線損率確定線損率的最終估計值;
第二調(diào)節(jié)子單元,用于根據(jù)線損率的最終估計值計算缺失用戶功率值的最終估計值。
以上實施例僅用以說明本發(fā)明的技術(shù)方案而非對其限制,盡管參照上述實施例對本發(fā)明進行了詳細的說明,所屬領(lǐng)域的普通技術(shù)人員依然可以對本發(fā)明的具體實施方式進行修改或者等同替換,這些未脫離本發(fā)明精神和范圍的任何修改或者等同替換,均在申請待批的本發(fā)明的權(quán)利要求保護范圍之內(nèi)。