本發(fā)明涉及一種基于邏輯回歸概率分析優(yōu)化模型的反竊電分析預(yù)警方法。
背景技術(shù):
:近年來,我國用電相關(guān)的糾紛案件數(shù)量亦逐年上升,尤其竊電問題,且竊電手段不斷變化發(fā)展,使得竊電范圍不斷擴(kuò)大,對電力系統(tǒng)的正常運(yùn)行造成了阻礙。為規(guī)范管理生產(chǎn)生活用電,提高電能利用率,推進(jìn)電力企業(yè)健康、穩(wěn)定發(fā)展,開展用電檢查與反竊電工作是電力企業(yè)一項(xiàng)迫切工作。早期,傳統(tǒng)的電費(fèi)收取方式為人工手抄表,體力勞動強(qiáng)且涉外人員數(shù)量不足,竊電查處問題也由涉外人員承擔(dān),用電檢查人員數(shù)量難以滿足需求,其次,由于傳統(tǒng)用電管理思想觀念根深蒂固,供電企業(yè)對違約用電竊電行為不夠重視,造成用電檢查及打擊竊電行為力度低,助長了違約用電和竊電行為;隨著社會進(jìn)步、經(jīng)濟(jì)發(fā)展,用戶用電數(shù)量不斷增多,社會生產(chǎn)生活對電能的需求量越來越大,電力企業(yè)也隨之引進(jìn)智能電表,以用電信息采集系統(tǒng)和sg186營銷業(yè)務(wù)應(yīng)用系統(tǒng)有效實(shí)現(xiàn)遠(yuǎn)程費(fèi)控,然而竊電查處問題并未隨之解決,且在經(jīng)濟(jì)利益的驅(qū)使下,竊電者不再局限于過去的居民、個(gè)體等,逐漸發(fā)展成為了集體企業(yè)、中外合作企業(yè)等,發(fā)展速度十分快,嚴(yán)重干擾了電力企業(yè)供電安全與秩序,此外,隨著科學(xué)技術(shù)日新月異,高科技手段被竊電人員廣泛應(yīng)用,隨著竊電技術(shù)的智能化、科技化發(fā)展,使得高科技含量的竊電方式越來越多,如無線遙控、有線遠(yuǎn)方控制等,此類竊電手段往往十分隱蔽,傳統(tǒng)用電檢查方法根本無法檢測,且用電檢查人員綜合素質(zhì)較低,難以滿足用電檢查和反竊電工作的現(xiàn)代化需求。因此,亟需采取有效方法,利用電力企業(yè)現(xiàn)有系統(tǒng)所提供數(shù)據(jù)實(shí)現(xiàn)反竊電分析,對竊電嫌疑用戶進(jìn)行概率推測和預(yù)警,精準(zhǔn)識別重大竊電嫌疑用戶,提高反竊電工作成效,加強(qiáng)我國電力企業(yè)對電能輸出的高效監(jiān)管力度,通過建立強(qiáng)有力的反竊電監(jiān)控預(yù)警手段,加大反竊電的查處懲治力度,維護(hù)正常的供用電秩序,保障公司經(jīng)營效益。目前,竊電手段上大致可分為兩大類,如下表所示針對違約用電與竊電問題帶來的電力企業(yè)用電監(jiān)管問題,本專利提出解決方案:基于用電信息采集系統(tǒng)和sg186營銷業(yè)務(wù)應(yīng)用系統(tǒng)積累的大量客戶用電信息,結(jié)合大量典型竊電案例,綜合考慮各種竊電因素,抽象識別竊電行為的普遍因素,將邏輯回歸算法、離散弗雷歇距離算法和層次聚類分析算法相結(jié)合建立反竊電分析與處理方法,對竊電嫌疑用戶進(jìn)行概率推測和預(yù)警,精準(zhǔn)識別重大竊電嫌疑戶,通過建立預(yù)警、排查和處理反饋的閉環(huán)工作機(jī)制,完成模型的自我優(yōu)化。技術(shù)實(shí)現(xiàn)要素:本發(fā)明為了解決上述問題,提出了一種基于邏輯回歸概率分析優(yōu)化模型的反竊電分析預(yù)警方法,本發(fā)明可以實(shí)現(xiàn)一種閉環(huán)工作的反竊電預(yù)警機(jī)制,滿足完成精準(zhǔn)識別重大竊電嫌疑戶的業(yè)務(wù)需求。為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:一種基于邏輯回歸概率分析優(yōu)化模型的反竊電分析預(yù)警方法,采集用電數(shù)據(jù),提取用電數(shù)據(jù)的竊電數(shù)據(jù),構(gòu)建專家樣本庫,基于專家樣本庫數(shù)據(jù),通過不同維度對關(guān)聯(lián)數(shù)據(jù)進(jìn)行分析,建立基于竊電行為的特征數(shù)據(jù)庫,進(jìn)而利用邏輯回歸算法構(gòu)建用戶竊電概率分析模型,得到各個(gè)用戶的竊電概率,確定具有竊電嫌疑的用戶。進(jìn)一步的,上述方法還包括采集具有竊電嫌疑的用戶的歷史用電行為軌跡庫,并基于離散弗雷歇距離算法構(gòu)建用戶行為趨勢分析模型,將目前用電數(shù)據(jù)曲線與用戶歷史用電軌跡對比,以優(yōu)化確定的有竊電嫌疑的用戶的結(jié)果。進(jìn)一步的,上述方法還包括基于用戶用電數(shù)據(jù),建立典型類別用電行為特征庫,基于層次聚類分析算法構(gòu)建高價(jià)低用判別模型,通過用戶用電軌跡與典型類別用電行為對比,確定高價(jià)低壓違約竊電用電用戶。進(jìn)一步的,上述方法還包括根據(jù)確定的竊電嫌疑用戶,進(jìn)行排查,將排查結(jié)果反饋至專家樣本庫,對模型不斷優(yōu)化修正。通過不同維度對關(guān)聯(lián)數(shù)據(jù)進(jìn)行分析,包括但不限于用戶基本信息、用戶電價(jià)、計(jì)量點(diǎn)、電能表、收費(fèi)信息、信用信息、各類竊電因素、計(jì)量裝置事件或違約用電因素。上述方法可以同時(shí)建立用戶竊電概率分析模型、用戶行為趨勢分析模型和高價(jià)低用判別模型,以保證竊電用戶結(jié)果的正確性和完整性。構(gòu)建用戶竊電概率分析模型的具體過程包括:(1)基于用戶用電數(shù)據(jù)選取等比例竊電樣本數(shù)據(jù)與正常用電樣本數(shù)據(jù)作為模型樣本集,從模型樣本集內(nèi)分別隨機(jī)抽取相應(yīng)比例的數(shù)據(jù)構(gòu)成訓(xùn)練集數(shù)據(jù)及測試集數(shù)據(jù);(2)定義訓(xùn)練集數(shù)據(jù)的參數(shù),采用擬牛頓法對目標(biāo)函數(shù)進(jìn)行最優(yōu)求解,不斷迭代,直到滿足迭代條件;(3)根據(jù)計(jì)算所得的最優(yōu)化目標(biāo)函數(shù)構(gòu)成用戶竊電概率分析模型,對用戶竊電概率分析模型模型進(jìn)行樣本測試,比較概率,概率與類別比例相比較獲取對應(yīng)類標(biāo)號,進(jìn)行測試樣本分類;(4)計(jì)算測試集數(shù)據(jù)的測試參數(shù),判斷是否滿足用戶竊電概率分析初始模型要求,若不滿足,則返回步驟(2)重新定義參數(shù),若滿足,則構(gòu)建完成用戶竊電概率分析模型,并輸出本次更新模型。所述步驟(2)中,參數(shù)具體包括用戶數(shù)據(jù)向量、特征權(quán)重向量、目標(biāo)函數(shù)、類別集合、初始化迭代次數(shù)和允許誤差,且用戶數(shù)據(jù)向量定義x=(x1,x2,x3,…),特征權(quán)重向量為θ=(θ1,θ2,θ3,…),則目標(biāo)函數(shù)f(θ)=θt*x,類別集合c={c1,c2},初始化迭代次數(shù)k=0,允許誤差ε>0,基于一定范圍對θ隨機(jī)賦值。進(jìn)一步的,構(gòu)建用戶行為趨勢分析模型的過程包括:(a)接收監(jiān)控池內(nèi)的竊電嫌疑用戶的相關(guān)數(shù)據(jù),包含近期用電數(shù)據(jù)及歷史用電數(shù)據(jù);(b)判斷用戶是否屬于專變用戶,若是,則基于用戶的歷史用電數(shù)據(jù)信息生成用戶用電典型行為趨勢曲線,若否則進(jìn)入下一步;(c)判定用戶屬于公變用戶,對公變臺區(qū)內(nèi)所有用戶分別建立用戶用電量典型行為趨勢曲線;(d)基于離散弗雷歇距離判別算法,將用戶近期用電趨勢曲線與典型行為趨勢曲線離散化后,取二者之間的距離最大值作為曲線相似度;(e)基于不同類別用戶設(shè)定不同的相似度閾值,曲線相似度超出閾值范圍,則輸出竊電嫌疑用戶?;趯哟尉垲惙治鏊惴?gòu)建高價(jià)低用判別模型的過程包括:(i)接收用戶數(shù)據(jù)及用戶用電數(shù)據(jù),并通過對用戶用電歷史數(shù)據(jù)進(jìn)行層次聚類,將用戶分入其所屬的行業(yè)類別;(ii)基于層次聚類法獲取各用電類型的典型類用電范圍趨勢曲線,并建立典型類用電行為特征庫;(iii)采用弗雷歇距離判別算法,計(jì)算用戶用電軌跡曲線與其所在類的典型類用電范圍趨勢曲線的相似度;(iv)基于不同類別用戶設(shè)定不同的相似度閾值,曲線相似度超出閾值范圍,則輸出高價(jià)低用違約竊電嫌疑用戶。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:(1)本發(fā)明基于邏輯回歸算法建立用戶竊電概率分析模型,采用擬牛頓算法求解最優(yōu)目標(biāo)函數(shù),有效減少迭代求解次數(shù),實(shí)現(xiàn)對一般竊電嫌疑用戶的初步篩查,基于離散弗雷歇距離算法構(gòu)建行為趨勢分析模型實(shí)現(xiàn)對用戶自身用電數(shù)據(jù)曲線對比,輔助用戶竊電概率分析模型提高預(yù)警有效性,構(gòu)成邏輯回歸概率分析優(yōu)化模型,精準(zhǔn)識別重大竊電嫌疑用戶。(2)本發(fā)明采用預(yù)警、排查和處理反饋的閉環(huán)工作機(jī)制不斷豐富專家樣本庫,模型根據(jù)反饋案例持續(xù)進(jìn)行學(xué)習(xí)訓(xùn)練、優(yōu)化重構(gòu),不斷提高模型的精度和泛化能力,提供一種強(qiáng)有力的反竊電監(jiān)控預(yù)警手段,加大反竊電的查處懲治力度,維護(hù)正常的供用電秩序。(3)本發(fā)明針對基于邏輯回歸概率分析優(yōu)化模型不易判別的高價(jià)低用竊電行為,構(gòu)建基于層次聚類分析算法的高價(jià)低用判別模型,實(shí)現(xiàn)對用戶歸類用電范圍趨勢曲線對比,有效判定用戶高價(jià)低用違約竊電行為,提高識別竊電嫌疑用戶的精準(zhǔn)度。附圖說明構(gòu)成本申請的一部分的說明書附圖用來提供對本申請的進(jìn)一步理解,本申請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。圖1為反竊電分析預(yù)警與處理方法總體流程圖;圖2為基于邏輯回歸算法建立用戶竊電概率分析模型數(shù)據(jù)流程圖;圖3為行為趨勢分析模型數(shù)據(jù)流程圖;圖4為高價(jià)低用判別模型數(shù)據(jù)流程圖;圖5為反竊電分析預(yù)警與處理方法實(shí)施例流程圖;圖6(a)1類典型用電曲線,用電時(shí)間在6到22點(diǎn)之間,在9點(diǎn)~11點(diǎn)和17點(diǎn)達(dá)到峰值,用電電流在2.5a之內(nèi);圖6(b)2類典型用電曲線,用電時(shí)間在6到24點(diǎn)之間,在8點(diǎn)和17點(diǎn)之間比較平穩(wěn),用電電流在8a之內(nèi);圖6(c)某一用戶竊電數(shù)據(jù)曲線。具體實(shí)施方式:下面結(jié)合附圖與實(shí)施例對本發(fā)明作進(jìn)一步說明。應(yīng)該指出,以下詳細(xì)說明都是例示性的,旨在對本申請?zhí)峁┻M(jìn)一步的說明。除非另有指明,本文使用的所有技術(shù)和科學(xué)術(shù)語具有與本申請所屬
技術(shù)領(lǐng)域:
的普通技術(shù)人員通常理解的相同含義。需要注意的是,這里所使用的術(shù)語僅是為了描述具體實(shí)施方式,而非意圖限制根據(jù)本申請的示例性實(shí)施方式。如在這里所使用的,除非上下文另外明確指出,否則單數(shù)形式也意圖包括復(fù)數(shù)形式,此外,還應(yīng)當(dāng)理解的是,當(dāng)在本說明書中使用術(shù)語“包含”和/或“包括”時(shí),其指明存在特征、步驟、操作、器件、組件和/或它們的組合。正如
背景技術(shù):
所介紹的,現(xiàn)有技術(shù)中存在的竊電手段往往十分隱蔽,傳統(tǒng)用電檢查方法根本無法檢測,且用電檢查人員綜合素質(zhì)較低,難以滿足用電檢查和反竊電工作的現(xiàn)代化需求的不足,為了解決如上的技術(shù)問題,本申請?zhí)岢隽艘环N基于邏輯回歸概率分析優(yōu)化模型的反竊電分析預(yù)警與處理方法。一種基于邏輯回歸概率分析優(yōu)化模型的反竊電分析預(yù)警與處理方法,步驟如下:a用戶數(shù)據(jù)及用戶用電數(shù)據(jù)輸入;b基于用戶用電數(shù)據(jù),精簡竊電案例,構(gòu)建專家樣本庫;c基于專家樣本庫數(shù)據(jù),通過不同維度對關(guān)聯(lián)數(shù)據(jù)進(jìn)行分析,建立基于竊電行為的特征數(shù)據(jù)庫,即反竊電預(yù)警診斷指標(biāo)體系;d基于反竊電預(yù)警診斷指標(biāo)體系,利用邏輯回歸算法構(gòu)建用戶竊電概率分析模型,模型輸出疑似竊電用戶的竊電概率,將重大竊電嫌疑用戶加入監(jiān)控池;e根據(jù)監(jiān)控池內(nèi)用戶數(shù)據(jù)建立用戶歷史用電行為軌跡庫,并基于離散弗雷歇距離算法構(gòu)建用戶行為趨勢分析模型,將監(jiān)控池內(nèi)用戶近期用電數(shù)據(jù)曲線與用戶歷史用電軌跡對比,刪除假竊電用戶;f基于用戶用電數(shù)據(jù),建立典型類別用電行為特征庫,基于層次聚類分析算法構(gòu)建高價(jià)低用判別模型,通過用戶用電軌跡與典型類別用電行為對比,輸出高價(jià)低壓違約竊電用電用戶;g根據(jù)各模型輸出的竊電用戶數(shù)據(jù)生成竊電排查工單,現(xiàn)場排查;h根據(jù)現(xiàn)場核實(shí)結(jié)果反饋完善專家樣本庫,對各模型不斷優(yōu)化修正。所述步驟d中構(gòu)建用戶竊電概率分析模型的一般生成過程為:d1.基于用戶用電數(shù)據(jù)選取等比例竊電樣本數(shù)據(jù)與正常用電樣本數(shù)據(jù)作為模型樣本集,從模型樣本集內(nèi)分別隨機(jī)抽取相應(yīng)比例的數(shù)據(jù)構(gòu)成訓(xùn)練集數(shù)據(jù)及測試集數(shù)據(jù);d2.將訓(xùn)練集數(shù)據(jù)進(jìn)行用戶數(shù)據(jù)向量定義x=(x1,x2,x3,…),特征權(quán)重向量為θ=(θ1,θ2,θ3,…),則目標(biāo)函數(shù)f(θ)=θt*x,類別集合c={c1,c2},初始化迭代次數(shù)k=0,允許誤差ε>0,基于一定范圍對θ隨機(jī)賦值;d3.進(jìn)入迭代求解過程,k=k+1;d4.采用擬牛頓法對目標(biāo)函數(shù)進(jìn)行最優(yōu)求解,目標(biāo)函數(shù)的梯度計(jì)算海森矩陣hk+1其中,p(k)=θ(k+1)-θ(k),q(k)=▽f(θ(k+1))-▽f(θ(k)),pi2表示被正確分類為c2類的實(shí)例個(gè)數(shù),置海森矩陣h1為單位矩陣;梯度下降方向d(k)=-hk▽f(3)進(jìn)而從x(k)出發(fā),延方向d(k)搜索,求步長λk,求解方程滿足如下更新特征權(quán)重向量θ=(θ1,θ2,θ3,…),θ(k+1)=θ(k)+λkd(k)(5)d5.將特征權(quán)重向量θ代入目標(biāo)函數(shù)f(θ),判斷下式是否成立||▽f(θ(k+1))>ε||(6)若成立,則返回d3繼續(xù)進(jìn)入迭代求解過程,若不成立,則獲得本次計(jì)算所得的最優(yōu)化目標(biāo)函數(shù),進(jìn)入下一步;d6.基于最優(yōu)化目標(biāo)函數(shù)構(gòu)成用戶竊電概率分析模型,對用戶竊電概率分析模型模型進(jìn)行樣本測試,比較概率,概率與類別比例相比較獲取對應(yīng)類標(biāo)號,進(jìn)行測試樣本分類,其中,xj為測試樣本數(shù)據(jù),屬于d1所得的測試集數(shù)據(jù);d7.計(jì)算測試集數(shù)據(jù)的測試參數(shù),判斷是否滿足用戶竊電概率分析初始模型要求,若不滿足,則返回d2對θ更新隨機(jī)賦值,若滿足,則進(jìn)入下一步;d8.構(gòu)建完成用戶竊電概率分析模型,并輸出本次更新模型。所述步驟e構(gòu)建用戶行為趨勢分析模型的一般生成過程為:e1.接收監(jiān)控池內(nèi)的竊電嫌疑用戶的相關(guān)數(shù)據(jù),包含近期用電數(shù)據(jù)及歷史用電數(shù)據(jù);e2.判斷用戶是否屬于專變用戶,若是,則基于用戶的歷史用電數(shù)據(jù)信息生成用戶用電典型行為趨勢曲線,若否則進(jìn)入下一步;e3.判定用戶屬于公變用戶,對公變臺區(qū)內(nèi)所有用戶分別建立用戶用電量典型行為趨勢曲線;e4.基于離散弗雷歇距離判別算法,將用戶近期用電趨勢曲線與典型行為趨勢曲線離散化后,取二者之間的距離最大值作為曲線相似度,即e5.基于不同類別用戶設(shè)定不同的相似度閾值,曲線相似度超出閾值范圍,則輸出竊電嫌疑用戶。所述步驟f基于層次聚類分析算法構(gòu)建高價(jià)低用判別模型的一般生成過程為:f1.接收用戶數(shù)據(jù)及用戶用電數(shù)據(jù),并通過對用戶用電歷史數(shù)據(jù)進(jìn)行層次聚類,將用戶分入其所屬的行業(yè)類別;f2.基于層次聚類法獲取各用電類型的典型類用電范圍趨勢曲線,并建立典型類用電行為特征庫;f3.采用弗雷歇距離判別算法,計(jì)算用戶用電軌跡曲線與其所在類的典型類用電范圍趨勢曲線的相似度;f4.基于不同類別用戶設(shè)定不同的相似度閾值,曲線相似度超出閾值范圍,則輸出高價(jià)低用違約竊電嫌疑用戶。綜上,本發(fā)明以基于邏輯回歸算法建立用戶竊電概率分析模型實(shí)現(xiàn)對竊電嫌疑用戶的判別,以行為趨勢分析模型實(shí)現(xiàn)對用戶竊電概率分析模型進(jìn)行輔助判別,二者構(gòu)建形成邏輯回歸概率分析優(yōu)化模型,此外以高價(jià)低用判別模型針對違約竊電行為進(jìn)行識別,采用一種閉環(huán)工作的反竊電預(yù)警機(jī)制,滿足完成精準(zhǔn)識別重大竊電嫌疑戶的業(yè)務(wù)需求。本方案主要依賴基于邏輯回歸概率分析優(yōu)化模型,完成篩查疑似竊電用戶的預(yù)警服務(wù)。作為本發(fā)明的一種典型實(shí)施例,如圖1所示,基于國網(wǎng)山東省電力公司用電信息采集系統(tǒng)為背景實(shí)施平臺,反竊電分析預(yù)警與處理包含與外圍系統(tǒng)連接的輸入輸出信息模塊,包含一存儲單元包含三類數(shù)據(jù)庫,一類數(shù)據(jù)庫存儲輸入信息與信息預(yù)定義,一類數(shù)據(jù)庫存儲解決方案與測試結(jié)果,一類數(shù)據(jù)庫存儲專家樣本庫與樣本特征。參考圖5,是本發(fā)明基于邏輯回歸概率分析優(yōu)化模型的反竊電分析預(yù)警與處理的具體實(shí)施過程,步驟包括如下:1.自sg186營銷業(yè)務(wù)應(yīng)用系統(tǒng)搜集從2009年~2016年的竊電樣本1萬例,對應(yīng)相關(guān)竊電用戶從用電信息采集系統(tǒng)獲取用戶計(jì)量指標(biāo)數(shù)據(jù)、sg186營銷業(yè)務(wù)應(yīng)用系統(tǒng)獲取用戶檔案類數(shù)據(jù)、采集終端獲取異常事項(xiàng)數(shù)據(jù),此外,從山東省各地市覆蓋全面的抽取無竊電記錄用戶1萬例,其對應(yīng)相關(guān)數(shù)據(jù)作為正常用戶數(shù)據(jù),竊電樣本數(shù)據(jù)與正常用戶數(shù)據(jù)構(gòu)成數(shù)據(jù)樣本集,數(shù)據(jù)抽取流程自動化,并有自動調(diào)度功能;2.基于1萬余例可用竊電樣本,對樣本進(jìn)行典型竊電案例精簡,初始獲取77例典型竊電案例的專家樣本庫;3.基于77例典型竊電案例反向分析,建立基于竊電行為的特征數(shù)據(jù)庫,即反竊電預(yù)警診斷指標(biāo)體系,初始選取的特征數(shù)據(jù)庫如下表所示4.隨機(jī)抽取80%竊電樣本數(shù)據(jù)與正常用電樣本數(shù)據(jù)將構(gòu)成訓(xùn)練集數(shù)據(jù),剩余20%的竊電樣本數(shù)據(jù)與正常用電樣本數(shù)據(jù)構(gòu)成測試集數(shù)據(jù),將訓(xùn)練集數(shù)據(jù)分為用戶檔案類數(shù)據(jù)向量x=(x1,x2,x3,…),計(jì)量檢測指標(biāo)類向量y=(y1,y2,y3,…),異常事項(xiàng)類數(shù)據(jù)向量z=(z1,z2,z3,…),特征權(quán)重向量分別為u=(u1,u2,u3,…),w=(w1,w2,w3,…),v=(v1,v2,v3,…),定義類別集合c={c1,c2},初始化迭代次數(shù)k=0,允許誤差ε>0,在[-11]范圍內(nèi)對θ隨機(jī)賦值,置海森矩陣h1為單位矩陣,隨后采用擬牛頓法對目標(biāo)函數(shù)進(jìn)行迭代最優(yōu)求解,根據(jù)式(1)~(6)計(jì)算更新特征權(quán)重向量θ=(θ1,θ2,θ3,…),并代入目標(biāo)函數(shù)f(θ),直至超出迭代條件;5.通常經(jīng)過5~7次迭代過程,將本次計(jì)算所得的最優(yōu)化目標(biāo)函數(shù)傳輸至模型測試環(huán)節(jié),從而形成用戶竊電概率分析初始模型,e1為0.4萬例測試集數(shù)據(jù),對初始模型進(jìn)行樣本測試,比較概率,概率與類別比例相比較獲取對應(yīng)類標(biāo)號,進(jìn)行測試樣本分類,計(jì)算模型正確率、召回率及精準(zhǔn)率,判斷是否滿足用戶竊電概率分析初始模型要求,若不滿足,則返回4對特征權(quán)重向量θ更新隨機(jī)賦值,經(jīng)過3次特征權(quán)重向量重新賦值,最終獲取滿足用戶竊電概率分析模型,并輸出本次更新模型,其正確率、召回率及精準(zhǔn)率如下表所示準(zhǔn)確率accuracy0.88精準(zhǔn)率precision0.97召回率recall0.78真陽性true-positive1563.0假陽性false-positive44.0真陰性true-negative437.0假陰性false-negative1956.0其中,真、假表示樣本實(shí)際是否是竊電數(shù)據(jù);陰陽表示數(shù)據(jù)通過模型后輸出結(jié)果是否是竊電(模型判斷是竊電的為陽,反之為陰),模型輸出的重大嫌疑用戶1607例數(shù)據(jù)進(jìn)入監(jiān)控池;6.基于監(jiān)控池內(nèi)的竊電嫌疑用戶1607例及其相關(guān)數(shù)據(jù),分為專變用戶及公變用戶,分別基于用戶的歷史用電數(shù)據(jù)信息生成用戶用電趨勢曲線,以1例教育類專變用戶為例,如圖6(a)(b)所示,圖中展示了用電類型為教育類用電的竊電用戶正常用電期間典型用電的2條曲線,從圖中可以看出,用戶用電變化都有一定的趨勢,不會出現(xiàn)驟增和驟減的情況,而且出現(xiàn)波峰和波谷的時(shí)間大概相近,基于離散弗雷歇距離判別算法,將用戶近期趨勢曲線與典型趨勢曲線離散化后,取二者之前的距離最大值作為曲線相似度,如圖6(c)所示,為該用戶的竊電數(shù)據(jù)曲線,可以看到當(dāng)用戶發(fā)生竊電時(shí),其用電電流在10點(diǎn)變得特別高,此趨勢與2類典型特征曲線均有較大距離,可判定其存在竊電嫌疑,基于不同類別用戶設(shè)定不同的相似度閾值,曲線相似度超出閾值范圍,則輸出竊電嫌疑用戶,最終刪除未竊電用戶31例,使竊電概率分析模型的預(yù)測精準(zhǔn)率為99%,減少實(shí)際巡檢工作;7.基于用戶用電數(shù)據(jù),選取某一地市用戶用電數(shù)據(jù)為例,隨機(jī)選取用戶用電數(shù)據(jù)9.7686萬例,選用一年中的電量數(shù)據(jù)作為分析基準(zhǔn),建立典型類別用電行為特征庫,即通過比對分析各用電類型的典型用電曲線趨勢,使用層次聚類法對數(shù)據(jù)進(jìn)行分類,聚類結(jié)果如下表所示所示通過用戶用電軌跡與典型類別用電行為對比,輸出高價(jià)低用違約竊電用電用戶12例,如下表所示用電類型\單位高價(jià)抵用違約竊電嫌疑用戶教育用電4農(nóng)業(yè)用電2一般工商業(yè)用電68.以行為趨勢分析模型輔助對用戶竊電概率分析模型進(jìn)行優(yōu)化,構(gòu)成邏輯回歸概率分析優(yōu)化模型,對隨機(jī)選取用戶用電數(shù)據(jù)9.7686萬例進(jìn)行竊電用戶預(yù)警,推送竊電嫌疑用戶71例;9.根據(jù)各模型輸出的竊電嫌疑用戶生成竊電排查工單,現(xiàn)場進(jìn)行檢查取證、查處工作,對現(xiàn)場排查確認(rèn)的竊電用戶,確認(rèn)竊電行為及采用的竊電方式;10.現(xiàn)場核實(shí)結(jié)果反饋至sg186營銷業(yè)務(wù)應(yīng)用系統(tǒng),提取有效的竊電數(shù)據(jù)作為案例加入專家樣本庫中,完善反竊電預(yù)警診斷指標(biāo)體系,根據(jù)反饋的竊電案例對邏輯回歸概率分析優(yōu)化模型不斷修正優(yōu)化。以上所述僅為本申請的優(yōu)選實(shí)施例而已,并不用于限制本申請,對于本領(lǐng)域的技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請的保護(hù)范圍之內(nèi)。上述雖然結(jié)合附圖對本發(fā)明的具體實(shí)施方式進(jìn)行了描述,但并非對本發(fā)明保護(hù)范圍的限制,所屬領(lǐng)域技術(shù)人員應(yīng)該明白,在本發(fā)明的技術(shù)方案的基礎(chǔ)上,本領(lǐng)域技術(shù)人員不需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護(hù)范圍以內(nèi)。當(dāng)前第1頁12