基于協(xié)同訓(xùn)練偏最小二乘模型的工業(yè)過程軟測(cè)量建模方法

文檔序號(hào)：9196545閱讀：455來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>控制;調(diào)節(jié)裝置的制造及其應(yīng)用技術(shù)

基于協(xié)同訓(xùn)練偏最小二乘模型的工業(yè)過程軟測(cè)量建模方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于工業(yè)過程預(yù)測(cè)與控制領(lǐng)域，尤其涉及一種協(xié)同訓(xùn)練算法與偏最小二乘算法的軟測(cè)量建模方法。
【背景技術(shù)】
[0002] 在傳統(tǒng)工業(yè)過程中存在著許多無法或者難以用傳感器直接測(cè)量的變量如產(chǎn)品反應(yīng)速率、產(chǎn)品成分含量等等，而這些參數(shù)對(duì)于提高產(chǎn)品質(zhì)量和保證安全生產(chǎn)有重要的作用，是工業(yè)生產(chǎn)過程中必須加以嚴(yán)格監(jiān)視和控制的參數(shù)。雖然這些變量可以用在線分析儀表進(jìn) 行檢測(cè)，但是一方面需要大量的投資，另一方面可能因?yàn)橛休^大的測(cè)量滯后而使得調(diào)節(jié)不夠及時(shí)，從而使得產(chǎn)品質(zhì)量難以得到保證。這些對(duì)于工業(yè)生產(chǎn)過程具有重要作用的變量我們稱之為主導(dǎo)變量，其他的一些易于測(cè)量的變量我們稱之為輔助變量。軟測(cè)量指的是通過建立工業(yè)過程變量之間的數(shù)學(xué)模型，實(shí)現(xiàn)利用輔助變量預(yù)測(cè)主導(dǎo)變量信息的技術(shù)方法。近年來，工業(yè)過程的軟測(cè)量得到了越來越多的重視。
[0003] 傳統(tǒng)的工業(yè)過程軟測(cè)量建模方法除了基于機(jī)理模型的方法以外，大多數(shù)采用多元統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)的方法，例如主元回歸PCR和偏最小二乘PLS等，在機(jī)理模型難以獲取的情況下，基于數(shù)據(jù)驅(qū)動(dòng)的多元統(tǒng)計(jì)分析方法已經(jīng)成為半導(dǎo)體過程監(jiān)測(cè)的主流方法。但是，傳統(tǒng)的多元統(tǒng)計(jì)方法在訓(xùn)練樣本數(shù)目較少的情況下，所建立起的模型的預(yù)測(cè)精度往往不能夠達(dá)到有效的精度；此外，傳統(tǒng)多元統(tǒng)計(jì)學(xué)習(xí)方法建模時(shí)所用的數(shù)據(jù)往往都是那些輔助變量有對(duì)應(yīng)主導(dǎo)變量信息的數(shù)據(jù)，沒有對(duì)應(yīng)主導(dǎo)變量僅有輔助變量信息的數(shù)據(jù)往往被直接忽視了。在工業(yè)過程中，基于上面所述的主導(dǎo)變量難以檢測(cè)等原因，工業(yè)過程中存在著大量的不包含有主導(dǎo)變量僅有輔助變量信息的數(shù)據(jù)，這些數(shù)據(jù)中包含著大量的有用信息，直接棄之不用造成了浪費(fèi)。
[0004] 相比之下，半監(jiān)督學(xué)習(xí)方法通過使用有標(biāo)簽數(shù)據(jù)建立初始模型，然后利用無標(biāo)簽數(shù)據(jù)對(duì)模型進(jìn)行參數(shù)優(yōu)化與調(diào)整，最終達(dá)到提高模型精度的效果。本發(fā)明主要利用了半監(jiān) 督學(xué)習(xí)中的協(xié)同訓(xùn)練算法，結(jié)合偏最小二乘模型，找到了一種在輔助變量個(gè)數(shù)較多的條件下進(jìn)行模型學(xué)習(xí)的方法，并成功利用了無標(biāo)簽數(shù)據(jù)提升了模型的精度，表明了半監(jiān)督學(xué)習(xí) 方法應(yīng)用到軟測(cè)量研宄中具有絕對(duì)的可能性與相當(dāng)?shù)挠行?，也為今后軟測(cè)量建模的研宄提供了一個(gè)新的方法和思路。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的不足，提供一種基于協(xié)同訓(xùn)練算法的偏最小二乘回歸軟測(cè)量建模方法。
[0006] 本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的：一種基于協(xié)同訓(xùn)練算法的偏最小二乘軟測(cè)量模型的建立，主要包括以下幾個(gè)步驟：
[0007] (1)利用集散控制系統(tǒng)以及離線檢測(cè)方法，按生產(chǎn)批次收集工業(yè)生產(chǎn)過程的數(shù)據(jù) 組成建模用的訓(xùn)練樣本集。對(duì)于每個(gè)批次的訓(xùn)練樣本集，一部分為既包含主導(dǎo)變量數(shù)據(jù)也包含輔助變量信息的樣本集D e Rk〃，其中，D為有標(biāo)簽數(shù)據(jù)集，K為采樣數(shù)據(jù)點(diǎn)個(gè)數(shù)，J為變量個(gè)數(shù)；另一部分為只包含輔助變量數(shù)據(jù)的樣本集X e RNX2M，其中，X為無標(biāo)簽數(shù)據(jù)集，N 為采樣數(shù)據(jù)點(diǎn)數(shù)，2M為變量個(gè)數(shù)，將這些數(shù)據(jù)存入歷史數(shù)據(jù)庫。
[0008] (2)對(duì)于每個(gè)生產(chǎn)批次的有標(biāo)簽數(shù)據(jù)，沿著時(shí)間點(diǎn)方向?qū)γ恳粋€(gè)數(shù)據(jù)矩陣進(jìn)行排列，得到新的數(shù)據(jù)矩陣，并對(duì)其進(jìn)行預(yù)處理和歸一化，即使得各個(gè)過程變量的均值為零，方差為1，得到新的數(shù)據(jù)矩陣集為
[0009] (3)基于得到的二維數(shù)據(jù)矩陣De ，按照主導(dǎo)變量和輔助變量分類標(biāo)準(zhǔn)，選取其中的主導(dǎo)變量作為預(yù)測(cè)目標(biāo)因變量#
，選取其中的輔助變量作為自變量集
，則該二維數(shù)據(jù)矩陣
可以重新描述為：
[0010] (4)對(duì)于有標(biāo)簽數(shù)據(jù)集，對(duì)其自變量集進(jìn)行均分，前一半自變量作為第一自變量視圖：
，后一半自變量作為第二自變量視圖：
4導(dǎo)到兩組新的有標(biāo)簽數(shù)據(jù)集
，并按照同樣的變量拆分方法對(duì)于無標(biāo)簽數(shù)據(jù)進(jìn)行拆分，得到兩組新的無標(biāo)簽數(shù)據(jù)集
和
[0011] (5)首先，利用
建立初始的模型PLS1，利用
建立初始的模型PLS2,然后，不斷迭代使用無標(biāo)簽數(shù)據(jù)更新模型訓(xùn)練數(shù)據(jù)，當(dāng)達(dá)到一定的終止條件時(shí)，終止迭代。一般選取的終止條件為迭代達(dá)到一定次數(shù)抑或是無法繼續(xù)找到置信度足夠高的樣本。
[0012] (6)將建模數(shù)據(jù)和各個(gè)模型參數(shù)存入歷史數(shù)據(jù)庫和實(shí)時(shí)數(shù)據(jù)庫中備用。
[0013] (7)收集新的過程數(shù)據(jù)，并對(duì)其進(jìn)行預(yù)處理和歸一化。
[0014] (8)采用基于協(xié)同訓(xùn)練算法的偏最小二乘方法對(duì)工業(yè)過程的變量進(jìn)行預(yù)測(cè)，實(shí)現(xiàn) 過程監(jiān)控與控制。
[0015] 本發(fā)明的有益效果是：本發(fā)明通過對(duì)于工業(yè)數(shù)據(jù)建立起的軟測(cè)量模型，不但利用了傳統(tǒng)軟測(cè)量方法建模所利用的有標(biāo)簽數(shù)據(jù)，也利用了傳統(tǒng)軟測(cè)量建模方法所不能利用的無標(biāo)簽數(shù)據(jù)，在訓(xùn)練樣本相同的情況下，能夠建立起比傳統(tǒng)軟測(cè)量模型精度更高的預(yù)測(cè)模型。相比目前的其他軟測(cè)量建模方法，本發(fā)明不僅可以大大提高訓(xùn)練樣本數(shù)目極少的情況下模型的預(yù)測(cè)效果，而且在很大程度上改善了監(jiān)測(cè)方法對(duì)過程知識(shí)的依賴性，增強(qiáng)了過程操作員對(duì)過程的理解能力和操作信心，更加有利于工業(yè)過程的自動(dòng)化實(shí)施。
【附圖說明】
[0016] 圖1是本發(fā)明方法和傳統(tǒng)偏最小二乘方法對(duì)在不同有標(biāo)簽樣本比例下建模預(yù)測(cè) 結(jié)果的RMSE對(duì)比圖；
[0017] 圖2是在有標(biāo)簽樣本比例為30%的情況下樣本真實(shí)值、協(xié)同訓(xùn)練偏最小二乘算法預(yù)測(cè)值和偏最小二乘算法的預(yù)測(cè)值的曲線對(duì)比圖；
[0018] 圖3是上述兩種方法預(yù)測(cè)結(jié)果與真實(shí)值之間的誤差對(duì)比圖。
【具體實(shí)施方式】
[0019] 本發(fā)明是針對(duì)工業(yè)過程中訓(xùn)練數(shù)據(jù)較少情況下的軟測(cè)量建模問題，首先利用集散控制系統(tǒng)收集有標(biāo)簽與無標(biāo)簽數(shù)據(jù)，利用有標(biāo)簽數(shù)據(jù)建立初始的具有一定差異性的兩個(gè)模型，然后在初始模型的基礎(chǔ)上，通過不斷的迭代循環(huán)，逐步的將置信度最高的無標(biāo)簽數(shù)據(jù)轉(zhuǎn) 換為有標(biāo)簽數(shù)據(jù)并加入到訓(xùn)練集中來，逐漸擴(kuò)大訓(xùn)練集的樣本數(shù)目，最終達(dá)到提高模型精度的效果。本發(fā)明不僅提高了工業(yè)過程的軟測(cè)量模型預(yù)測(cè)效果，增強(qiáng)了過程操作員對(duì)過程狀態(tài)的掌握，使工業(yè)生產(chǎn)更加安全，產(chǎn)品質(zhì)量更加穩(wěn)定；而且很大程度上改善了軟測(cè)量建模方法對(duì)過程知識(shí)的依賴性，更加有利于工業(yè)過程的自動(dòng)化實(shí)施。
[0020] 下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說明。
[0021] 本發(fā)明一種基于協(xié)同訓(xùn)練算法的偏最小二乘軟測(cè)量建模方法，該方法針對(duì)工業(yè)過程的軟測(cè)量建模問題，首先利用集散控制系統(tǒng)以及離線檢測(cè)方法收集包含主導(dǎo)變量信息與輔助變量信息的有標(biāo)簽數(shù)據(jù)和僅包含輔助變量的無標(biāo)簽數(shù)據(jù)，然后利用有標(biāo)簽數(shù)據(jù)建立兩個(gè)具有相當(dāng)差異性的初始模型，然后再初始模型的基礎(chǔ)上利用無標(biāo)簽數(shù)據(jù)對(duì)兩個(gè)模型及其訓(xùn)練集進(jìn)行迭代更新，當(dāng)達(dá)到一定的迭代次數(shù)或是終止條件之后，停止對(duì)于模型的更新，并利用最終的訓(xùn)練數(shù)據(jù)建立新的模型，實(shí)現(xiàn)對(duì)于工業(yè)過程的軟測(cè)量建模。把模型參數(shù)存入數(shù) 據(jù)庫中備用。
[0022] 本發(fā)明采用的技術(shù)方案的主要步驟如下：
[0023] 第一步，利用集散控制系統(tǒng)以及離線檢測(cè)方法，按生產(chǎn)批次收集工業(yè)生產(chǎn)過程的數(shù)據(jù)組成建模用的訓(xùn)練樣本集，對(duì)于一些無法進(jìn)行在線檢測(cè)的主導(dǎo)變量，則在離線進(jìn)行測(cè) 量后將測(cè)量后的變量信息與其對(duì)應(yīng)的輔助變量信息一起存儲(chǔ)到數(shù)據(jù)集中。在這樣的條件下，對(duì)于同一個(gè)批次的訓(xùn)練樣本集，一部分為既包含主導(dǎo)變量數(shù)據(jù)也包含輔助變量信息的樣本集D e RKX\其中，D為有標(biāo)簽數(shù)據(jù)集，K為采樣數(shù)據(jù)點(diǎn)個(gè)數(shù)，J為變量個(gè)數(shù)；另一部分為只包含輔助變量數(shù)據(jù)的樣本集X e RNX2M，其中，X為無標(biāo)簽數(shù)據(jù)集，N為采樣數(shù)據(jù)點(diǎn)數(shù)，2M為變量個(gè)數(shù)，將這些數(shù)據(jù)存入歷史數(shù)據(jù)庫。
[0024] 第二步，對(duì)于每個(gè)生產(chǎn)批次的有標(biāo)簽數(shù)據(jù)，對(duì)采集到的過程數(shù)據(jù)進(jìn)行預(yù)處理，剔除野值點(diǎn)和明顯的粗糙誤差數(shù)據(jù)。得到新的數(shù)據(jù)矩陣集為De Rk〃?；诘玫降亩S數(shù)據(jù)矩陣D e RKXJ。
[0025] 第三步，按照主導(dǎo)變量和輔助變量分類標(biāo)準(zhǔn)，選取其中的主導(dǎo)變量作為預(yù)測(cè)目標(biāo) 因變量集
選取其中的輔助變量作為自變量集
，則該二維數(shù)據(jù)矩陣
可以重新描述為：
>
[0026] 第四步，對(duì)于有標(biāo)簽數(shù)據(jù)集中的每個(gè)樣本（Xi，yi)，對(duì)其自變量集進(jìn)行均分，前一半作為第一視圖,得到一個(gè)新樣本：Uattl+ Yi)，后一半作為第二視圖，也得到一個(gè)新樣本：(xatt2,i，yi)。對(duì)于整個(gè)樣本集，也使用同樣的分配方法進(jìn)行分割獲取

，這樣可以得到兩組新的有標(biāo)簽數(shù)據(jù)集
以及
:然后按照同樣的變量拆分方法對(duì)于無標(biāo)簽數(shù)據(jù)進(jìn)行拆分，得到兩組新的無標(biāo)簽數(shù)據(jù)集
[0027] 第五步，不失一般性，先灰
建立初始的PLS模型：對(duì)X和Y進(jìn)行中心化，即使各個(gè)變量的均值為〇,方差為1，得到一組新的數(shù)據(jù)Etl, Ftl，并記錄其均值與方差分別為Mx，Sx，My，Sy。然后，分別提取兩變量組的第一對(duì)成分，使之相關(guān)性最大：
[0028] 假設(shè)從兩組變量分別提出第一對(duì)成分為&和u i，其中&是自變量集X的線性組合，U1是因變量集Y的線性組合，為了回歸分析的需要，要求t JP u 可能多的提取所在變量組的變異信息以及二者之間的相關(guān)程度達(dá)到最大。現(xiàn)在由Etl, Ftl，計(jì)算第一對(duì)成分的得分向量，記為h和Wl，貝1J有
[0029]
[0030]
[0031] 第一對(duì)成分1^和u i的協(xié)方差可以用第一對(duì)成分的得分向量^和Wl的內(nèi)積來計(jì) 算，故而有
[0032]
[0033] 此時(shí)，只需要計(jì)算MXM矩陣的最大特征值及其對(duì)應(yīng)的特征向量，且盡的最大特征值即為Θ i的平方，相應(yīng)的單位特征向量即為所求解的w i，而Vl可以由

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：包亮;葛志強(qiáng);
技術(shù)所有人：浙江大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、唐老師：1.高效節(jié)能裝備 2.流動(dòng)穩(wěn)定性 3.汽車流場(chǎng)分析和淀粉糖工藝技術(shù)。
2、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
3、王老師：電子信息處理、先進(jìn)檢測(cè)方法和智能化儀表
4、周老師：1.智能電網(wǎng) 2.新能源利用 3.泛在電力物聯(lián)網(wǎng)
5、趙老師：檢測(cè)與控制技術(shù)、機(jī)器人技術(shù)、機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

傾斜攝影測(cè)量三維建模相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于協(xié)同訓(xùn)練偏最小二乘模型的工業(yè)過程軟測(cè)量建模方法