數(shù)據(jù)分析裝置、數(shù)據(jù)分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明關(guān)于數(shù)據(jù)分析裝置、數(shù)據(jù)分析方法以及程序,特別是,關(guān)于對多個目標變量和多個解釋變量的關(guān)聯(lián)性同時進行分析的數(shù)據(jù)分析裝置、數(shù)據(jù)分析方法以及程序。
【背景技術(shù)】
[0002]對蓄積的龐大的數(shù)據(jù)進行分析而導出的將來預測的結(jié)果開始被應用到企業(yè)決策中。例如,超市、便利商店等店鋪中,基于各商品的需要預測結(jié)果而對各商品的購買數(shù)進行調(diào)整。例如,在進行各商品的需要預測的情況下,對各商品的屬性、購買各商品的顧客的屬性等商品/顧客信息與各商品的購買實際業(yè)績的關(guān)系進行分析。此時,作為目標變量,能夠使用各商品的購買實際業(yè)績值,另一方面,作為解釋變量,能夠使用各商品的屬性(價格、制造商)、購買各商品的顧客的屬性(年齡、性別)等。
[0003]在上述數(shù)據(jù)分析中,取代對多個目標變量分別進行處理而對表示各目標變量和多個解釋變量的關(guān)聯(lián)性的預測規(guī)則獨立地進行學習,正在開發(fā)一種通過在考慮多個目標變量間的關(guān)聯(lián)性的同時,對表示各目標變量和多個解釋變量的關(guān)聯(lián)性的預測規(guī)則進行學習從而提高預測精度的技術(shù)。這種研究方法,被稱作“多重任務型分析”。即,在多重任務型分析中,在對表示各目標變量和多個解釋變量的關(guān)聯(lián)性的預測規(guī)則進行學習后,通過在所學習的預測規(guī)則中輸入多個解釋變量的值,從而計算各目標變量的預測值。
[0004]多重任務型分析技術(shù)的一例記載在非專利文獻I中。在非專利文獻I所記載的技術(shù)中,基于多個目標變量的實測值和多個解釋變量的實測值,對利用與所有的目標變量共通而關(guān)聯(lián)的解釋變量所表達的預測規(guī)則(以下,稱作“共通預測規(guī)則”)、和利用針對各目標變量而分別關(guān)聯(lián)的解釋變量所表達的不同目標變量的預測規(guī)則(以下,稱作“個別預測規(guī)則”)進行學習。接下來,在所學習的共通預測規(guī)則和個別預測規(guī)則中輸入各解釋變量的實測值,針對每個目標變量計算預測值。
[0005]另外,作為關(guān)聯(lián)技術(shù),在非專利文獻2中記載了用于將目標函數(shù)最小化的凸優(yōu)化方法。
[0006]現(xiàn)有技術(shù)文獻
[0007]非專利文獻
[0008]非專利文獻I
[0009]A.Jalalij et al.,"A Dirty Model for Mult1-task Learning, "NIPS2010.
[0010]非專利文獻2
[0011]M.Heiler and C.Schnoerrj ,,Learning Sparse Representat1ns by Non-NegativeMatrix Factorizat1n and Sequential Cone Programming, "Journal of Machine LearningResearch7(2006)1385-1407.
[0012]上述非專利文獻1、2的所有公開內(nèi)容作為引用而引入到本說明書中。以下的分析由本發(fā)明者所做出。
[0013]在多重任務型的數(shù)據(jù)分析中,不僅要求機器所預測的結(jié)果,在實用上也要求表示機器是如何導出預測結(jié)果的。這是因為在進行決策時不僅需要確認預測結(jié)果,而且導出預測結(jié)果的預測規(guī)則的妥當性是重要的。
[0014]為了使用戶知道機器是如何導出預測結(jié)果的,需要對用戶顯示并提供預測規(guī)則。然而,若目標變量的數(shù)目涉及數(shù)千?數(shù)萬種類,則預測規(guī)則的數(shù)目也為數(shù)千?數(shù)萬種類,用戶難于對各預測規(guī)則是否妥當進行確認。
[0015]因此,即使在目標變量的數(shù)目龐大的情況下,在不大幅度地降低預測精度的情況下削減所學習的預測規(guī)則的個數(shù)變得十分重要,但目前這種技術(shù)尚未確立。
【發(fā)明內(nèi)容】
[0016]因此,在多重任務型的數(shù)據(jù)分析中,期望在防止預測精度的降低的同時削減預測規(guī)則的數(shù)目。本發(fā)明的目標在于提供一種對所涉及的期望有所貢獻的數(shù)據(jù)分析裝置、數(shù)據(jù)分析方法以及程序。
[0017]本發(fā)明的第一視點所涉及的數(shù)據(jù)分析裝置是一種多重任務型的數(shù)據(jù)分析裝置,其中具備:
[0018]存儲部,其對多個目標變量的實測值即第一實測值、與所述多個目標變量對應的多個解釋變量的實測值即第二實測值、和與預測對象的目標變量對應的解釋變量的實測值即第三實測值進行保存;以及
[0019]預測規(guī)則學習部,其使用所述第一實測值和所述第二實測值,對由與所述多個目標變量共通關(guān)聯(lián)的解釋變量所表達的預測規(guī)則即共通預測規(guī)則、由通過與各目標變量關(guān)聯(lián)的解釋變量所表達的各目標變量的預測規(guī)則構(gòu)成的個別預測規(guī)則、由將所述個別預測規(guī)則所包含的預測規(guī)則分組化時的針對各組的預測規(guī)則構(gòu)成的組預測規(guī)則進行學習。
[0020]本發(fā)明的第二視點所涉及的數(shù)據(jù)分析方法是計算機進行多重任務型的數(shù)據(jù)分析的數(shù)據(jù)分析方法,其中包括:
[0021]所述計算機將多個目標變量的實測值即第一實測值、與所述多個目標變量對應的多個解釋變量的實測值即第二實測值、和與預測對象的目標變量對應的解釋變量的實測值即第三實測值保存在存儲部的步驟;以及
[0022]使用從所述存儲部讀出的所述第一實測值和所述第二實測值,對由與所述多個目標變量共通關(guān)聯(lián)的解釋變量所表達的預測規(guī)則即共通預測規(guī)則、由通過與各目標變量關(guān)聯(lián)的解釋變量所表達的各目標變量的預測規(guī)則構(gòu)成的個別預測規(guī)則、和由將所述個別預測規(guī)則中所包含的預測規(guī)則分組化時的針對各組的預測規(guī)則構(gòu)成的組預測規(guī)則進行學習,并存儲在所述存儲部的步驟。
[0023]本發(fā)明的第三視點所涉及的程序是使計算機執(zhí)行多重任務型的數(shù)據(jù)分析的程序,其中,
[0024]使計算機執(zhí)行如下處理:
[0025]將多個目標變量的實測值即第一實測值、與所述多個目標變量對應的多個解釋變量的實測值即第二實測值、和與預測對象的目標變量對應的解釋變量的實測值即第三實測值保存在存儲部的處理;以及
[0026]使用從所述存儲部讀出的所述第一實測值和所述第二實測值,對由與所述多個目標變量共通關(guān)聯(lián)的解釋變量所表達的預測規(guī)則即共通預測規(guī)則、由通過與各目標變量關(guān)聯(lián)的解釋變量所表達的各目標變量的預測規(guī)則構(gòu)成的個別預測規(guī)則、和由將所述個別預測規(guī)則中所包含的預測規(guī)則分組化時的針對各組的預測規(guī)則構(gòu)成的組預測規(guī)則進行學習,從而存儲于所述存儲部的處理。
[0027]發(fā)明效果
[0028]根據(jù)本發(fā)明所涉及的數(shù)據(jù)分析裝置、數(shù)據(jù)分析方法以及程序,在多重任務型的數(shù)據(jù)分析中,能夠防止預測精度的降低并削減預測規(guī)則的數(shù)目。
【附圖說明】
[0029]圖1是將一實施方式所涉及的數(shù)據(jù)分析裝置的結(jié)構(gòu)作為一例而表示的框圖。
[0030]圖2是將第一實施方式所涉及的數(shù)據(jù)分析裝置的結(jié)構(gòu)作為一例而表示的框圖。
[0031]圖3是將第一實施方式所涉及的數(shù)據(jù)分析裝置的動作作為一例而表示流程圖。
【具體實施方式】
[0032]首先,針對一實施方式的概要進行說明。另外,附記在該概要的附圖參照標號是專門用于幫助理解的例示,其意圖并非將本發(fā)明限定于圖示的形態(tài)。
[0033]圖1是對一實施方式所涉及的數(shù)據(jù)分析裝置10的結(jié)構(gòu)進行例示的框圖。若參照圖1,則數(shù)據(jù)分析裝置10是多重任務型的數(shù)據(jù)分析裝置,具備存儲部14、預測規(guī)則學習部15B、以及預測值計算部15C。
[0034]存儲部14對多個目標變量的實測值即第一實測值14 A、與該多個目標變量對應的多個解釋變量的實測值即第二實測值14B、以及與預測對象的目標變量對應的解釋變量的實測值即第三實測值14C進行保存。
[0035]預測規(guī)則學習部15 A使用第一實測值14 A和第二實測值14B,對于利用與多個目標變量共通而關(guān)聯(lián)的解釋變量所表達的預測規(guī)則即共通預測規(guī)則14D、由通過與各目標變量關(guān)聯(lián)的解釋變量所表達的不同目標變量的預測規(guī)則構(gòu)成的個別預測規(guī)則14E、和由與將個別預測規(guī)則14E中所包含的預測規(guī)則分組化時的各組相對應的預測規(guī)則構(gòu)成的組預測規(guī)則14F進行計算。這里,優(yōu)選為,預測規(guī)則學習部15B以個別預測規(guī)則14E中所包含的多個預測規(guī)則中相互類似的預測規(guī)則屬于同一組的方式對該多個預測規(guī)則進行分組化。
[0036]預測值計算部15C使用由預測規(guī)則學習部15計算出的共通預測規(guī)則14D以及組預測規(guī)則14F、和第三實測值14C,計算預測對象的目標變量的預測值14G。
[0037]根據(jù)所涉及的數(shù)據(jù)分析裝置10,在多重任務型的數(shù)據(jù)分析中,能夠在防止預測精度的降低的同時減少預測規(guī)則的數(shù)目。這是因為,根據(jù)數(shù)據(jù)分析裝置10,能夠替代由不同目標變量的預測規(guī)則構(gòu)成的個別預測規(guī)則14E,使用與將個別預測規(guī)則14E中包含的預測規(guī)則分組化時的各組相對應的組預測規(guī)則14F和共通預測規(guī)則14D,而對預測對象的目標變量的預測值14G進行計算,此時,能夠使組預測規(guī)則14F中所包含的預測規(guī)則的數(shù)目比個別預測規(guī)則14E中所包含的預測規(guī)則的數(shù)目大幅度地減少。
[0038]因此,根據(jù)數(shù)據(jù)