專利名稱:最優(yōu)方法搜索方法以及最優(yōu)方法搜索系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種通過在神經(jīng)網(wǎng)絡中應用細胞分化算法來有效地導出用于解決問題的最優(yōu)方法的最優(yōu)方法捜索方法以及最優(yōu)方法捜索系統(tǒng)。
背景技術(shù):
將神經(jīng)網(wǎng)絡組裝到系統(tǒng)中的優(yōu)點在于,通過在神經(jīng)網(wǎng)絡中形成網(wǎng)絡的節(jié)點反復學習,來導出用于解決問題的最優(yōu)方法。 在神經(jīng)網(wǎng)絡的學習方面,對技術(shù)內(nèi)容沒有限定,因此今后還能夠期待使用到各種領(lǐng)域。特別是,在神經(jīng)網(wǎng)絡中采用了遺傳算法的系統(tǒng)如專利文獻I、專利文獻2那樣,從圖像處理乃至機器人控制,作為選擇最優(yōu)方法時導出高精度結(jié)果的技術(shù)而被用于多個方向。專利文獻I :日本特開平9-006881號公報專利文獻2 :日本特開2003-317073號公報
發(fā)明內(nèi)容
_7] 發(fā)明要解決的問題然而,一般來說,在神經(jīng)網(wǎng)絡中采用遺傳算法的方法不區(qū)分表現(xiàn)型以及基因型地進行搜索,因此導致搜索效率差,并且在節(jié)點數(shù)増加的結(jié)構(gòu)中會耗費更多捜索時間。長時間且相當數(shù)量的捜索會使系統(tǒng)的規(guī)模也變大,在采用遺傳算法的情況下,從成本、設(shè)置地點的方面考慮,僅能夠由大規(guī)模的企業(yè)、研究所等從事該捜索。由此,在規(guī)模比較小的エ廠、開發(fā)現(xiàn)場等的系統(tǒng)中難以實現(xiàn)神經(jīng)網(wǎng)絡。在這里,本發(fā)明要解決的主要目的如下。S卩,本發(fā)明的第一目的在于提供一種最優(yōu)方法捜索方法以及最優(yōu)方法捜索系統(tǒng),通過將細胞分化的結(jié)構(gòu)設(shè)為算法并事先使其完成一定程度的學習來提高搜索效率并導出最優(yōu)方法。另外,本發(fā)明的第二目的在于提供一種最優(yōu)方法捜索方法以及最優(yōu)方法捜索系統(tǒng),通過簡化捜索處理使得能夠?qū)眠z傳算法的神經(jīng)網(wǎng)絡作為軟件來進行組裝。用于解決問題的方案本發(fā)明方法在解決上述問題時尋求如下ー種方法,其特征在于,在任意的環(huán)境下,將環(huán)境狀態(tài)識別為數(shù)據(jù),通過使預先設(shè)定并生成的神經(jīng)網(wǎng)絡自適應于該數(shù)據(jù)來進行與上述環(huán)境狀態(tài)相應的動作,并且,通過多次執(zhí)行該動作的處理,來從多次的該處理中導出最有效率地進行動作的設(shè)定來作為最優(yōu)方法。另外,本發(fā)明系統(tǒng)在解決上述問題時尋求如下一種結(jié)構(gòu),其特征在于,具備執(zhí)行部,其進行了初始設(shè)定,使得在任意的環(huán)境下都使神經(jīng)網(wǎng)絡自適應來導出與上述環(huán)境相應的動作并執(zhí)行該動作;以及評價部,其對該執(zhí)行部提供上述初始設(shè)定,并且在上述動作結(jié)束后對該執(zhí)行部的動作內(nèi)容進行評價,其中,該評價部使上述動作主體執(zhí)行多次上述動作,從多個導出的該動作結(jié)果中將進行最有效率的動作的執(zhí)行部的初始設(shè)定作為最優(yōu)方法而導出。當進ー步具體且詳細地說明時,在解決該問題時,本發(fā)明通過采用下面列舉的從上位概念到下位概念的新的特征性結(jié)構(gòu)來達到上述目的。S卩,本發(fā)明方法的第一特征在于,采用以下的最優(yōu)方法捜索方法的結(jié)構(gòu)該最優(yōu)方法捜索方法具備執(zhí)行部,其進行了初始設(shè)定,使得在任意的環(huán)境下都使神經(jīng)網(wǎng)絡自適應于上述環(huán)境來導出與上述環(huán)境相應的動作并執(zhí)行該動作;以及評價部,其對該執(zhí)行部提供上述初始設(shè)定,并且在上述動作結(jié)束后對該執(zhí)行部的動 作內(nèi)容進行評價,其中,該評價部使上述動作主體執(zhí)行多次上述動作,將導出的多個動作的結(jié)果中執(zhí)行部進行最有效率的動作的初始設(shè)定作為最優(yōu)方法而導出,該最優(yōu)方法捜索方法的特征在于,包括以下步驟個體定義步驟,上述評價部根據(jù)虛擬的細胞(節(jié)點)和細胞分裂所需的分子(公式群)的組合來生成初始設(shè)定,將該初始設(shè)定發(fā)送給上述執(zhí)行部;執(zhí)行部動作步驟,該執(zhí)行部如下這樣生成神經(jīng)網(wǎng)絡,該執(zhí)行部在基于上述初始設(shè)定創(chuàng)建出該神經(jīng)網(wǎng)絡內(nèi)部的虛擬的細胞分裂空間后,配置該初始設(shè)定中所包含的上述節(jié)點,通過根據(jù)上述函數(shù)執(zhí)行計算處理來使節(jié)點分裂以生成神經(jīng)網(wǎng)絡,并且在該神經(jīng)網(wǎng)絡生成后,通過將由該執(zhí)行部所具備的傳感器檢測到的輸入數(shù)據(jù)輸入到該神經(jīng)網(wǎng)絡來導出輸出數(shù)據(jù),使該執(zhí)行部所具備的動作部基于該輸出數(shù)據(jù)進行動作,將該動作的結(jié)果發(fā)送給上述評價部;以及個體評價步驟,上述評價部基于接收到的上述動作的結(jié)果,生成上述執(zhí)行部的個體評價,通過將上述步驟依次執(zhí)行多次,來從上述個體評價中導出最有效率的動作。本發(fā)明的第二特征在于,采用以下的最優(yōu)方法搜索方法的結(jié)構(gòu)本發(fā)明方法的第一特征中的上述評價部將用于創(chuàng)建神經(jīng)網(wǎng)絡的坐標數(shù)據(jù)的值、上述執(zhí)行部的評價基準的值、上述節(jié)點的值以及上述公式群的值作為參數(shù)保存到數(shù)據(jù)庫,該評價部在使上述執(zhí)行部動作時,將從上述數(shù)據(jù)庫選擇出的上述參數(shù)生成為初始設(shè)定,并發(fā)送給該執(zhí)行部,并且,該評價部接收基于上述初始設(shè)定進行了動作的上述執(zhí)行部的動作的結(jié)果,生成評價作為該機器人的個體評價并存儲到上述數(shù)據(jù)庫,由此從存儲于上述數(shù)據(jù)庫的信息中搜索進行最有效率的動作的初始設(shè)定的組合。本發(fā)明方法的第三特征在于,采用以下的最優(yōu)方法搜索方法的結(jié)構(gòu)本發(fā)明方法的第一或第二特征中的上述執(zhí)行部利用在內(nèi)部檢測上述執(zhí)行部的動作狀態(tài)的評價單元,將檢測的結(jié)果發(fā)送給上述評價部。本發(fā)明方法的第四特征在于,采用以下的最優(yōu)方法搜索方法的結(jié)構(gòu)本發(fā)明方法的第一或第二特征中的上述執(zhí)行部基于從上述評價部接收到的上述初始設(shè)定來構(gòu)成上述神經(jīng)網(wǎng)絡,并且,上述執(zhí)行部通過上述執(zhí)行部所具備的傳感器部檢測上述環(huán)境的狀態(tài)作為輸入數(shù)據(jù),當構(gòu)成了上述神經(jīng)網(wǎng)絡時,上述執(zhí)行部將上述輸入數(shù)據(jù)輸入到該神經(jīng)網(wǎng)絡,由此導出輸出數(shù)據(jù),對上述執(zhí)行部所具備的動作部發(fā)送上述輸出數(shù)據(jù),由此上述執(zhí)行部進行動作。本發(fā)明方法的第五特征在于,采用以下的最優(yōu)方法搜索方法的結(jié)構(gòu)在本發(fā)明方法的第一、第二或第三特征中,關(guān)于上述節(jié)點,作為區(qū)分該節(jié)點的特性的參數(shù)而保存配置該節(jié)點的坐標、連接該節(jié)點的多條連接線的連接強度、該節(jié)點的連接目的地、該節(jié)點的電位以及上述公式群在該節(jié)點中的利用率,并且,上述公式群的參數(shù)包括表示該公式群中的各個公式之間的計算規(guī)則的公式和表示上述節(jié)點的參數(shù)的變更度的公式。本發(fā)明系統(tǒng)的第一特征在于,采用以下的最優(yōu)方法捜索系統(tǒng)的結(jié)構(gòu)該最優(yōu)方法捜索系統(tǒng)具備執(zhí)行部,其進行了初始設(shè)定,使得在任意的環(huán)境下都使神經(jīng)網(wǎng)絡自適應于上述環(huán)境來導出與上述環(huán)境相應的動作并執(zhí)行該動作;以及評價部,其對該執(zhí)行部提供上述初始設(shè)定,并且在上述動作結(jié)束后對該執(zhí)行部的動作內(nèi)容進行評價,其中,該評價部使上述執(zhí)行部執(zhí)行多次上述動作,搜索導出的多個 動作的結(jié)果中執(zhí)行部進行最有效率的動作的初始設(shè)定,該最優(yōu)方法捜索系統(tǒng)的特征在干,上述執(zhí)行部構(gòu)成神經(jīng)網(wǎng)絡,該神經(jīng)網(wǎng)絡在內(nèi)部具備虛擬的細胞分裂區(qū)間,基于由上述評價部設(shè)定的作為虛擬細胞的節(jié)點以及相當于細胞分裂所需的虛擬分子的公式,在該細胞分裂區(qū)間內(nèi)對節(jié)點數(shù)量進行調(diào)整,并且將由該執(zhí)行部所具備的傳感器檢測出的結(jié)果作為輸入數(shù)據(jù),使該輸入數(shù)據(jù)在節(jié)點中進行傳播以導出上述動作所需的信號,并通過該執(zhí)行部進行動作輸出。本發(fā)明系統(tǒng)的第二特征在于,采用以下的最優(yōu)方法捜索系統(tǒng)的結(jié)構(gòu)本發(fā)明系統(tǒng)的第一特征中的上述執(zhí)行部具備傳感器部,其檢測上述環(huán)境的狀態(tài);搜索部,其構(gòu)成上述神經(jīng)網(wǎng)絡;動作部,其基于由上述捜索部輸出的數(shù)據(jù)來執(zhí)行上述動作;評價單元,其檢測上述執(zhí)行部的動作是成功還是失敗,將該動作是成功還是失敗檢測為動作評價;以及通信單元,其與上述評價部之間相互通信上述評價單元中的上述動作評價以及上述初始設(shè)定。本發(fā)明系統(tǒng)的第三特征在于,采用以下的最優(yōu)方法捜索系統(tǒng)的結(jié)構(gòu)本發(fā)明系統(tǒng)的第一或第二特征中的上述評價部具備數(shù)據(jù)庫,其存儲對上述執(zhí)行部發(fā)送的上述節(jié)點的參數(shù)、上述函數(shù)的參數(shù)以及對上述執(zhí)行部的評價;個體定義模塊,其從上述數(shù)據(jù)庫提取上述節(jié)點的參數(shù)的值以及上述函數(shù)的參數(shù)的值,生成發(fā)送給上述執(zhí)行部的上述節(jié)點的初始設(shè)定以及上述函數(shù)的初始設(shè)定;個體評價模塊,其根據(jù)從上述執(zhí)行部接收到的上述動作評價和對該執(zhí)行部發(fā)送的初始設(shè)定來生成該執(zhí)行部的個體評價,并寫入到數(shù)據(jù)庫進行保存;執(zhí)行管理模塊,其指示上述個體定義模塊、上述個體評價模塊以及上述執(zhí)行部執(zhí)行各動作;以及通信単元,其進行與上述執(zhí)行部之間的通信。本發(fā)明系統(tǒng)的第四特征在于,采用以下的最優(yōu)方法捜索系統(tǒng)的結(jié)構(gòu)在本發(fā)明系統(tǒng)的第一、第二或第三特征中,關(guān)于上述節(jié)點,作為區(qū)分該節(jié)點的特性的參數(shù)而保存配置該節(jié)點的坐標、連接該節(jié)點的多條連接線的連接強度、該節(jié)點的連接目的地、該節(jié)點的電位以及上述公式群在該節(jié)點中的利用率。本發(fā)明系統(tǒng)的第五特征在于,根據(jù)權(quán)利要求6、7或8所述的最優(yōu)方法捜索系統(tǒng),本發(fā)明系統(tǒng)的第一、第二或第三特征中的上述公式群的參數(shù)包括表示該公式群中的各個公式之間的計算規(guī)則的公式和表示上述節(jié)點的參數(shù)的變更度的公式。發(fā)明的效果根據(jù)本發(fā)明,通過將細胞分化的結(jié)構(gòu)設(shè)為細胞分化算法而應用于神經(jīng)網(wǎng)絡,能夠?qū)σ酝眠z傳算法時不進行區(qū)分的表現(xiàn)型以及基因型進行區(qū)分,通過省略被判斷為是對檢測用于解決問題的最優(yōu)方法無用的處理,能夠有效率地捜索最優(yōu)方法。另外,通過大幅省略無用的處理,能夠?qū)⑸窠?jīng)網(wǎng)絡組裝到小規(guī)模系統(tǒng),從而能夠?qū)崟r地搜索最優(yōu)方法。
圖I是本發(fā)明的系統(tǒng)例所涉及的系統(tǒng)結(jié)構(gòu)圖。圖2是本發(fā)明的系統(tǒng)例所涉及的檢測部12的功能結(jié)構(gòu)圖。圖3是本發(fā)明的遺傳算法例中的參數(shù)的概要圖。圖4是表示本發(fā)明的遺傳算法例的流程圖。圖5的(a)是表示節(jié)點的増加狀態(tài) 的圖,圖5的(b)是表示神經(jīng)網(wǎng)絡中的主要部分結(jié)構(gòu)的圖。圖6是表示本發(fā)明的實施方式例的系統(tǒng)結(jié)構(gòu)圖。附圖標記說明a、α I :最優(yōu)方法搜索系統(tǒng);1 :執(zhí)行部;11、14a :傳感器部;lla CCD照相機;12 檢測部;12a :輸入數(shù)據(jù)接收部;12b :輸入數(shù)據(jù)信號轉(zhuǎn)換部;12c :信號計算部;12d :輸出數(shù)據(jù)信號轉(zhuǎn)換部;12e :輸出數(shù)據(jù)發(fā)送部;13、14b :動作部;14 :評價單元;15、21 :通信單元;2 :評價部;22 :數(shù)據(jù)庫;23 :個體定義模塊;24 :個體評價模塊;25 :執(zhí)行管理模塊;in :輸入數(shù)據(jù);ins :輸入數(shù)據(jù)信號;out :輸出數(shù)據(jù);outS :輸出數(shù)據(jù)信號;e :評價信息;es :初始設(shè)定;s :分數(shù)評價;RP :執(zhí)行部參數(shù);R_01 :坐標數(shù)據(jù);R_02 :分數(shù);R-03 :代碼;NP :節(jié)點參數(shù);N-Ol :坐標;N-02 :突觸連接強度;N-03 :突觸連接目的地;N_04 :節(jié)點電位;N_05 :對象執(zhí)行系數(shù);0P :對象參數(shù);0-01 :運算發(fā)生概率;0-02 :功能發(fā)生概率;Ν1···1 :節(jié)點。
具體實施例方式下面,參照附圖來說明本發(fā)明的系統(tǒng)結(jié)構(gòu)例、本系統(tǒng)結(jié)構(gòu)中的算法以及實施方式例。(系統(tǒng)結(jié)構(gòu)例)圖I是本發(fā)明所涉及的系統(tǒng)結(jié)構(gòu)圖。如該圖所示,最優(yōu)方法捜索系統(tǒng)α包括執(zhí)行部I和評價部2,該執(zhí)行部I通過傳感器感知動作環(huán)境,通過神經(jīng)網(wǎng)絡實施最優(yōu)動作,該評價部2對執(zhí)行部I進行基本設(shè)定,并且對執(zhí)行部I的動作結(jié)果進行評價。執(zhí)行部I包括傳感器部11,其檢測動作環(huán)境以及執(zhí)行部I的動作狀況,將該狀況數(shù)據(jù)化為輸入數(shù)據(jù)in ;檢測部12,其根據(jù)通過傳感器部11識別出的輸入數(shù)據(jù)in來導出動作所需的輸出數(shù)據(jù)out ;動作部13,其基于從檢測部12接收到的輸出數(shù)據(jù)out來執(zhí)行動作;評價單元14,其對執(zhí)行部I的動作進行評價;以及通信単元15,其將評價単元14的評價數(shù)據(jù)、通過傳感器部11獲得的動作部13的動作狀況發(fā)送到評價部2。傳感器部11具有用于感知通過自然現(xiàn)象、機械而產(chǎn)生的電、磁、熱、聲音、光等發(fā)生變化的環(huán)境狀態(tài)的傳感器,該傳感器的種類能夠根據(jù)執(zhí)行部I的動作內(nèi)容而適當變更。例如,在想要視覺檢測固定空間的狀態(tài)變化的情況下,也可以利用CCD照相機、超光譜傳感器等圖像傳感器。圖2示出執(zhí)行部I的檢測部12的詳細的結(jié)構(gòu)內(nèi)容。檢測部12是根據(jù)如上所述那樣由傳感器部11識別出的環(huán)境狀態(tài)來導出動作部
13要進行動作的動作數(shù)據(jù)以達到所賦予的目的的處理部,包括輸入數(shù)據(jù)接收部12a,其接收從傳感器部11輸入的輸入數(shù)據(jù)in ;輸入數(shù)據(jù)信號轉(zhuǎn)換部12b,其將來自輸入數(shù)據(jù)接收部12a的輸入數(shù)據(jù)in轉(zhuǎn)換為輸入數(shù)據(jù)信號ins ;信號計算部12c,其組裝有神經(jīng)網(wǎng)絡,根據(jù)從輸入數(shù)據(jù)信號轉(zhuǎn)換部12b接收到的輸入數(shù)據(jù)信號ins來計算動作部13進行動作所需的輸出數(shù)據(jù)信號outs ;輸出數(shù)據(jù)信號轉(zhuǎn)換部12d,其從信號計算部12c接收輸出數(shù)據(jù)信號outs并轉(zhuǎn)換成能夠應用于動作部13的輸出數(shù)據(jù)out ;以及輸出數(shù)據(jù)發(fā)送部12e,其將輸出數(shù)據(jù)out發(fā)送給動作部13。此外,在信號計算部12c內(nèi)采用了 神經(jīng)網(wǎng)絡,以由信號計算部12c根據(jù)輸入數(shù)據(jù)信號ins導出輸出數(shù)據(jù)信號outs,關(guān)于該神經(jīng)網(wǎng)絡的算法,另外詳細地進行說明。動作部13與傳感器部11同樣地,能夠根據(jù)執(zhí)行部I的動作內(nèi)容適當?shù)嘏渲盟璧膭幼餮b置、設(shè)備,其種類沒有限定。例如,如果以移動執(zhí)行部I為目的則利用驅(qū)動用馬達,在由設(shè)置于執(zhí)行部I的機器手進行動作的情況下、以使執(zhí)行部I主體上升下降為目的的情況下,只要利用與各動作相應的致動器即可。評價單元14具備用于檢測在執(zhí)行部I的評價中使用的執(zhí)行部I的可動狀況的傳感器部14a,并且還具備評價單元組件中的動作部14b,將動作部14b的結(jié)果使用于執(zhí)行部I的評價。此外,如下面的例所示,并不必須具備動作部14b。作為一例,在執(zhí)行部I以回收、選擇某特定物質(zhì)為動作目的的情況下,通過動作部13使執(zhí)行部I移動到目標物質(zhì)處,由此評價単元14嘗試目的物質(zhì)的回收,如果回收成功(或失敗),將執(zhí)行部I的目的動作成功(或失敗)這樣的評價結(jié)果轉(zhuǎn)換為作為評價信息e的信號,經(jīng)由通信単元15發(fā)送給評價部2。作為其它例,在執(zhí)行部I以進行灑水、照射可視光、放射線等、送風等為目的的情況下,傳感器部14a預先調(diào)查濕度、溫度等環(huán)境狀態(tài),在動作部13移動到規(guī)定的位置處后,通過傳感器部14a來檢測狀態(tài)的變化,將執(zhí)行動作后的動作的結(jié)果(成功/失敗)作為評價信息e發(fā)送給評價部2。在上述的例中,在能夠通過檢測環(huán)境狀態(tài)來判斷執(zhí)行部I的執(zhí)行結(jié)果的情況下,評價單元14的結(jié)構(gòu)內(nèi)容也可以僅為傳感器部14a,但是在評價單元14并不限于僅檢測狀態(tài)還進行回收作業(yè)的情況下、需要使傳感器部14a移動來檢測狀態(tài)的情況下,還要包括動作部 14b。執(zhí)行部I的通信単元15以及位于評價部2的通信単元21是用于相互進行通信的単元,執(zhí)行部I中的作業(yè)的評價信息e通過通信単元15發(fā)送給通信単元21,通信単元21對個體評價模塊22發(fā)送評價信息e,由此在評價部2中對執(zhí)行部I個體進行評價。接著,對評價部2進行說明。評價部2是進行以下處理的處理部在執(zhí)行部I動作前,對執(zhí)行部I進行神經(jīng)網(wǎng)絡的初始設(shè)定,并且,將執(zhí)行部I的任意的動作時間作為ー個分害I],將動作后的評價單元14對執(zhí)行部I的動作內(nèi)容進行評價而得到的評價信息e作為執(zhí)行部I的一個個體評價進行保存,對多次動作或多臺執(zhí)行部I各自的評價信息e進行管理,由此導出最有效率的執(zhí)行動作的初始設(shè)定作為最優(yōu)方法。評價部2包括通信単元21,其對執(zhí)行部I發(fā)送初始設(shè)定e S,并且接收評價単元
14對執(zhí)行部I的動作評價;數(shù)據(jù)庫22,其保存節(jié)點N的參數(shù)的組合群、執(zhí)行部I的評價信息e以及個體信息eo ;個體定義模塊23,其將初始設(shè)定es從數(shù)據(jù)庫22發(fā)送給執(zhí)行部I ;個體評價模塊24,其根據(jù)從執(zhí)行部I發(fā)送的執(zhí)行部I的評價信息e來對執(zhí)行部I進行評價,將對評價結(jié)果進行評分而得到的分數(shù)評價s寫入到數(shù)據(jù)庫22來進行保存;以及執(zhí)行管理模塊25,其對個體定義模塊23、個體評價模塊24以及執(zhí)行部I發(fā)送動作的執(zhí)行命令。
以上,說明了本發(fā)明系統(tǒng)中的各處理部,但在本發(fā)明系統(tǒng)中,也可以使評價部2附屬在執(zhí)行部I的內(nèi)部等,將全體構(gòu)成在同一裝置內(nèi),還可以將評價部2構(gòu)成在個人計算機內(nèi)部,使該個人計算機與執(zhí)行部I通過有線或無線連接來進行數(shù)據(jù)的交換。并且,如果對評價部2連接多臺執(zhí)行部I并一次從多臺執(zhí)行部I獲得評價信息e,則能夠更有效率地導出最優(yōu)方法的捜索。(細胞分化算法)接著,說明為了捜索最優(yōu)方法而 在信號計算部12內(nèi)實施的神經(jīng)網(wǎng)絡中采用的細胞分化算法。此外,本發(fā)明的目的在于,如非專利文獻I中記載的細胞分化的結(jié)構(gòu)所述的那樣,將在細胞分裂的過程中細胞或分子的狀態(tài)隨著細胞分化的進行而變化的現(xiàn)象進行系統(tǒng)化。細胞分化中的具體用語、分化的狀態(tài)基于非專利文獻1,因此省略對這些文獻所示的細胞分化的結(jié)構(gòu)的詳細說明。非專利文獻I :生命とは何か一複雑系生命論序説、東京大學出版會、金子邦男、2003 年首先,說明在將上述文獻中記載的細胞分化的結(jié)構(gòu)進行系統(tǒng)化后,如何將細胞分化所需的各要素應用于系統(tǒng)。在細胞分化算法中,在本發(fā)明中,使用細胞分裂空間(培養(yǎng)基)RP、節(jié)點(細胞)NP以及分子OP這三個要素,在信號計算部2中虛擬地實施細胞分化。對于各要素,將由數(shù)值、公式構(gòu)成的數(shù)據(jù)群作為表示各自特征的參數(shù)進行保存,通過由各要素中的各數(shù)據(jù)相互進行計算來實施分裂。如非專利文獻I中所述,在細胞分化的過程中,當細胞的數(shù)量通過分裂而增加時,可以看到細胞內(nèi)的分子狀態(tài)發(fā)生變化。本發(fā)明中采用了如下技術(shù)利用該細胞內(nèi)的分子狀態(tài)發(fā)生變化的特性,在設(shè)置了輸入側(cè)和輸出側(cè)的虛擬細胞分裂空間實施細胞分裂,之后,將靠近初始值的節(jié)點N與輸入側(cè)連接,將細胞分化后參數(shù)發(fā)生變動的節(jié)點N與輸出側(cè)連接,使信號從分裂后的輸入側(cè)向節(jié)點群進行傳播,由此輸出側(cè)所接收到的信號即為針對輸入信號導出的最優(yōu)結(jié)果。下面,根據(jù)圖3的參數(shù)的概念以及圖4的流程圖,說明信號計算部12c所實施的應用了細胞分化算法的神經(jīng)網(wǎng)絡的處理過程。圖3示出了個體定義模塊23內(nèi)所保存的要分配給執(zhí)行部I的執(zhí)行部參數(shù)RP、作為節(jié)點N的初始值而設(shè)定的節(jié)點參數(shù)NP以及在節(jié)點N的分裂中利用的由公式群構(gòu)成的對象參數(shù)OP。首先,執(zhí)行部參數(shù)RP是用于創(chuàng)建虛擬的細胞分裂空間的參數(shù),在每次實施細胞分化算法時作為初始值設(shè)定到執(zhí)行部I。作為執(zhí)行部參數(shù)RP的結(jié)構(gòu)要素,包括坐標數(shù)據(jù)R-01,其以數(shù)值表示細胞分裂空間所需的坐標信息;進行細胞分化后的執(zhí)行部I的評價分數(shù)R-02 ;以及代碼R-03,其相當于分配給每個執(zhí)行部I的節(jié)點N的細胞遺傳代碼。此外,分數(shù)R-02是用于在執(zhí)行部I所要實施的作業(yè)中將作業(yè)效率度數(shù)值化以進行評價的值,從評價單元14接收該分數(shù)。另ー方面,節(jié)點參數(shù)NP包括節(jié)點坐標N-01,其表示配置在坐標數(shù)據(jù)R-Ol中的成為最初的節(jié)點的節(jié)點N的坐標;突觸連接強度N-02,其表示節(jié)點N的突觸的連接度;突觸連接目的地N-03,其表示作為突觸的連接目的地的節(jié)點N ;節(jié)點電位N-04,其表示連接目的地節(jié)點N所具有的電位;以及對象執(zhí)行頻率N-05,其表示節(jié)點N中的對象的數(shù)量。此外,以數(shù)值來表現(xiàn)這些參數(shù)。另外,節(jié)點電位N-04在細胞分裂時不 被利用,其是表示成為節(jié)點N向其它節(jié)點傳遞信號的契機的閾值。在此,節(jié)點電位N-04對從其它節(jié)點傳遞來的值進行累計。 并且,對象執(zhí)行頻率N-05表示存在于節(jié)點N內(nèi)的對象O (分子)的數(shù)量,設(shè)定為每次分裂時節(jié)點N內(nèi)的對象的數(shù)量減半。接著,說明對象參數(shù)0P。對象O相當于細胞分裂中的分子,分子在生物學上也存在相當數(shù)量的種類,因此為了更接近實際的細胞分裂狀態(tài),需要在初始設(shè)定階段事先定義各種種類的對象01…Ok(k為自然數(shù))和分別對應的對象參數(shù)0P1...OPk。對象參數(shù)OP的構(gòu)成要素包括表示對象之間的反應系數(shù)的運算發(fā)生概率0-01和使節(jié)點參數(shù)NP的各項目的值變動的功能發(fā)生概率0-02,分別以公式來進行表現(xiàn)。運算發(fā)生概率0-01用于在對象01中設(shè)定與除該對象01以外而設(shè)定的所有對象02 對象Ok(k為自然數(shù))的各自的反應系數(shù)和通過該反應生成的新的對象Ok+Ι,在所有對象O中進行該設(shè)定。功能發(fā)生概率0-02能夠根據(jù)使對象O具有何種功能來適當?shù)刈兏O(shè)定值。例如,設(shè)定使突觸的連接強度N-02、節(jié)點電位N-04的設(shè)定值改變的公式等在對功能發(fā)生概率0-02設(shè)定初始值的時刻設(shè)定所需的公式。當由個體定義模塊23將以上值作為初始值設(shè)定到信號計算部12c時,在信號計算部12c內(nèi)部執(zhí)行虛擬的細胞分裂。接著,利用圖4的流程圖來表示由信號計算部12c實施細胞分化算法的步驟。首先,個體定義模塊設(shè)定執(zhí)行部參數(shù)RP、節(jié)點參數(shù)NP以及對象參數(shù)OP的初始值,將這些參數(shù)發(fā)送到信號計算部12c (STl)。此時設(shè)定的各參數(shù)被保存在數(shù)據(jù)庫22內(nèi),可以通過個體定義模塊隨機或以任意規(guī)則設(shè)定該參數(shù),另外,也能夠根據(jù)需要來更新該參數(shù)。此外,針對每個執(zhí)行部I設(shè)定節(jié)點參數(shù)NP,而為了在同一條件下對執(zhí)行部I的動作進行比較評價,對于對象參數(shù)0P,對評價中使用的多個執(zhí)行部I設(shè)定同一參數(shù)。信號計算部12c根據(jù)從個體定義模塊23接收到的初始設(shè)定es來生成虛擬的細胞分裂空間,構(gòu)成應用細胞分化算法的神經(jīng)網(wǎng)絡(ST2)。接著,信號計算部12c根據(jù)節(jié)點參數(shù)NP在神經(jīng)網(wǎng)絡內(nèi)配置節(jié)點N,進行個體的定義(S T3),之后使對象O隨機存在,當對象O的配置數(shù)量達到一定數(shù)量時開始進行分裂(ST4)。節(jié)點N I根據(jù)執(zhí)行系數(shù)N-05從對象參數(shù)OP內(nèi)的公式群中選擇運算發(fā)生概率0_01或功能發(fā)生概率0-02,通過代入節(jié)點參數(shù)N的值來實施虛擬的細胞分裂,節(jié)點NI連續(xù)分裂為節(jié)點N2、節(jié)點N3。此時,節(jié)點N2、節(jié)點N3的節(jié)點參數(shù)NP與節(jié)點NI基本相同,僅執(zhí)行系數(shù)N_05的系數(shù)值減半。進ー步,節(jié)點N2、節(jié)點N3與節(jié)點NI中的分裂時同樣地,從隨機提示的公式群中選擇運算發(fā)生概率0-01或功能發(fā)生概率0-02,代入而分裂為節(jié)點N4、節(jié)點N5、節(jié)點N6、節(jié)點N7,通過反復進行該エ序,節(jié)點N的總數(shù)增加。
圖5的(a)是可視地表示在配置節(jié)點NI后節(jié)點數(shù)量漸漸增加的樣子以及通過反復分裂而存在于節(jié)點N內(nèi)的對象參數(shù)OP的特性發(fā)生變化的例子的圖。如該圖所示,在節(jié)點NI…節(jié)點Nk(k為自然數(shù))増加的過程中,在節(jié)點數(shù)量増加的初始階段,分裂頻繁地進行,因此節(jié)點N的數(shù)量爆發(fā)性增加,但分配給細胞分裂空間的對象參數(shù)OP的公式群的個數(shù)被設(shè)定為固定數(shù)量,因此節(jié)點NI…節(jié)點Nk間開始相互爭奪對象參數(shù)0P,每次分裂時執(zhí)行系數(shù)N-05降低,并且分裂次數(shù)也減少,在某個固定的分裂結(jié)束時節(jié)點N I…節(jié)點Nk的個數(shù)趨于穩(wěn)定,在分裂的過程中,根據(jù)節(jié)點N的存在位置不同而節(jié)點N所包含的對象的特性不同這樣的特征開始顯現(xiàn),不同特質(zhì)的節(jié)點N分別存在于輸入側(cè)和輸出側(cè)。圖5的(b)以圖5的(a)的圖為基礎(chǔ),是表現(xiàn)穩(wěn)定后的節(jié)點NI…節(jié)點Nk實際上通過突觸分別與輸入側(cè)/輸出側(cè)連接而形成神經(jīng)網(wǎng) 絡的圖。信號計算部12c在形成出的神經(jīng)網(wǎng)絡中,以如圖5的(b)所示那樣節(jié)點N通過突觸分別與輸入側(cè)和輸出側(cè)連接為契機,從輸入側(cè)對節(jié)點NI…節(jié)點Nk發(fā)送輸入信號ins。于是,信號在節(jié)點NI…節(jié)點Nk之間傳播,從輸出側(cè)的節(jié)點NI…節(jié)點Nk輸出的信號作為用于動作部13的動作的輸出信號outs而輸出。計算此時的輸出信號outs的自適應度(ST5),判斷計算結(jié)果是否為期待的結(jié)果(ST6)。此外,對于作為判斷材料的自適應度的數(shù)據(jù),可以包含在初始設(shè)定es中,或者也可以事先保存在信號計算部12c中。在沒有獲得期待的結(jié)果的情況下,從節(jié)點NI…節(jié)點Nk中選擇優(yōu)勢節(jié)點(ST7),根據(jù)需要更新所選擇的節(jié)點Nk的設(shè)定以引起虛擬的突然變異(ST8),使其再次交叉(ST9),由此進行新的分裂,重復ST3之后的流程直到獲得期待的特性。突然變異中所使用的數(shù)據(jù)也與自適應度的判斷數(shù)據(jù)同樣地,事先包含在初始設(shè)定es或信號計算部12c中。如果在ST6中獲得期待的特性,則將獲得的信號輸出(STlO),結(jié)束流程,完成神經(jīng)網(wǎng)絡。上面就是采用細胞分化結(jié)構(gòu)的本發(fā)明的算法的概要。(實施方式例)接著,利用圖6的結(jié)構(gòu)圖來說明實施方式例。此外,在本實施方式中,作為具體例,例示利用了本發(fā)明系統(tǒng)的垃圾收集機器人,但本發(fā)明系統(tǒng)的利用例并不限定于此。在本實施方式例中,提供ー種目的如下的系統(tǒng)假設(shè)垃圾回收執(zhí)行部I是在如廣場那樣的場所回收紙屑、空瓶等垃圾的機器人,由設(shè)置作為傳感器部的CCD照相機Ila拍攝動作環(huán)境下的影像,根據(jù)CCD照相機Ila的影像數(shù)據(jù),動作部13移動到異物掉落的位置,在作為評價単元的垃圾回收單元14通過傳感器識別到異物時,作為垃圾進行回收。首先,評價部2將在個體定義模塊23內(nèi)針對執(zhí)行部I設(shè)定的由執(zhí)行部參數(shù)RP、節(jié)點參數(shù)NP以及對象參數(shù)OP構(gòu)成的初始設(shè)定es通過通信単元21發(fā)送到執(zhí)行部I的通信單元15,通信単元15在將初始設(shè)定es轉(zhuǎn)移給信號計算部12c的同吋,向傳感器部11發(fā)送開始命令。為了回收垃圾,傳感器部11通過CXD照相機Ila拍攝動作環(huán)境,當檢測到存在異物(垃圾)時,作為輸入數(shù)據(jù)in發(fā)送給輸入數(shù)據(jù)接收部12a,輸入數(shù)據(jù)接收部12a將接收到的輸入數(shù)據(jù)in發(fā)送給輸入數(shù)據(jù)信號轉(zhuǎn)換部12b。輸入數(shù)據(jù)信號轉(zhuǎn)換部12b將接收到的輸入數(shù)據(jù)in轉(zhuǎn)換為神經(jīng)網(wǎng)絡用的輸入數(shù)據(jù)信號ins,并發(fā)送給信號計算部12c。另ー方面,信號計算部12c基于從通信単元15接收到的初始設(shè)定es,在配置節(jié)點N后,開始調(diào)整節(jié)點數(shù)量,創(chuàng)建神經(jīng)網(wǎng)絡。信號計算部12c在神經(jīng)網(wǎng)絡完成時,對完成的神經(jīng)網(wǎng)絡輸入輸入數(shù)據(jù)信號ins。此夕卜,在信號計算部12c中,如果 在創(chuàng)建神經(jīng)網(wǎng)絡前從數(shù)據(jù)信號轉(zhuǎn)換部發(fā)送了輸入數(shù)據(jù)信號ins,則信號計算部12c原樣保存輸入數(shù)據(jù)信號ins,在神經(jīng)網(wǎng)絡完成后開始將輸入數(shù)據(jù)信號ins輸入到神經(jīng)網(wǎng)絡。當通過信號在神經(jīng)網(wǎng)絡中的節(jié)點NI…節(jié)點Nk中傳播而輸出輸出數(shù)據(jù)信號outs時,信號計算部12c將輸出數(shù)據(jù)信號outs轉(zhuǎn)移給輸出數(shù)據(jù)信號轉(zhuǎn)換部12d。當在輸出數(shù)據(jù)信號轉(zhuǎn)換部12d中將輸出數(shù)據(jù)信號outs轉(zhuǎn)換為動作用的輸出數(shù)據(jù)out時,輸出數(shù)據(jù)out通過輸出數(shù)據(jù)發(fā)送部12e被發(fā)送到動作部13,動作部13根據(jù)輸出數(shù)據(jù)out移動到指定的位置。在動作部13結(jié)束動作時,垃圾回收單元14通過傳感器部14a檢測異物,如果存在異物就通過動作部14b回收垃圾,將垃圾回收成功的評價信息e通過通信単元15發(fā)送給評價部2。在傳感器部14a檢測不到異物的情況下,將垃圾回收失敗的評價信息e發(fā)送給評價部2。個體評價模塊24利用接收到的評價信息e來生成包括垃圾回收執(zhí)行部I的固有數(shù)據(jù)以及機器人回收結(jié)果的分數(shù)評價S,當向執(zhí)行管理模塊25發(fā)送分數(shù)評價s的生成結(jié)果時,執(zhí)行管理模塊25開始對數(shù)據(jù)庫的寫入命令,將分數(shù)評價s寫入到數(shù)據(jù)庫。執(zhí)行部I在所設(shè)定的任意時間中重復垃圾的捜索、回收,毎次都將結(jié)果發(fā)送給評價部2,在評價部2中存儲對執(zhí)行部I的評價數(shù)據(jù)。在評價部2中,當任意的期間結(jié)束時,對執(zhí)行部I的垃圾回收狀況的分數(shù)評價s進行匯總并將其作為對執(zhí)行部I中的節(jié)點NI的評價而保存到數(shù)據(jù)庫22中。評價部2如果需要再次進行評價,則通過將初始設(shè)定es發(fā)送給執(zhí)行部I來再一次重復垃圾回收及其評價。評價部2將任意次數(shù)的分數(shù)數(shù)據(jù)進行比較或?qū)⑷我馀_數(shù)的執(zhí)行部I的分數(shù)數(shù)據(jù)進行比較,將成果最高的執(zhí)行部I中的節(jié)點NI的參數(shù)作為最優(yōu)參數(shù)而導出。以上,關(guān)于本發(fā)明的實施方式,說明了最優(yōu)方法捜索系統(tǒng)的實施例,但本發(fā)明并不僅限定于上述的方法,在專利權(quán)利要求所記載的范圍內(nèi)能夠適當?shù)貙嵤┳兏.a(chǎn)業(yè)上的可利用件本發(fā)明的最優(yōu)方法捜索方法以及最優(yōu)方法捜索系統(tǒng)能夠利用神經(jīng)網(wǎng)絡更有效率地實時導出輸出數(shù)據(jù),因此在軟件上也能夠?qū)崿F(xiàn)神經(jīng)網(wǎng)絡。
權(quán)利要求
1.一種最優(yōu)方法搜索方法,具備 執(zhí)行部,其進行了初始設(shè)定,使得在任意的環(huán)境下都使神經(jīng)網(wǎng)絡自適應于上述環(huán)境來導出與上述環(huán)境相應的動作并執(zhí)行該動作;以及 評價部,其對該執(zhí)行部提供上述初始設(shè)定,并且在上述動作結(jié)束后對該執(zhí)行部的動作內(nèi)容進行評價, 其中,該評價部使上述動作主體執(zhí)行多次上述動作,將導出的多個動作的結(jié)果中執(zhí)行部進行最有效率的動作的初始設(shè)定作為最優(yōu)方法而導出, 該最優(yōu)方法搜索方法的特征在于,包括以下步驟 個體定義步驟,上述評價部根據(jù)虛擬細胞(節(jié)點)和細胞分裂所需的分子(公式群)的組合來生成初始設(shè)定,將該初始設(shè)定發(fā)送給上述執(zhí)行部; 執(zhí)行部動作步驟,該執(zhí)行部如下這樣生成神經(jīng)網(wǎng)絡,該執(zhí)行部在基于上述初始設(shè)定創(chuàng)建出該神經(jīng)網(wǎng)絡內(nèi)部的虛擬的細胞分裂空間后,配置該初始設(shè)定中所包含的上述節(jié)點,通過根據(jù)上述函數(shù)執(zhí)行計算處理來使節(jié)點分裂以生成神經(jīng)網(wǎng)絡,并且在該神經(jīng)網(wǎng)絡生成后,通過將由該執(zhí)行部所具備的傳感器檢測到的輸入數(shù)據(jù)輸入到該神經(jīng)網(wǎng)絡來導出輸出數(shù)據(jù),使該執(zhí)行部所具備的動作部基于該輸出數(shù)據(jù)進行動作,將該動作的結(jié)果發(fā)送給上述評價部;以及 個體評價步驟,上述評價部基于接收到的上述動作的結(jié)果,生成上述執(zhí)行部的個體評價, 通過將上述步驟依次執(zhí)行多次,來從上述個體評價中導出最有效率的動作。
2.根據(jù)權(quán)利要求I所述的最優(yōu)方法搜索方法,其特征在于, 上述評價部將用于創(chuàng)建神經(jīng)網(wǎng)絡的坐標數(shù)據(jù)的值、上述執(zhí)行部的評價基準的值、上述節(jié)點的值以及上述公式群的值作為參數(shù)保存到數(shù)據(jù)庫, 該評價部在使上述執(zhí)行部動作時,將從上述數(shù)據(jù)庫選擇出的上述參數(shù)生成為初始設(shè)定,并發(fā)送給該執(zhí)行部, 并且,該評價部接收基于上述初始設(shè)定進行了動作的上述執(zhí)行部的動作的結(jié)果,生成評價作為該機器人的個體評價并存儲到上述數(shù)據(jù)庫,由此從存儲于上述數(shù)據(jù)庫的信息中搜索進行最有效率的動作的初始設(shè)定的組合。
3.根據(jù)權(quán)利要求I或2所述的最優(yōu)方法搜索方法,其特征在于, 上述執(zhí)行部利用在內(nèi)部檢測上述執(zhí)行部的動作狀態(tài)的評價單元,將檢測的結(jié)果發(fā)送給上述評價部。
4.根據(jù)權(quán)利要求I或2所述的最優(yōu)方法搜索方法,其特征在于, 上述執(zhí)行部基于從上述評價部接收到的上述初始設(shè)定來構(gòu)成上述神經(jīng)網(wǎng)絡, 并且,上述執(zhí)行部通過上述執(zhí)行部所具備的傳感器部檢測上述環(huán)境的狀態(tài)作為輸入數(shù)據(jù), 當構(gòu)成了上述神經(jīng)網(wǎng)絡時,上述執(zhí)行部將上述輸入數(shù)據(jù)輸入到該神經(jīng)網(wǎng)絡,由此導出輸出數(shù)據(jù), 對上述執(zhí)行部所具備的動作部發(fā)送上述輸出數(shù)據(jù),由此上述執(zhí)行部進行動作。
5.根據(jù)權(quán)利要求1、2和3中的任一項所述的最優(yōu)方法搜索方法,其特征在于, 關(guān)于上述節(jié)點,作為區(qū)分該節(jié)點的特性的參數(shù)而保存配置該節(jié)點的坐標、連接該節(jié)點的多條連接線的連接強度、該節(jié)點的連接目的地、該節(jié)點的電位以及上述公式群在該節(jié)點中的利用率, 并且,上述公式群的參數(shù)包括表示該公式群中的各個公式之間的計算規(guī)則的公式和表示上述節(jié)點的參數(shù)的變更度的公式。
6.一種最優(yōu)方法搜索系統(tǒng),具備 執(zhí)行部,其進行了初始設(shè)定,使得在任意的環(huán)境下都使神經(jīng)網(wǎng)絡自適應于上述環(huán)境來導出與上述環(huán)境相應的動作并執(zhí)行該動作;以及 評價部,其對該執(zhí)行部提供上述初始設(shè)定,并且在上述動作結(jié)束后對該執(zhí)行部的動作內(nèi)容進行評價, 其中,該評價部使上述執(zhí)行部執(zhí)行多次上述動作,搜索導出的多個動作的結(jié)果中執(zhí)行部進行最有效率的動作的初始設(shè)定, 該最優(yōu)方法搜索系統(tǒng)的特征在于, 上述執(zhí)行部構(gòu)成神經(jīng)網(wǎng)絡,該神經(jīng)網(wǎng)絡在內(nèi)部具備虛擬的細胞分裂區(qū)間,基于由上述評價部設(shè)定的作為虛擬細胞的節(jié)點以及相當于細胞分裂所需的虛擬分子的公式,在該細胞分裂區(qū)間內(nèi)對節(jié)點數(shù)量進行調(diào)整,并且將由該執(zhí)行部所具備的傳感器檢測出的結(jié)果作為輸入數(shù)據(jù),使該輸入數(shù)據(jù)在節(jié)點中進行傳播以導出上述動作所需的信號,并通過該執(zhí)行部進行動作輸出。
7.根據(jù)權(quán)利要求6所述的最優(yōu)方法搜索系統(tǒng),其特征在于, 上述執(zhí)行部具備 傳感器部,其檢測上述環(huán)境的狀態(tài); 搜索部,其構(gòu)成上述神經(jīng)網(wǎng)絡; 動作部,其基于由上述搜索部輸出的數(shù)據(jù)來執(zhí)行上述動作; 評價單元,其檢測上述執(zhí)行部的動作是成功還是失敗,將該動作是成功還是失敗檢測為動作評價;以及 通信單元,其與上述評價部之間相互通信上述評價單元中的上述動作評價以及上述初始設(shè)定。
8.根據(jù)權(quán)利要求6或7所述的最優(yōu)方法搜索系統(tǒng),其特征在于, 上述評價部具備 數(shù)據(jù)庫,其存儲對上述執(zhí)行部發(fā)送的上述節(jié)點的參數(shù)、上述函數(shù)的參數(shù)以及對上述執(zhí)行部的評價; 個體定義模塊,其從上述數(shù)據(jù)庫提取上述節(jié)點的參數(shù)的值以及上述函數(shù)的參數(shù)的值,生成發(fā)送給上述執(zhí)行部的上述節(jié)點的初始設(shè)定以及上述函數(shù)的初始設(shè)定; 個體評價模塊,其根據(jù)從上述執(zhí)行部接收到的上述動作評價和對該執(zhí)行部發(fā)送的初始設(shè)定來生成該執(zhí)行部的個體評價,并寫入到數(shù)據(jù)庫進行保存; 執(zhí)行管理模塊,其指示上述個體定義模塊、上述個體評價模塊以及上述執(zhí)行部執(zhí)行各動作;以及 通信單元,其進行與上述執(zhí)行部之間的通信。
9.根據(jù)權(quán)利要求6、7和8中的任一項所述的最優(yōu)方法搜索系統(tǒng),其特征在于, 關(guān)于上述節(jié)點,作為區(qū)分該節(jié)點的特性的參數(shù)而保存配置該節(jié)點的坐標、連接該節(jié)點的多條連接線的連接強度、該節(jié)點的連接目的地、該節(jié)點的電位以及上述公式群在該節(jié)點中的利用率。
10.根據(jù)權(quán)利要求6、7和8中的任一項所述的最優(yōu)方法搜索系統(tǒng),其特征在于, 上述公式群的參數(shù)包括表示該公式群中的各個公式之間的計算規(guī)則的公式和表示上述節(jié)點的參數(shù)的變更度的公式。
全文摘要
一種最優(yōu)方法搜索方法以及最優(yōu)方法搜索系統(tǒng),通過在神經(jīng)網(wǎng)絡中采用遺傳算法,使得能夠搜索比以往更有效率的用于解決問題的最優(yōu)方法。本發(fā)明具備執(zhí)行部(1),其利用采用了遺傳算法的神經(jīng)網(wǎng)絡來搜索最優(yōu)方法,通過該方法來實施動作;以及評價部(2),其生成對該執(zhí)行部發(fā)送的初始設(shè)定,并且在執(zhí)行部的動作結(jié)束后對動作內(nèi)容進行評價,通過使執(zhí)行部(1)實施多次動作,來從多個導出的該動作結(jié)果中,將進行了最有效率的動作的對執(zhí)行部(1)發(fā)送的初始設(shè)定作為最優(yōu)方法而導出。由此,即使如
、
中所述那樣利用神經(jīng)網(wǎng)絡,也能夠小規(guī)模且有效率地搜索最優(yōu)方法。
文檔編號G06N3/08GK102713944SQ20098016328
公開日2012年10月3日 申請日期2009年11月10日 優(yōu)先權(quán)日2009年11月10日
發(fā)明者吉信真之 申請人:吉信真之