專利名稱::標(biāo)簽建構(gòu)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明是有關(guān)于計算機技術(shù),且特別有關(guān)于標(biāo)簽地圖自動建構(gòu)方法。
背景技術(shù):
:隨著Web2.0觀念的興起,應(yīng)用大眾分類方法論(folksnonomy)的網(wǎng)站也漸漸普遍,例如Del.icio.us網(wǎng)站。相較于傳統(tǒng)由專家或作者執(zhí)行的分類管理(taxonomy),Folksnonomy是由使用者將網(wǎng)站、檔案、數(shù)字影像等網(wǎng)絡(luò)資源以標(biāo)簽(tag)作分類。標(biāo)簽為用來代表資源的關(guān)鍵詞或描述性用語。圖1顯示標(biāo)簽地圖(TagCloud)的一實例。圖1中,字體越大的標(biāo)簽代表其聯(lián)結(jié)的資源越多??梢杂删W(wǎng)頁服務(wù)器的一網(wǎng)頁接收一標(biāo)簽、該標(biāo)簽對應(yīng)的資源地址、描述及批注后,將該標(biāo)簽加入標(biāo)簽地圖。當(dāng)該標(biāo)簽被使用者點選時,該網(wǎng)頁服務(wù)器重新引導(dǎo)(redirect)該使用者至該資源地址。然而,同一標(biāo)簽可能指向完全不相關(guān)的對象。舉例來說,MIT可能表示"MadeinTaiwan"及"MassachusettsInstituteofTechology"。i亥問題會卩條^f氐搜尋的準(zhǔn)確率(precision)。另外,也可能不同標(biāo)簽指向完全相同的對象。例如標(biāo)簽"cat"與"cats"可能指向相同的網(wǎng)頁,"NewYork"、"New—York"可能都是指紐約市。另外標(biāo)簽之間可能互為關(guān)聯(lián)詞,例如標(biāo)簽"peri"、"javascript"及"programming",或"java"、"jdk"及"j2ee"。標(biāo)簽用i吾的這類問題會降低搜尋的搜全率(recall)。
發(fā)明內(nèi)容為解決上述現(xiàn)有技術(shù)中所存在的問題,本發(fā)明的主要目的在于提供一種標(biāo)簽建構(gòu)方法及系統(tǒng)。基于上述目的,本發(fā)明實施例提供一種標(biāo)簽建構(gòu)方法,該方法包含下列步驟接收代表網(wǎng)絡(luò)資源的多個標(biāo)簽;決定多個標(biāo)簽中每一個所對應(yīng)的資源范圍;根據(jù)每一標(biāo)簽對應(yīng)的資源范圍以建立上述多個標(biāo)簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點;利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。本發(fā)明還一種計算機可讀取儲存媒體,用以儲存一計算機程序,該計算機程序可加載至一計算機裝置中以執(zhí)行上述實施例所提供的標(biāo)簽建構(gòu)方法。另外,本發(fā)明實施例提供一種標(biāo)簽建構(gòu)系統(tǒng),包含標(biāo)簽?zāi)K、建構(gòu)模塊及搜尋模塊。標(biāo)簽?zāi)K接收代表網(wǎng)絡(luò)資源的多個標(biāo)簽。建構(gòu)模塊決定多個標(biāo)簽中每一個所對應(yīng)的資源范圍,并才艮據(jù)每一標(biāo)簽對應(yīng)的資源范圍以建立上述多個標(biāo)簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點。搜尋^t塊利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。另外,本發(fā)明實施例提供一種標(biāo)簽建構(gòu)方法,包含下列步驟接收代表網(wǎng)絡(luò)資源的多個標(biāo)簽,包含第一標(biāo)簽及第二標(biāo)簽;決定每一個所對應(yīng)的資源集合;依下列步驟以分類上述第一及第二標(biāo)簽若上述第一及第二標(biāo)簽分別對應(yīng)資源集合OA及OB,且資源集合Oa大于資源集合0B,且第一及第二標(biāo)簽對應(yīng)共同資源,且上述共同資源在Os中所占比率大于一預(yù)定比率,則判別笫二標(biāo)簽被歸屬于第一標(biāo)簽。通過本發(fā)明利用階層化關(guān)系網(wǎng)絡(luò)作為輔助資源搜尋的圖像導(dǎo)覽,可以幫助使用者逐步放寬或縮小搜尋范圍,調(diào)整搜全率(recall)與準(zhǔn)確率(precision),改善標(biāo)簽的基本層級差異。圖1顯示一標(biāo)簽地圖2顯示標(biāo)簽建構(gòu)系統(tǒng)的結(jié)構(gòu)示意圖3a圖3j顯示階層化關(guān)系網(wǎng)絡(luò)示意圖4顯示標(biāo)簽建構(gòu)方法實施例的流程圖5顯示標(biāo)簽的階層化關(guān)系網(wǎng)絡(luò)建構(gòu)方法的實施例的流程圖6顯示連結(jié)凈皮加權(quán)后的階層化關(guān)系網(wǎng)絡(luò)示意圖;以及圖7顯示多個計算機裝置所構(gòu)成的網(wǎng)絡(luò)系統(tǒng)實施例的示意圖。主要組件符號說明1~處理器;2~存儲器;10區(qū)域;100標(biāo)簽建構(gòu)系統(tǒng);UO區(qū)域;111~標(biāo)簽?zāi)K;112提示模塊;120區(qū)域;121~標(biāo)簽庫;122建構(gòu)模塊;123關(guān)系網(wǎng)絡(luò)暫存區(qū);130~區(qū)域;131搜尋模塊;132搜尋結(jié)果暫存區(qū);133排列模塊;140~區(qū)域;141標(biāo)簽接口;142搜尋接口;150輸出模塊;700服務(wù)器;C多個客戶端計算機;H階層化關(guān)系網(wǎng)絡(luò)。具體實施例方式以下說明是本發(fā)明的較佳實施例。其目的是要舉例說明本發(fā)明一般性的原則,不應(yīng)視為本發(fā)明的限制,本發(fā)明的范圍當(dāng)以權(quán)利要求所界定的為準(zhǔn)。以下揭示標(biāo)簽建構(gòu)方法。標(biāo)簽建構(gòu)方法包含取得標(biāo)簽、標(biāo)簽分類、輔助數(shù)據(jù)搜尋、執(zhí)行搜尋及排列搜尋結(jié)果等步驟。圖2顯示標(biāo)簽建構(gòu)系統(tǒng)的結(jié)構(gòu)示意圖。請參照圖2及圖4,區(qū)域IIO、120及130中的模塊分別作為建立標(biāo)簽、處理標(biāo)簽及資源搜尋之用。區(qū)域140中包含圖形化使用者接口(Graphicaluserinterface,簡稱GUI),即圖2中的標(biāo)簽接口141及搜尋接口142。標(biāo)簽?zāi)Klll通過標(biāo)簽接口141接收標(biāo)簽及對應(yīng)資源(例如網(wǎng)頁、圖片、文件等網(wǎng)絡(luò)資源)并輸入至標(biāo)簽庫(Tagrepository)121(步驟S400)。建構(gòu)模塊122決定多個標(biāo)簽中每一個所對應(yīng)的資源范圍(步驟S402),根據(jù)每一標(biāo)簽對應(yīng)的資源范圍以建立標(biāo)簽庫121中標(biāo)簽之間的關(guān)系,并將標(biāo)簽庫121中的標(biāo)簽建立為其關(guān)系網(wǎng)絡(luò)中的節(jié)點,稱為階層化關(guān)系網(wǎng)絡(luò)H(步驟S404)。區(qū)域130中的模塊再使用階層化關(guān)系網(wǎng)絡(luò)H以輔助資源搜尋(步驟S406)。舉例來說,搜尋模塊131通過搜尋接口142接收搜尋字符串或關(guān)鍵詞,進(jìn)行搜尋以取得搜尋結(jié)果,以儲存至搜尋結(jié)果暫存區(qū)132。排列模塊133參照階層化關(guān)系網(wǎng)絡(luò)H以計算搜尋結(jié)果中的資源的信息密度指針,并依據(jù)信息密度指針以排列搜尋結(jié)果中的資源,再存回搜尋結(jié)果暫存區(qū)132。輸出模塊150顯示排列后的搜尋結(jié)杲。搜尋模塊131也可以在搜尋接口142顯示階層化關(guān)系網(wǎng)絡(luò)H或其中的部分節(jié)點以輔助使用者進(jìn)行搜尋。以下表格1顯示標(biāo)簽庫'121中標(biāo)簽與資源之間的關(guān)系,其中標(biāo)簽與資源之間的數(shù)字顯示標(biāo)簽才莫塊111所接收的該標(biāo)簽用來代表或指示該資源的次數(shù)<table>tableseeoriginaldocumentpage9</column></row><table>表格l表格1可以用標(biāo)簽與資源的一矩陣R代表,如下:<formula>formulaseeoriginaldocumentpage10</formula>Rij為第i個標(biāo)簽用來描述第j資源的次數(shù),其中i及j為整數(shù),且0《i<12,0《j<6。建構(gòu)模塊122可以每一標(biāo)簽所對應(yīng)的資源類別數(shù)目作為每一標(biāo)簽對應(yīng)的資源范圍。因此,建構(gòu)模塊122可以決定多個標(biāo)簽中每一個所對應(yīng)的資源范圍。例如標(biāo)簽Sun對應(yīng)"初階Java"、"J2MEintro"、"程序設(shè)計"、"C弁一點點,,以及"Java&J2ME,,等五個資源,而JDK只對應(yīng)其中的三個資源。因此標(biāo)簽Sun的資源范圍大于JDK的資源范圍。建構(gòu)才莫塊122根據(jù)每一標(biāo)簽對應(yīng)的資源范圍以建立上述多個標(biāo)簽成為上述多個標(biāo)簽的階層化關(guān)系網(wǎng)絡(luò)H中的節(jié)點。首先,建構(gòu)模塊122根據(jù)每一標(biāo)簽的資源范圍對上述多個標(biāo)簽排序。資源類別數(shù)目的統(tǒng)計請參照以下表格2:<table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table>表格2每一標(biāo)簽對應(yīng)的資源類別數(shù)目為該標(biāo)簽在表格l的同一列中的非零項的數(shù)目。每一標(biāo)簽對應(yīng)的使用次數(shù)為該標(biāo)簽用來描述資源的次數(shù)的總合。建構(gòu)模塊122根據(jù)每一標(biāo)簽的資源類別數(shù)目對上述多個標(biāo)簽排序,如果有多個標(biāo)簽的資源類別數(shù)目相等,就再依其使用次數(shù)作排序。若二標(biāo)簽的資源類別數(shù)目及《吏用次數(shù)都相同,則以輸入系統(tǒng)100對時間先后順序排序。以下表格3顯示排序后的結(jié)果<table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table>表格3已排列的標(biāo)簽順序為programming,Java、API、Sun、J2EE、C#、Javascript、JDK、J2SE、JSP、J2ME及Php,將依序加入階層化關(guān)系網(wǎng)絡(luò)H。建構(gòu)模塊122利用表格3以產(chǎn)生用二元數(shù)據(jù)來表示標(biāo)簽與資源間的關(guān)系的表格4:<table>tableseeoriginaldocumentpage12</column></row><table>表格4其中l(wèi)代表有關(guān)系,0代表沒有關(guān)系。表格4可以用一矩陣M代表標(biāo)簽與資源的關(guān)系,如下<formula>formulaseeoriginaldocumentpage13</formula>(2)向量Mi用來表示第i個標(biāo)簽的標(biāo)簽向量。舉例來說,第0個標(biāo)簽programming的標(biāo)簽向量為[l1011l]。建構(gòu)模塊122產(chǎn)生階層化關(guān)系網(wǎng)絡(luò)H時可以利用以下的數(shù)組數(shù)據(jù)結(jié)構(gòu)Tag[]:儲存所有已排序過,且尚未加入階層化關(guān)系網(wǎng)絡(luò)H的標(biāo)簽。hierarchy[]:儲存所有已加入的階層化關(guān)系網(wǎng)絡(luò)H的標(biāo)簽的備份。Terminal[]:儲存所有已加入階層化關(guān)系網(wǎng)絡(luò)H而尚未有子節(jié)點的標(biāo)簽。Tag—Relation[][]:標(biāo)簽的關(guān)系矩陣,為一01矩陣,若Tag—Relation[x][y]-l表示第x個標(biāo)簽為第y個標(biāo)簽的子節(jié)點,x及y都為整數(shù)。建立階層圖參照圖5,建構(gòu)模塊122執(zhí)行以下步驟。建構(gòu)模塊122依照上述方式將標(biāo)簽庫121中的標(biāo)簽排序后(步驟S500),初始化階層化關(guān)系網(wǎng)絡(luò)H(步驟S502)。如圖3a所示,建構(gòu)模塊122加入根節(jié)點S及終端T節(jié)點至階層化關(guān)系網(wǎng)絡(luò)H。所有找不到父節(jié)點的標(biāo)簽,以根節(jié)點S為父節(jié)點。T節(jié)點連接Terminal[]中的所有末端節(jié)點,即任何沒有子節(jié)點的節(jié)點。根節(jié)點的標(biāo)簽向量可以設(shè)為[l1111l]。此時Terminal[]及hierarchy[]都僅包含根節(jié)點S。建構(gòu)模塊122從排序后的上述多個標(biāo)簽中取出一標(biāo)簽(例如標(biāo)簽"programming")以加入上述階層化關(guān)系網(wǎng)絡(luò)H作為一節(jié)點(步驟S504)。舉例來說,如圖3b所示,當(dāng)建構(gòu)模塊122取標(biāo)簽"programming"作為目前節(jié)點時直接以根節(jié)點S作為其父節(jié)點。建構(gòu)模塊122判別Tag[]是否還有標(biāo)簽(步驟S506)。如無,建構(gòu)模塊122輸出階層化關(guān)系網(wǎng)絡(luò)H至關(guān)系網(wǎng)絡(luò)暫存區(qū)123(步驟S508)。如有,建構(gòu)模塊122從排序后的上述多個標(biāo)簽Tag[]中依序取出一標(biāo)簽Tag[x],稱為目前節(jié)點(步驟S510),x為整數(shù)。建構(gòu)模塊122復(fù)制階層化關(guān)系網(wǎng)絡(luò)H中的全部標(biāo)簽至hierarchy[](步驟S512)。建構(gòu)模塊122由終端節(jié)點T開始,依寬度優(yōu)先搜尋(breathfirstsearch,筒稱BFS)算法的順序取得階層化關(guān)系網(wǎng)絡(luò)H中的一節(jié)點hierarchy[y]作為待檢查節(jié)點(步驟S514),該節(jié)點必須存在于hierarchy[]中。從hierarchy[]中刪去hierarchy[y](步驟S515)。建構(gòu)模塊122比較目前節(jié)點Tag[x]與上述取得的待檢查節(jié)點hierarchy[y]的關(guān)系是否符合下列條件(步驟S516)。上述目前節(jié)點Tag[x]及上述取得的待檢查節(jié)點hierarchy[y]分別代表一第一及第二標(biāo)簽。第一及第二標(biāo)簽對應(yīng)的資源集合分別為OA及OB。若符合下列式子,則目前節(jié)點Tag[x]及上述取得的待檢查節(jié)點之間可以建立一父子關(guān)系A(chǔ)l(3)其中,入為預(yù)定數(shù)字,以下假設(shè)為0.8。IOAJ為OA的數(shù)目。|oAnoB^Oa及Ob的交集的資源數(shù)目。在此步驟S516中,建構(gòu)模塊122對上述目前節(jié)點Tag[x]及上述待檢查節(jié)點hierarchy[y]執(zhí)行父子關(guān)系檢查。在父子關(guān)系檢查中,當(dāng)上述第一及第二標(biāo)簽所共同對應(yīng)的資源數(shù)量符合上述式子(3)時,建構(gòu)模塊122使上述二標(biāo)簽中資源范圍較大與較小的標(biāo)簽之間建立一父子關(guān)系(步驟S518),并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。在Tag一Relation[][]中的對應(yīng)位置輸入"1"。如否,建構(gòu)模塊122直接執(zhí)行步驟S522。步驟S522中,建構(gòu)模塊122判別hierarchy[]中是否還有標(biāo)簽(步驟S522)。如是,重復(fù)步驟S514。如否,重復(fù)步驟S506。所有找不到父節(jié)點的標(biāo)簽,以根節(jié)點S為父節(jié)點。舉例來說,當(dāng)建構(gòu)模塊122取標(biāo)簽"Java"作為目前節(jié)點時,對標(biāo)簽"Java"=0.8^與標(biāo)簽"programming"作父子關(guān)系檢查。此時|0八|=5而因此,如圖3c所示,建構(gòu)模塊122使上述二標(biāo)簽中資源范圍較大與較小的標(biāo)簽之間被建立一父子關(guān)系(以圖3c中的連結(jié)Ll表示),并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。同理,如圖3d所示,當(dāng)建構(gòu)模塊122取標(biāo)簽"api,'作為目前節(jié)點時,|0J,所以標(biāo)簽"Java"成為標(biāo)簽"api"的父節(jié)點。須要了解的是,當(dāng)一已檢查節(jié)點(例如標(biāo)簽"Java")已成為上述目前標(biāo)簽(例如標(biāo)簽"api")的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點(例如標(biāo)簽"programming")不需再與上述目前節(jié)點進(jìn)行該父子關(guān)系檢查。因此,建構(gòu)模塊122從hiemrchy[]中刪除待檢查節(jié)點hierarchy[y]及上述待檢查節(jié)點的祖先節(jié)點(步驟S520)。相反地,當(dāng)一已檢查節(jié)點經(jīng)檢查后不是上述目前標(biāo)簽的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點仍需與上述目前節(jié)點進(jìn)行該父子關(guān)系檢查。舉例來說,如圖3e所示,當(dāng)建構(gòu)模塊122取標(biāo)簽"sun"作為目前節(jié)點,標(biāo)簽"api,,作為待檢查節(jié)點時,1^14,所以標(biāo)簽"api"不是標(biāo)簽"sun"的父節(jié)點。因此,標(biāo)簽"java"需要與標(biāo)簽"sun"進(jìn)行該父子關(guān)系檢查。此時建構(gòu)模塊122取標(biāo)簽"sun"作為目前節(jié)點,標(biāo)簽"java"=1>義作為待檢查節(jié)點時,|0J,所以標(biāo)簽"Java"成為標(biāo)簽"s皿"的父節(jié)點。標(biāo)簽"Java"祖先節(jié)點(例如標(biāo)簽"programming")不需再與上述目前節(jié)點進(jìn)行該父子關(guān)系檢查。同理,建構(gòu)模塊122分別在圖3f、圖3g、圖3h及圖3i中把標(biāo)簽"j2ee"、"C弁"、"javascript"及"jdk"加入階層化關(guān)系網(wǎng)絡(luò)H,最后完成圖3j。經(jīng)由上述說明可知,建構(gòu)階層化關(guān)系網(wǎng)絡(luò)H即是在進(jìn)行標(biāo)簽分類。若存在標(biāo)簽A及B分別對應(yīng)資源集合OA及Ob。當(dāng)下列條件被滿足時(1)標(biāo)簽A的資源范圍大于標(biāo)簽B的資源范圍(即IOaWObI);(2)標(biāo)簽A及B對應(yīng)共同資源WpoAnoB*a),①指空集合);(3)上述共同資源在Os中所占比率(或比值)大于一預(yù)定比率(例如比值入),即1^1一;則標(biāo)簽B被判別歸屬于標(biāo)簽A。輔助資源搜尋關(guān)鍵詞提示搜尋接口142接收一搜尋用關(guān)鍵詞。當(dāng)上述關(guān)鍵詞符合上述階層化關(guān)系網(wǎng)絡(luò)H中的一特定標(biāo)簽(例如java),提示模塊112則取得上述特定標(biāo)簽的所有相鄰節(jié)點。搜尋模塊131顯示上述相鄰節(jié)點所對應(yīng)的標(biāo)簽內(nèi)容,作為候選的搜尋關(guān)鍵詞。當(dāng)上述候選標(biāo)簽的標(biāo)簽內(nèi)^^皮選取時,搜尋模塊131以上述標(biāo)簽內(nèi)容為關(guān)鍵詞進(jìn)行搜尋。另外,可以利用一參數(shù)D來設(shè)定上述特定標(biāo)簽的相鄰節(jié)點的范圍。舉例來說,上述參數(shù)D用來設(shè)定上述特定標(biāo)簽與其相鄰節(jié)點的距離,以下以每個連結(jié)為1單位距離來計算。當(dāng)參數(shù)D-1時,搜尋模塊131輸出與上述特定標(biāo)簽相距一層連結(jié)的標(biāo)簽(包含父節(jié)點及子節(jié)點)至輸出模塊150來加以顯示。例如與java相距一層連結(jié)的標(biāo)簽為Sun,Programming,api及jsp。當(dāng)參凄tD=2時,搜尋模塊131輸出與上述特定標(biāo)簽相距二層連結(jié)以內(nèi)的標(biāo)簽(包含父節(jié)點及子節(jié)點、祖父節(jié)點及孫子節(jié)點)。例如與java相距二層連結(jié)的標(biāo)簽為Javascript,j2ee,jdk,C存及php。參數(shù)D可以供使用者設(shè)定調(diào)整。搜尋模塊131也可以直接顯示階層化關(guān)系網(wǎng)絡(luò)H,或?qū)⑵渲泄?jié)點按字母順序排序后以標(biāo)簽地圖形式顯示。搜尋模塊131可以依照標(biāo)簽被使用的次數(shù)以決定其在標(biāo)簽地圖中的大小。輔助資源搜尋搜尋結(jié)果排列搜尋模塊131通過搜尋接口142接收搜尋字符串或關(guān)鍵詞,進(jìn)行搜尋以取得搜尋結(jié)果,以儲存至搜尋結(jié)果暫存區(qū)132。排列模塊133參照階層化關(guān)系網(wǎng)絡(luò)H以計算搜尋結(jié)果中多個資源的信息密度指針。建構(gòu)模塊122可以依照下式賦與標(biāo)簽關(guān)系(即階層化關(guān)系網(wǎng)絡(luò)H中連結(jié))權(quán)重。以二標(biāo)簽的標(biāo)簽向量A和B為例,我們計算A和B的余弦相似度(cosinesimilarity):(4)以為上述二標(biāo)簽之間的關(guān)系的權(quán)重。舉例來i兌,programming的標(biāo)簽向量為[110111〗,Java的標(biāo)簽向量為[10111l],API的標(biāo)簽向量為[111110],Sun的標(biāo)簽向量為[IOI101],J2EE的標(biāo)簽向量為,C#的標(biāo)簽向量為,JDK的標(biāo)簽向量為[100101],JSP的標(biāo)簽向量為[l00100]。上述標(biāo)簽之間的關(guān)系權(quán)重如圖6所示。計算資源對象分?jǐn)?shù)的公式如下/:k附++,))S:對象符合作為關(guān)鍵詞的標(biāo)簽所得到的信息密度指針分?jǐn)?shù)。Wi:父/子節(jié)點和關(guān)鍵詞之間的關(guān)系權(quán)重。Wj:祖父/孫子節(jié)點和關(guān)鍵詞之間的兩層關(guān)系權(quán)重乘積。k,n,m:該對象符合k個標(biāo)簽、n個父/子節(jié)點以及m個祖父/孫子節(jié)點。因此,根據(jù)上述算式(5),當(dāng)S^,且一資源符合關(guān)鍵詞java時,其分?jǐn)?shù)為(1)+(0,75+0.43+0.51.0.72)+(0.38+0.87)。排列模塊133可以依照算式(5)以計算搜尋結(jié)果中多個資源的信息密度指針,并依據(jù)信息密度指針以排列搜尋結(jié)果中的資源,再存回搜尋結(jié)果暫存區(qū)132。輸出模塊150顯示排列后的搜尋結(jié)果。上述標(biāo)簽建構(gòu)方法可用于儲存在計算機可讀取儲存媒體的一計算機程序?qū)嵶?。參照圖7,系統(tǒng)IOO可以由計算機程序組成,執(zhí)行于服務(wù)器700。存儲器2儲存系統(tǒng)100,當(dāng)系統(tǒng)100載入至服務(wù)器700時,處理器l執(zhí)行如上所述的方法??梢詮碾娎|、無線通信信道,或光盤、硬盤、卸除式磁盤驅(qū)動器等,或從其它儲存媒體中栽入系統(tǒng)100至存儲器2。服務(wù)器700可以通過網(wǎng)絡(luò)耦接于多個客戶端計算機C。多個客戶端計算機C通過瀏覽器以輸入標(biāo)簽至系統(tǒng)100,并顯示系統(tǒng)IOO提示的候選標(biāo)簽、階層化關(guān)系網(wǎng)絡(luò)H及搜尋結(jié)果??傊?,上述系統(tǒng)可以建立標(biāo)簽的階層化關(guān)系圖,以提供給使用者作搜尋資源的接口,并能經(jīng)由選擇不同階層的標(biāo)簽以調(diào)整搜尋范圍的大小。雖然本發(fā)明已以較/f圭實施例揭露如上,然其并非用以限定本發(fā)明,任何所屬
技術(shù)領(lǐng)域:
中具有通常知識者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作各種的更動與潤飾,因此本發(fā)明的保護(hù)范圍當(dāng)視權(quán)利要求所界定的為準(zhǔn)。權(quán)利要求1.一種標(biāo)簽建構(gòu)方法,其特征在于,該方法包含接收代表網(wǎng)絡(luò)資源的多個標(biāo)簽;決定多個標(biāo)簽中每一個所對應(yīng)的資源范圍;根據(jù)每一標(biāo)簽對應(yīng)的資源范圍以建立上述多個標(biāo)簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點;利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。2.如權(quán)利要求1所述的標(biāo)簽建構(gòu)方法,其特征在于,建立上述多個標(biāo)簽的階層化關(guān)系網(wǎng)絡(luò)的步驟中還包含取得一第一標(biāo)簽及一第二標(biāo)簽;對上述第一及第二標(biāo)簽的執(zhí)行父子關(guān)系檢查;其中該父子關(guān)系檢查還包含當(dāng)上述笫一及第二標(biāo)簽所共同對應(yīng)的資源數(shù)量符合一條件時,使上述二標(biāo)簽中資源范圍較大與較小的標(biāo)簽之間建立一父子關(guān)系,并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。3.如權(quán)利要求2所述的標(biāo)簽建構(gòu)方法,其特征在于,上述資源范圍即網(wǎng)絡(luò)資源的數(shù)目。4,如權(quán)利要求3所述的標(biāo)簽建構(gòu)方法,其特征在于,上述第一及第二標(biāo)簽對應(yīng)的資源集合分別為Oa及Ob,上述條件為下列式子IAI—其中,入為預(yù)定數(shù)字,iOAi為OA的數(shù)目,|oAnoB^Oa及Ob的交集的資源數(shù)目。5.如權(quán)利要求2所述的標(biāo)簽建構(gòu)方法,其特征在于,該方法還包含a.才艮據(jù)每一標(biāo)簽的資源范圍對上述多個標(biāo)簽排序;b.初始化上述階層化關(guān)系網(wǎng)絡(luò);c.依序從排序后的上述多個標(biāo)簽中取出另一標(biāo)簽,稱為目前標(biāo)簽;d.從上述階層化關(guān)系網(wǎng)絡(luò)的末端節(jié)點開始,依寬度優(yōu)先搜尋算法的順序取得上述階層化關(guān)系網(wǎng)絡(luò)中每一節(jié)點,與上述目前標(biāo)簽進(jìn)行上述父子關(guān)系檢查,其中當(dāng)一已檢查節(jié)點已成為上述目前標(biāo)簽的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點不進(jìn)行該檢查;以及e重復(fù)上述步驟c及d直到所有標(biāo)簽都加入該階層化關(guān)系網(wǎng)絡(luò)。6.如權(quán)利要求1所述的標(biāo)簽建構(gòu)方法,其特征在于,上述資源搜尋還包含接收一搜尋用關(guān)鍵詞;當(dāng)上述關(guān)鍵詞符合上述階層化關(guān)系網(wǎng)絡(luò)中的一特定標(biāo)簽,則取得上述特定標(biāo)簽的所有相鄰節(jié)點;以及顯示上述相鄰節(jié)點所對應(yīng)的標(biāo)簽內(nèi)容。7.如權(quán)利要求6所述的標(biāo)簽建構(gòu)方法,其特征在于,該方法還包含當(dāng)上述標(biāo)簽內(nèi)容被選取時,以上述標(biāo)簽內(nèi)容為關(guān)鍵詞進(jìn)行搜尋。8.如權(quán)利要求6所述的標(biāo)簽建構(gòu)方法,其特征在于,該方法還包含利用一參數(shù)來指定上述特定標(biāo)簽與其相鄰節(jié)點的距離。9.如權(quán)利要求1所述的標(biāo)簽建構(gòu)方法,其特征在于,上述資源搜尋還包含當(dāng)以一標(biāo)簽作為一關(guān)鍵詞搜尋得到多個資源時,利用上述階層化關(guān)系網(wǎng)絡(luò)計算上述多個資源的信息密度指針;依據(jù)每一資源的信息密度指針對上述多個資源進(jìn)行排序;以及顯示排序后的上述多個資源。10.—種計算機可讀取儲存媒體,用以儲存一計算機程序,其特征在于,上述計算機程序可加載至一計算機裝置中以執(zhí)行如權(quán)利要求1至9中任一項所述的標(biāo)簽建構(gòu)方法。11.一種標(biāo)簽建構(gòu)系統(tǒng),其特征在于,該標(biāo)簽建構(gòu)系統(tǒng)包含一標(biāo)簽?zāi)K,接收代表網(wǎng)絡(luò)資源的多個標(biāo)簽;一建構(gòu)模塊,決定多個標(biāo)簽中每一個所對應(yīng)的資源范圍,并根據(jù)每一標(biāo)簽對應(yīng)的資源范圍以建立上述多個標(biāo)簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點;一搜尋模塊,利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。12.如權(quán)利要求11所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,上述建構(gòu)模塊取得一第一標(biāo)簽及一第二標(biāo)簽,對上述第一及第二標(biāo)簽執(zhí)行父子關(guān)系檢查,其中,在該父子關(guān)系檢查中,當(dāng)上述第一及第二標(biāo)簽所共同對應(yīng)的資源數(shù)量符合一條件時,上述建構(gòu)模塊使上述二標(biāo)簽中資源范圍較大與較小的標(biāo)簽之間建立一父子關(guān)系,并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。13.如權(quán)利要求12所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,上述資源范圍即網(wǎng)絡(luò)資源的數(shù)目。14.如權(quán)利要求13所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,上述第一及第二標(biāo)簽對應(yīng)的資源集合分別為Oa及Ob,上述條件為下列式子^門^>義其中,入為預(yù)定數(shù)字,IOAl為oa的數(shù)目,IOA門OBl為Oa及Ob的交集的資源數(shù)目。15.如權(quán)利要求12所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,上述建構(gòu)模塊執(zhí)行下列步驟a.根據(jù)每一標(biāo)簽的資源范圍對上述多個標(biāo)簽排序;b.初始化上述階層化關(guān)系網(wǎng)絡(luò);c.依序從排序后的上述多個標(biāo)簽中取出另一標(biāo)簽,稱為目前標(biāo)簽;d.從上述階層化關(guān)系網(wǎng)絡(luò)的末端節(jié)點開始,依寬度優(yōu)先搜尋算法的順序取得上述階層化關(guān)系網(wǎng)絡(luò)中每一節(jié)點,與上述目前標(biāo)簽進(jìn)行上述父子關(guān)系檢查,其中當(dāng)一已檢查節(jié)點已成為上述目前標(biāo)簽的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點不進(jìn)行該檢查;以及e.重復(fù)上述步驟c及d直到所有標(biāo)簽都加入該階層化關(guān)系網(wǎng)絡(luò)。16.如權(quán)利要求11所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,上述搜尋模塊接收一搜尋用關(guān)鍵詞,當(dāng)上述關(guān)鍵詞符合上述階層化關(guān)系網(wǎng)絡(luò)中的一特定標(biāo)簽,則取得上述特定標(biāo)簽的所有相鄰節(jié)點,以及顯示上述相鄰節(jié)點所對應(yīng)的標(biāo)簽內(nèi)容。17.如權(quán)利要求16所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,當(dāng)上述標(biāo)簽內(nèi)容被選取時,上述搜尋模塊以上述標(biāo)簽內(nèi)容為關(guān)鍵詞進(jìn)行搜尋。18.如權(quán)利要求16所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,上述搜尋模塊利用一參數(shù)來指定上述特定標(biāo)簽與其相鄰節(jié)點的距離。19.如權(quán)利要求11所述的標(biāo)簽建構(gòu)系統(tǒng),其特征在于,當(dāng)上述搜尋模塊以一標(biāo)簽作為一關(guān)鍵詞搜尋得到多個資源時,利用上述階層化關(guān)系網(wǎng)絡(luò)計算上述多個資源的信息密度指針,依據(jù)每一資源的信息密度指針對上述多個資源進(jìn)行排序,以及顯示排序后的上述多個資源。20.—種標(biāo)簽建構(gòu)方法,其特征在于,該方法包含接收代表網(wǎng)絡(luò)資源的多個標(biāo)簽,包含第一標(biāo)簽及第二標(biāo)簽;決定每一個所對應(yīng)的資源集合;依下列步驟以分類上述第一及第二標(biāo)簽若上述第一及第二標(biāo)簽分別對應(yīng)資源集合0A及0B,且資源集合0A大于資源集合Ob,且第一及第二標(biāo)簽對應(yīng)共同資源,且上述共同資源在Ob中所占比率大于一預(yù)定比率,則判別第二標(biāo)簽被歸屬于第一標(biāo)簽。全文摘要本發(fā)明提供一種標(biāo)簽建構(gòu)方法及系統(tǒng),所述方法包含下列步驟接收代表網(wǎng)絡(luò)資源的多個標(biāo)簽;決定多個標(biāo)簽中每一個所對應(yīng)的資源范圍;根據(jù)每一標(biāo)簽對應(yīng)的資源范圍以建立上述多個標(biāo)簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點。利用上述階層化關(guān)系網(wǎng)絡(luò)作為輔助資源搜尋的圖像導(dǎo)覽,可以幫助使用者逐步放寬或縮小搜尋范圍,調(diào)整搜全率(recall)與準(zhǔn)確率(precision),改善標(biāo)簽的基本層級差異。文檔編號G06F17/30GK101192220SQ20061014948公開日2008年6月4日申請日期2006年11月21日優(yōu)先權(quán)日2006年11月21日發(fā)明者謝文泰,賴威慎申請人:財團(tuán)法人資訊工業(yè)策進(jìn)會