亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于客戶定義信息架構(gòu)的系統(tǒng)、方法和計算機程序的制作方法

文檔序號:6455769閱讀:241來源:國知局

專利名稱::用于客戶定義信息架構(gòu)的系統(tǒng)、方法和計算機程序的制作方法
技術(shù)領(lǐng)域
:本發(fā)明總體上涉及分類系統(tǒng)。具體而言,本發(fā)明涉及一種用以對信息進(jìn)行分類的系統(tǒng)、方法和計算機程序。本發(fā)明還涉及一種用于綜合用于特定信息域的分類結(jié)構(gòu)的系統(tǒng)、方法和計算機程序。
背景技術(shù)
:分面式分類是基于信息具有多維性質(zhì)并且可以用許多不同方式來分類這一原理。信息域的對象被細(xì)分成分面以代表這一多維性。域的屬性按分面分級而相關(guān)。然后基于這些屬性對域內(nèi)的素材進(jìn)行標(biāo)識和分類。圖1圖示了現(xiàn)有技術(shù)中的分面式分類的大體方式,其中該方式(例如)應(yīng)用于酒的分類。分面式分類稱為分析-綜合方法,因為它涉及到分析和綜合兩種過程。為了構(gòu)思用于分面式分類的方案,分析信息域以確定它們的基本分面。然后可以通過將這些分面的屬性應(yīng)用于域來對分類進(jìn)行綜合(或者構(gòu)建)。許多學(xué)者已經(jīng)將分面式分類認(rèn)同為用于組織海量信息儲存器(例如因特網(wǎng)上的信息儲存器)的理想方法。分面式分類易受迅速變化和動態(tài)信息的影響。另外,通過將對象細(xì)分成分面,它提供用以訪問信息的多個各種方式。盡管分面式分類有可能解決分類需要,但對其的使用一直是緩慢的。相對于因特網(wǎng)上的海量信息,只有很少的域使用分面式分類。實際上,其使用已經(jīng)在具體縱向應(yīng)用(比如電子商務(wù)儲存器和圖書館)中進(jìn)行劃分。它一般停留在學(xué)者、專業(yè)分類和信息設(shè)計者的范圍中。采用分面式分類的障礙在于它的復(fù)雜性。分面式分類是勞動密集型并且在理解力上頗具挑戰(zhàn)性的工作。這一復(fù)雜性隨著信息的規(guī)模而增加。隨著規(guī)模增加,維度(或者分面)的數(shù)目在域內(nèi)更復(fù)雜,這使其越來越難以組織。為了幫助解決這一復(fù)雜性,學(xué)者已經(jīng)構(gòu)思了用于分面式分類的規(guī)則和指南。這一學(xué)術(shù)群體可追溯至早在現(xiàn)代計算和數(shù)據(jù)分析問世之前的幾十年。最近,已經(jīng)在分面式分類的服務(wù)中謀求技術(shù)。大體上,已經(jīng)在歷史分類方法和組織原理內(nèi)應(yīng)用這一技術(shù)。受傳統(tǒng)方法束縛,對提供全自動化分面式分類方法的嘗試一般受到了挫折。為了表明現(xiàn)有技術(shù),自動化分類和分面式導(dǎo)航系統(tǒng)的一個例子是ENDECA。ENDECA被認(rèn)為是信息分類和訪問系統(tǒng)業(yè)內(nèi)產(chǎn)品的優(yōu)良領(lǐng)軍者(http:〃www.usatoday.com/tech/products/cnet/2007-06-29-endece-google_N.htm)。ENDECA的技術(shù)使用了指導(dǎo)式導(dǎo)航和如下元關(guān)系索引,該元關(guān)系索引包容數(shù)據(jù)和文檔的維度以及維度之間的關(guān)系例如參見"Hierarchicaldata-drivensearchandnavigationsystemandmethodforinformationretrieval";美國專利No.7,035,864,2006年4月25曰"Hierarchicaldata-drivensearchandnavigationsystemandmethodforinformationretrieval"。ENDECA的系統(tǒng)包括由司描述為分類法定義和分類的分類方式,參見美國專利No.7,062,483,2006年6月13日Hierarchicaldata-drivensearchandnavigationsystemandmethodforinformationretrieval?,F(xiàn)有自動化分類技術(shù)得到最為主流地使用,并且對于以下事物是有用的,業(yè)界專家將這些事物稱為"結(jié)構(gòu)化數(shù)據(jù)倉庫"和"受管理的內(nèi)容倉庫"?,F(xiàn)有自動化分類技術(shù)的另一限制在于在分類的認(rèn)知要求方面,它缺乏基于人類的反饋。例如,盡管ENDECA具有分面式導(dǎo)航的反饋環(huán)——包括用以驅(qū)動搜索結(jié)果呈現(xiàn)的使用普及度以及包括優(yōu)先級——但是它沒有用以改進(jìn)內(nèi)容的語義定義和語義關(guān)系的基于使用的反饋環(huán)。另一大類混合分類系統(tǒng)可以描述為大規(guī)模協(xié)作式分類。這一方式嘗試對人工分類的認(rèn)知優(yōu)點與自動化系統(tǒng)的處理能力進(jìn)行結(jié)合。這一新興領(lǐng)域中的協(xié)作式分類系統(tǒng)冠有各種稱謂"Web2.0"、"協(xié)作式分類"、"公眾分類法(folksonomy)"、"社會索引"、"社會標(biāo)簽","群體智慧"和其他稱謂。FLICKR(照片共享群體)、DEL.ICIO.US(社會書簽管理器)和WIKIPEDIA(基于wiki的協(xié)作式百科全書)是這一類新興協(xié)作式分類的例子。在比例可變的情況下,這些系統(tǒng)使用用以在允許協(xié)作者針對類別、概念和關(guān)系進(jìn)行決策之時,為廣范圍和分布式協(xié)作提供框架的技術(shù)。這一方式的一個挑戰(zhàn)在于,它在主題和分類專家的指導(dǎo)與外行個人終端用戶的輸入之間產(chǎn)生抵觸,這些用戶通常對于內(nèi)容持有大相徑庭的觀點和分類方式。這些系統(tǒng)可以通過標(biāo)識不明確和不一致的范圍以及通過突出協(xié)作者之間的竟?fàn)幮灾鲝?,來幫助人們協(xié)作。但是最終,就協(xié)作式系統(tǒng)而言,人們應(yīng)當(dāng)優(yōu)選地和解他們的分歧并且就最難以應(yīng)對的條款達(dá)成廣泛共識。因此這一過程難以在大型和各種信息域內(nèi)展開和擴展。司著眼于通過使用協(xié)作式分類方式以在Web以及其他復(fù)雜和各種信息環(huán)境內(nèi)創(chuàng)建可搜索的數(shù)據(jù)庫,來對廣范圍的開放信息域進(jìn)行分類。MetawebTechnologies因其用以創(chuàng)建語義網(wǎng)的先驅(qū)協(xié)作式方式而倍受關(guān)注。MetawebTechnologies已經(jīng)向美國專利商標(biāo)局提交2個專利申請(美國專利申請20050086188,"Knowledgeweb",2005年4月21日;美國專利申請20030196094,"Methodandapparatusforauthenticatingthecontentofadistributeddatabase",2003年10月16曰)。MetawebTechnologies的協(xié)作式本體構(gòu)建依賴于用于其協(xié)作式分類的"群眾智慧"。終端用戶利用它來定義和擴展每個人都可以使用的多個方案。根據(jù)著名的業(yè)界觀察員EstherDyson的觀點"Metaweb的創(chuàng)建者已經(jīng)'聰明地設(shè)計,了如何指定關(guān)系的語法,但是他們依賴于群眾的智慧(或者具體知識)和努力,以創(chuàng)建實際內(nèi)容——不僅僅是具體數(shù)據(jù),而是在具體事物之間具體種類的關(guān)系"(第0.9版Metaweb-EmergentStructurevs.IntelligentDesign,2007年3月11日,http:〃www.huffingtonpost.com/esther-dyson/release-09-met—b一43167.html)。這一方式的限制在于數(shù)據(jù)庫范圍和質(zhì)量受制于其用戶輸入的語義有關(guān)內(nèi)容。它也依賴于專家和外行人士用以就具體數(shù)據(jù)元素達(dá)成共識并且指定內(nèi)容之間的關(guān)系以消除冗余度,從而數(shù)據(jù)庫包含明確信息的能力。因此,現(xiàn)有技術(shù)在自動化分面式分類、自動化分類和大規(guī)模協(xié)作式分類方面存在許多弊端。在傳統(tǒng)方法內(nèi)或者基于傳統(tǒng)方法來應(yīng)用技術(shù)。需要如下增強的分類方法,這些方法實現(xiàn)對信息結(jié)構(gòu)的基本改變。對于分面分析,一般需要人類認(rèn)知的輸入,因為不存在對所有信息域均起作用的用于分面分析的通用模式或者探索方式。目前,只有人類才擁有全廣度的模式識別技能。遺憾的是,一般需要在將要分類的整個信息域內(nèi)標(biāo)識結(jié)構(gòu)模式(比如語義或者語法結(jié)構(gòu)),并且存在標(biāo)識分面和屬性的許多不同模式。盡管可以訓(xùn)練人們識另^小型(局部)數(shù)據(jù)集上的這些模式,但是隨著域的大小增加,該任務(wù)的難度變得令人望而卻步。當(dāng)分析和綜合過程的計算需要超過人類認(rèn)知能力時,還由于人類介入而引入限制。人類熟練于小規(guī)模評估信息元素之間的關(guān)系、但是無法管理在集合體中的整個域內(nèi)的復(fù)雜性。需要能夠跨整個信息域來聚集小型局部化人類輸入的系統(tǒng)。分面式分類方案支持多角度,這是一個常常提到的益處。遺憾的是,當(dāng)這些角度跨多個分級而分開時,它們并不直觀。這引起可視化、整合和整體角度的嚴(yán)重問題。隨著結(jié)構(gòu)中的分面數(shù)目(或者維度)增加,可視化變得越來越困難。因而,分面式分類方案的可視化常??s減為"平面式"的一維結(jié)果集;其一次僅跨一個分面來導(dǎo)航結(jié)構(gòu)。這一類縮減掩蓋了下層結(jié)構(gòu)的豐富復(fù)雜性。需要在整合的和描述豐富的分級內(nèi)組合分面式方案的表達(dá)性和靈活性的方法和技術(shù)。另外,這一靈活性在將分面動態(tài)構(gòu)造為組織基礎(chǔ)時最優(yōu)地向下擴展至分類方案本身的基本級。一旦被選擇,分面本身就是靜態(tài)的并且難以修正。這在分面式方案的開發(fā)中表示相當(dāng)大的風(fēng)險。分類常常缺乏信息域的完整知識,因此這些組織基礎(chǔ)的選擇易于出錯。在動態(tài)分類系統(tǒng)之下,將通過易于添加或者更改下層分面的能力來減輕這些風(fēng)險。傳統(tǒng)分類方法和派生技術(shù)在這一基礎(chǔ)級中缺乏靈活性。任何分類系統(tǒng)還可以考慮動態(tài)環(huán)境中的維護(hù)要求。隨著域中的素材改變,分類可以相應(yīng)地調(diào)整。相對于分面式分類方案的初始開發(fā),維護(hù)常常是甚至更令人沮喪的挑戰(zhàn)。在術(shù)語學(xué)(terminology)顯現(xiàn)和改變時必須對其加以更新;一般需要評估和用符號表示域中的新素材;一般需要調(diào)整分面和屬性的布置以包含演變的結(jié)構(gòu)。許多時候,為了整個新分類而簡單地放棄現(xiàn)有分面式分類?;旌舷到y(tǒng)在分析、綜合和維護(hù)的關(guān)鍵階段涉及到人類。如在該過程中的早期涉及到的那樣,人類常常成為分類工作的瓶頸。這樣,該過程一直處于緩慢和高成本。需要這樣一種系統(tǒng),該系統(tǒng)以無需中央化控制和權(quán)限的更為分散、自制的方式接受來自人們的分類數(shù)據(jù)。這些系統(tǒng)可以支持隱式反饋機制,其中信息訪問和信息消費的真實活動為分類方案的維護(hù)和成長提供積極維護(hù)。為了指導(dǎo)該過程,混合系統(tǒng)常?;诂F(xiàn)有的通用分面式分類方案。然而,這些通用方案并不總是適用于海量的和迅速演變的現(xiàn)代信息世界。需要針對單獨域的需求而定制的專門化方案。由于不能通用地應(yīng)用通用分面式分類方案,所以也需要將不同信息域連接在一起。然而,盡管提供用以整合域的機會,但是解決方案應(yīng)當(dāng)考慮單獨域所有者的私密和安全。分類需要的最重要之處要求系統(tǒng)可以在涉及到大型協(xié)作者組的廣泛分散環(huán)境中管理的系統(tǒng)。然而,在意味深長和含義不明的影響下,分類應(yīng)對復(fù)雜概念。解決這些含義不明確和沖突常常涉及到甚至在小型組中仍脫離協(xié)作的密集協(xié)商和個人沖突。
發(fā)明內(nèi)容在本發(fā)明的第一方面中,提供一種用于組織和管理數(shù)據(jù)結(jié)構(gòu)的方法,其中包括基于來自反饋代理的輸入,該方法包括(a)適用于信息域的用于分面式分類的方法,所述分面式分類方法包括(i)對所述域進(jìn)行分面分析或者接收域的分面分析結(jié)果,以及(ii)應(yīng)用所述域的分面式分類綜合;以及(b)用于根據(jù)所述分面式分類綜合來選擇和返回關(guān)于一次或者多次迭代的信息的復(fù)雜-自適應(yīng)方法,所述復(fù)雜-自適應(yīng)方法響應(yīng)于所述返回的信息來改變數(shù)據(jù)結(jié)構(gòu)的組織和管理。在本發(fā)明的另一方面中,一種用于信息域的分面式分類的方法包括(a)提供包括用來對信息進(jìn)行分類的分面屬性的分面式數(shù)據(jù)集,這樣的分面屬性可選地包括用于分面屬性的分面屬性分級;(b)提供維度概念分類法,在該維度概念分類法中,根據(jù)將含義與將要分類的域的對象相關(guān)聯(lián)的概念來將分面屬性分配給對象,所述概念由概念定義表示,這些概念定義在維度概念分類法中使用所述分面屬性來定義并且與對象關(guān)聯(lián),所述維度概念分類法根據(jù)分面式數(shù)據(jù)集來表達(dá)概念定義之間的維度概念關(guān)系;以及(c)提供或者實現(xiàn)一種復(fù)雜-自適應(yīng)系統(tǒng),用于選擇和返回維度概念分類法信息,以響應(yīng)于維度概念分類法信息來改變分面式數(shù)據(jù)集和維度概念分類法。在本發(fā)明的又一方面中,用于信息域的分面式分類的方法還包括執(zhí)行分面式分類綜合,以將概念定義所表示的概念集相關(guān),所述概念定義是根據(jù)包括分面屬性以及可選地包括分面屬性分級的分面式數(shù)據(jù)集來定義的,所述分面式分類綜合包括表達(dá)概念定義之間的維度概念關(guān)系,其中通過檢查兩個概念定義的相應(yīng)分面屬性之間在分面式數(shù)據(jù)集中是否存在顯式關(guān)系和隱式關(guān)系中的至少一個關(guān)系,來確定兩個概念定義在特定維度概念關(guān)系中相關(guān)。在本發(fā)明的又一方面中,提供一種用于根據(jù)源數(shù)據(jù)結(jié)構(gòu)來執(zhí)行對從信息域中選擇的輸入信息的分面分析的計算機系統(tǒng),該計算機系統(tǒng)(a)可操作用以使用模式擴充和統(tǒng)計分析,來派生輸入信息的分面屬性以及可選地派生輸入信息的分面屬性分級,以標(biāo)識輸入信息中的分面屬性關(guān)系模式。在本發(fā)明的另一方面中,提供一種用于使用戶能夠操控維度概念關(guān)系的計算機系統(tǒng),該計算機系統(tǒng)包括(a)處理器;(b)與處理器進(jìn)行數(shù)據(jù)通信的計算機可讀介質(zhì),其中該計算機可讀介質(zhì)上包括處理器可執(zhí)行的指令和被確定為在特定維度概念關(guān)系中相關(guān)的多個數(shù)據(jù)元素;(c)輸入工具,配置用以允許外界實體與處理器進(jìn)行接口通信;(d)顯示器,操作用以提供至少所選數(shù)據(jù)元素的可視描繪;以及(e)編輯器,允許外界實體修改數(shù)據(jù)元素和特定維度概念關(guān)系。在本發(fā)明的又一方面中,提供一種用于組織和管理數(shù)據(jù)結(jié)構(gòu)的系統(tǒng),包括基于來自反饋代理的輸入,其中(a)該系統(tǒng)包括或者鏈接到復(fù)雜-自適應(yīng)系統(tǒng),所述復(fù)雜-自適應(yīng)系統(tǒng)用于選擇和返回維度概念分類法信息,以響應(yīng)于維度概念分類法信息來改變分面式數(shù)據(jù)集和維度概念分類法(b)該系統(tǒng)可操作用以處理分面式數(shù)據(jù)集,該分面式數(shù)據(jù)集包括分面、分面屬性以及可選地包括用來對信息進(jìn)行分類的用于分面屬性的分面屬性分級;以及(c)系統(tǒng)還可操作用以定義維度概念分類法,在該維度概念分類法中,根據(jù)將含義與將要被分類的域的對象關(guān)聯(lián)的概念來將分面屬性分配給對象,所述概念由概念定義表示,這些概念定義在維度概念分類法中使用分面屬性來定義并且與對象進(jìn)行關(guān)聯(lián),所述維度概念分類法根據(jù)分面式數(shù)據(jù)集來表達(dá)概念定義之間的維度概念關(guān)系。參照附圖將更好地理解本發(fā)明。注意,對于這里包含的說明,三角形狀用來代表相對筒單的數(shù)據(jù)結(jié)構(gòu),而錐形形狀用來代表將較高維度具體化的相對復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。三角形和錐形的可變大小代表壓縮和擴展變換、但是決不表明或者顯示壓縮或者擴展的精確比例。在說明書中并入的并且構(gòu)成說明書一部分的附示了對本發(fā)明各方面的各種例子實施例進(jìn)行說明的各種例子系統(tǒng)、方法等。應(yīng)該認(rèn)識到圖中所示元素邊界(例如方框、方框組或者其他形狀)代表邊界的一個例子。本領(lǐng)域普通技術(shù)人員將認(rèn)識到,一個元素可以設(shè)計為多個元素或者多個元素可以^沒計為一個元素。作為另一元素的內(nèi)部部件而示出的元件可以實施為外部部件,并且反之亦然。另外,元素可能不是按比例繪制的。圖1是圖示了現(xiàn)有技術(shù)的分面式分類方法的示意圖;圖2圖示了操作概況,這些操作示出了用以創(chuàng)建用于域的維度概念分類法的數(shù)據(jù)結(jié)構(gòu)變換;圖3圖示了用于圖2的操作的知識表示模型;圖4更具體地圖示了圖2中操作概況的細(xì)節(jié);圖5圖示了提取輸入數(shù)據(jù)的方法;圖6圖示了源結(jié)構(gòu)分析的方法;圖7圖示了提取初步概念-關(guān)鍵詞定義的過程;圖8圖示了提取語素的方法;圖9-圖10圖示了根據(jù)概念關(guān)系來計算潛在語素關(guān)系的過程;圖11A-圖IIB、圖12和圖13圖示了根據(jù)潛在語素關(guān)系集來組裝多分級語素關(guān)系的過程;圖14A、圖14B和圖15圖示了使用歸因方法將語素多分級重新排序成嚴(yán)格分級;圖16A和圖16B圖示了來自語素分級和關(guān)鍵詞分級的樣本片段;圖17圖示了預(yù)備用于在構(gòu)造維度概念分類法時使用的輸出數(shù)據(jù)的方法;圖18圖示了操作根據(jù)元素構(gòu)造來生成維度概念的方式;圖19圖示了操作如何組合維度概念關(guān)系以生成維度概念分類法;圖20、圖21和圖22圖示了如何使用分面式輸出數(shù)據(jù)來構(gòu)造維度概念分類法;圖23圖示了為局部化域集而構(gòu)建的維度概念分類法;圖24圖示了動態(tài)綜合的模式;圖25圖示了用于動態(tài)綜合的候選集組裝的方法;圖26圖示了在維度概念分類法內(nèi)編輯內(nèi)容容器的用戶交互的過程;圖27圖示了復(fù)雜-自適應(yīng)系統(tǒng)中的一系列用戶交互和反饋環(huán);圖28圖示了個性化操作;圖29圖示了基于機器的復(fù)雜-自適應(yīng)系統(tǒng)的操作;圖30圖示了根據(jù)一個實施例的用于執(zhí)行操作的系統(tǒng)的計算環(huán)境和架構(gòu)部件;圖31圖示了一個實施例中的簡化數(shù)據(jù)模式;圖32圖示了根據(jù)一個實施例的用以執(zhí)行數(shù)據(jù)結(jié)構(gòu)變換操作的系統(tǒng)相克況;圖33圖示了一個實施例中使用的分面式數(shù)據(jù)結(jié)構(gòu)和支持這些結(jié)構(gòu)的多級架構(gòu);圖34圖示了基于瀏覽器的用戶界面中的維度概念分類法的視圖35圖示了有助于動態(tài)綜合模式的基于瀏覽器的用戶界面;圖36圖示了基于概括器(outliner)的用戶界面中用于用戶交互的環(huán)境;以及圖37圖示了根據(jù)本發(fā)明的允許操控分面式分類信息各方面的計算機系統(tǒng)的具代表性的實施。具體實施方式系統(tǒng)操作具體實施方式具體描述本發(fā)明一些方面的一個或者多個實施例。具體實施方式的描述分成下述標(biāo)題和子標(biāo)題。(1)"本發(fā)明概況"該部分大體地描述與本領(lǐng)域有關(guān)的包括本發(fā)明的信息分類領(lǐng)域,并且還大體地描述本發(fā)明的目的和一些優(yōu)點。(2)"系統(tǒng)操作,,該部分大體地描述在實施本發(fā)明時涉及到的步驟。小標(biāo)題"操作概況"大體地描述包括系統(tǒng)的一些部件。小標(biāo)題"分面式分析方法"大體地描述本發(fā)明的分面分析部件。小標(biāo)題"分面式分類綜合方法"大體地描述本發(fā)明的分面綜合部件、包括本發(fā)明的靜態(tài)和動態(tài)綜合部件。小標(biāo)題"復(fù)雜-自適應(yīng)反饋機制"大體地描述本發(fā)明對各種用戶交互的響應(yīng)。(3)"實施"該部分大體地描述本發(fā)明可操作的具代表性的實施例。小標(biāo)題"系統(tǒng)架構(gòu)部件"大體地描述本發(fā)明的可能實施例。小標(biāo)題"數(shù)據(jù)模型和模式"大體地描述本發(fā)明變換數(shù)據(jù)的方法。小標(biāo)題"維度變換系統(tǒng)"大體地描述將在本發(fā)明的僅一個可能實施例中出現(xiàn)的本發(fā)明系統(tǒng)的操作。以下小標(biāo)題涉及本發(fā)明的代表性實施"多級數(shù)據(jù)結(jié)構(gòu)"、"分布式計算環(huán)境"、"XML模式和客戶端側(cè)變換"和"用戶界面"。本發(fā)明概況鑒于現(xiàn)有技術(shù)中的限制和不足,可以認(rèn)識至)J對信息架構(gòu)的構(gòu)造'性和協(xié)作式系統(tǒng)的具體要求以解決這里提到的挑戰(zhàn)和問題。因而,本發(fā)明的若干目的和優(yōu)點總結(jié)為如下幾點這些目的或者優(yōu)點并非些方面及其可能的優(yōu)點和益處。在本發(fā)明的一個方面中,本發(fā)明的系統(tǒng)在構(gòu)造最優(yōu)信息結(jié)構(gòu)的基本級上操作。大多數(shù)現(xiàn)有分類、搜索和可視化解決方案是在具有缺陷的結(jié)構(gòu)基礎(chǔ)之上進(jìn)行的修補,因此先天性地受到限制。本發(fā)明的系統(tǒng)提供一種用于復(fù)雜信息結(jié)構(gòu)的本體和分類框架,這是用于實現(xiàn)的實施途徑。本發(fā)明的系統(tǒng)在其一方面中支持復(fù)雜結(jié)構(gòu),該結(jié)構(gòu)與如今主導(dǎo)信息領(lǐng)域的現(xiàn)有技術(shù)中的簡單平面式結(jié)構(gòu)不同。本發(fā)明的系統(tǒng)支持概念分級作為用于使信息相關(guān)的最熟悉和魯棒模型(術(shù)語"多分級,,描述一種將維度性和概念分級的核心要求進(jìn)行組合的結(jié)構(gòu)模型)。然而,本發(fā)明的系統(tǒng)在以一個方面中減少使概念分級、分類法和本體構(gòu)造變得麻煩的個人和協(xié)作式協(xié)商。還應(yīng)當(dāng)提供一種用于對來自不同信息域的分級進(jìn)行鏈接的可靠機制。本發(fā)明的系統(tǒng)在其一方面中在維度空間內(nèi)的各種相交處提供結(jié)構(gòu)完整性。這可以通過消除在節(jié)點中以及在節(jié)點之間的鏈接和連接中存在的信息空白問題來解決。本發(fā)明的系統(tǒng)在其一方面中涉及用以提供重要的上下文認(rèn)知部件的人類。雖然機器提供用于發(fā)現(xiàn)和協(xié)作的有用工具,但是機器并不擁有為了"理解"復(fù)雜知識而必需的人工智能。這樣,本發(fā)明的系統(tǒng)在其一方面中以人類熟悉和可介入方式涉及人類。本發(fā)明的系統(tǒng)在其一方面中涉及到用以管理巨大信息域中維度結(jié)構(gòu)和概念多分級的極度復(fù)雜性、并且用以在概念描述和關(guān)系中促成協(xié)作者之間共識的機器。本發(fā)明的系統(tǒng)在其一方面中在協(xié)作中納入非技術(shù)性外行人士。專業(yè)設(shè)計者的缺乏和問題的范圍要求解決方案的通用易訪問性。本發(fā)明可以使人們避開維度結(jié)構(gòu)的復(fù)雜性而無損于他們的技術(shù)優(yōu)勢。本發(fā)明的系統(tǒng)可操作用以支持海量分布式并行處理("人多力量大")。信息領(lǐng)域的規(guī)模和復(fù)雜性一般對處理具有物理限制,這種物理限制目前看來在實踐中不可變的。在許多情況下,大規(guī)模和分散式并行性對于挑戰(zhàn)這些限制而言是優(yōu)選的。本發(fā)明的系統(tǒng)在其一方面中可操作用以支持能夠如下綜合操作,這些操作能夠避免無界信息和知識的物理限制。本發(fā)明的系統(tǒng)在其一方面中提供如下能力對用于實質(zhì)上無限數(shù)目的數(shù)據(jù)連接的可能性進(jìn)行編碼,而無需在信息的客戶請求這些數(shù)據(jù)連接之前實際地生成它們。另外,本發(fā)明的系統(tǒng)在其一方面中提供各種綜合模式,使得僅呈現(xiàn)與客戶的設(shè)定興趣和角度相匹配的數(shù)據(jù)連接。本發(fā)明的系統(tǒng)在其一方面中支持和涵蓋信息領(lǐng)域的動態(tài)性。它提供可以適應(yīng)信息以及隨信息而演變的結(jié)構(gòu),而不是如在某一時間點處信息的靜態(tài)快照。本發(fā)明的系統(tǒng)是成本有效的。雖然搜索成本提供一種對發(fā)現(xiàn)針對信息充斥和信息蔓延的解決方案的巨大激勵,但是組織項目沒有實行空白檢查。對更為結(jié)構(gòu)化的因特網(wǎng)的一個阻礙是,使用現(xiàn)有技術(shù)和方法來組織它的龐大成本。這些組織成本不僅是財務(wù)性的、而且在人類方面和計算機處理限制上也是與生俱來的。本發(fā)明的系統(tǒng)在其一方面中為域所有者和系統(tǒng)終端用戶提供一種機會,以便在共享集體才智和匯集式知識資產(chǎn)的益處的同時,維持不同的、私人的和高度個性化知識倉庫。本發(fā)明在其一方面中提供如下方法和系統(tǒng),該方法和系統(tǒng)能夠管理多個信息形式、包括結(jié)構(gòu)關(guān)系、數(shù)字媒體如文本和多媒體、消息接發(fā)和電子郵件、電子商務(wù)以及許多形式的人類交互和協(xié)作,并且為終端用戶提供一種用以跨各種介質(zhì)(包括網(wǎng)站和軟件客戶端)來輸出結(jié)構(gòu)信息的分散式系統(tǒng)。更多目的和優(yōu)點將從后續(xù)描述和附圖的考慮中變得更清楚。系統(tǒng)才乘作操作概況圖2、圖3、圖18、圖19、圖32、圖33和圖4提供用于構(gòu)造和管理復(fù)雜的維度信息結(jié)構(gòu)以便例如創(chuàng)建用于域的維度概念分類法的操作和系統(tǒng)的概況。具體而言,圖2、圖3、圖18、圖19、圖32、圖33和圖4示出了用于此類操作的知識表示模型以及某些維度數(shù)據(jù)結(jié)構(gòu)和構(gòu)造。還示出了包括復(fù)雜-自適應(yīng)系統(tǒng)和增強型分面式分類方法的數(shù)據(jù)結(jié)構(gòu)變換方法。這一描述從特別適用于知識表示的復(fù)雜維度結(jié)構(gòu)的簡要概況開始。復(fù)雜維度結(jié)構(gòu)中的知識表示存在可以用來表示信息和知識的抽象分級的級別。"維度,,概念常常用來表達(dá)復(fù)雜性的程度。簡單列表(如購物列表或者好友列表)可以描述為一維數(shù)組。表和電子數(shù)據(jù)表(二維數(shù)組)比簡單列表更復(fù)雜。某些圖標(biāo)可以在三維空間等中描述信息。結(jié)構(gòu)內(nèi)的每個維度可以建立用于所含信息的組織基礎(chǔ)。維度性因此可以建立用于信息結(jié)構(gòu)的復(fù)雜性規(guī)模。復(fù)雜結(jié)構(gòu)可以涉及這些基礎(chǔ)中的許多基礎(chǔ),并且常常標(biāo)識為n維結(jié)構(gòu)。還需要重點注意維度本身的技術(shù)屬性可以在結(jié)構(gòu)之間提供大量多樣性。例如,維度可以作為變量存在,結(jié)構(gòu)因此建立多變量空間。在這些類型的模型之下,節(jié)點可以采用各維度所代表的變量內(nèi)的具體值或者數(shù)據(jù)點。備選的是,節(jié)點可以不那么嚴(yán)格,僅為除了離散變量之外的信息提供容器。節(jié)點之間的距離可以是相對的,而不是嚴(yán)格地加以量化。通過改變這些類型的技術(shù)屬性,相關(guān)聯(lián)的結(jié)構(gòu)可以在組織剛性與描述靈活性之間達(dá)到某種平衡。一些信息結(jié)構(gòu)可以包含每個相交處的節(jié)點其他信息結(jié)構(gòu)可以是不完整的、遺漏一些維度之間相交的節(jié)點。這在人工構(gòu)造信息結(jié)構(gòu)時特別地相關(guān)。當(dāng)結(jié)構(gòu)的復(fù)雜性超過人類設(shè)計者的認(rèn)知能力時,可能造成信息結(jié)構(gòu)的錯誤和空白。作為一個例子,當(dāng)人們創(chuàng)建網(wǎng)絡(luò)結(jié)構(gòu)(如萬維網(wǎng))中的超鏈接時,他們提供的鏈接在給定域內(nèi)很少是全面的。如果對于域中的鏈接而言存在適當(dāng)目標(biāo),但是缺乏該鏈接,則可以認(rèn)為這是信息結(jié)構(gòu)中的空白。另外,如果信息結(jié)構(gòu)提供用于信息的分類,但是該信息當(dāng)前并不存在,則這也是結(jié)構(gòu)中的空白。結(jié)構(gòu)的完整性可以部分地通過信息結(jié)構(gòu)中的空白來描述。如果沒有用以管理關(guān)系的下層分類系統(tǒng)或者顯式的本體,則結(jié)構(gòu)可能開始隨著節(jié)點和維度的數(shù)目增加而退化。信息空白是這一退化的一個標(biāo)志。復(fù)雜結(jié)構(gòu)比簡單結(jié)構(gòu)具有遠(yuǎn)遠(yuǎn)更多的承載信息容量。正如添加樓層使建筑物的體積增加一樣,添加維度使可以包含在結(jié)構(gòu)中的信息量增加。在沒有多個維度支持的情況下,隨著充斥的信息超過容量,結(jié)構(gòu)最終將在負(fù)載之下崩潰。復(fù)雜維度結(jié)構(gòu)的另一吸引人的特點在于它們的易訪問性。平面式結(jié)構(gòu)將隨著信息增加而蔓延,就好像小型建筑物的郊區(qū)造成城市蔓延一樣。顯然,復(fù)雜結(jié)構(gòu)的維度性指向?qū)π畔⒊涑夂托畔⒙拥膹娭蒲a救。由于其固有優(yōu)點,人們將預(yù)期其增生擴展。遺憾的是,情況并非如此。復(fù)雜結(jié)構(gòu)的采用(特別是在最需要它們的普通大眾之中采用)一直步履艱難。采用復(fù)雜結(jié)構(gòu)受限的原因不言而喻它們的固有復(fù)雜性。盡管存在這些突出的基礎(chǔ)和結(jié)構(gòu)問題,仍然已經(jīng)提出一種足以創(chuàng)建和管理復(fù)雜結(jié)構(gòu)而對于大規(guī)模市場采用而言足夠簡單的解決方案。系統(tǒng)方法相無況分一斤和壓縮。圖2圖示了用以構(gòu)造用于域200的維度概念分類法210的操作,其中域200包括作為分類主題的信息全集。域200可以通過用于向分析和壓縮過程204輸入的如下源數(shù)據(jù)結(jié)構(gòu)202來表示,該源數(shù)據(jù)結(jié)構(gòu)202包括源結(jié)構(gòu)模式和從域200派生的源數(shù)據(jù)實體集。分析和壓縮過程204可以派生語素詞典206,該語素詞典206是包括用于為新的分面式分類方案提供基礎(chǔ)的初等構(gòu)造集的初等數(shù)據(jù)結(jié)構(gòu)。域200中的信息可以涉及虛擬或者物理對象、過程以及此類信息之間的關(guān)系。作為一個例子,這里描述的操作可以涉及可通過Web頁面來訪問的內(nèi)容分類。域200的替代實施例可以包括文檔倉庫、用于音樂的推薦系統(tǒng)、軟件代碼倉庫、工作流模型和商務(wù)過程等。語素詞典206內(nèi)的初等構(gòu)造可以是基本信息構(gòu)建塊和信息關(guān)系的最小集,其中該集合體提供用來對源數(shù)據(jù)結(jié)構(gòu)202進(jìn)行分類的承載信息的容量。綜合和擴展語素詞典206可以是對綜合和擴展方法208的輸入。綜合和擴展操作可以將源數(shù)據(jù)結(jié)構(gòu)202變換成這里稱為維度概念分類法210的第三數(shù)據(jù)結(jié)構(gòu)。術(shù)語"分類法"是指如下結(jié)構(gòu),該結(jié)構(gòu)將類別組織成為分級樹,并且將類別與相關(guān)對象(如文檔或者其他數(shù)字內(nèi)容)進(jìn)行關(guān)聯(lián)。維度概念分類法210可以在從源數(shù)據(jù)結(jié)構(gòu)202派生的復(fù)雜維度結(jié)構(gòu)中對來自域200的源數(shù)據(jù)實體進(jìn)行分類。這樣,源數(shù)據(jù)實體(對象)可以跨過許多不同組織基礎(chǔ)來相關(guān),這允許從許多不同角度找到它們。復(fù)雜-自適應(yīng)系統(tǒng)有利的是,分類系統(tǒng)和操作適應(yīng)于動態(tài)環(huán)境中的變化。在一個實施例中,通過復(fù)雜-自適應(yīng)系統(tǒng)212來滿足這一要求??梢酝ㄟ^與維度概念分類法210進(jìn)行用戶交互,來建立回到源數(shù)據(jù)結(jié)構(gòu)202的反饋環(huán)。變換過程(204和208)可以重復(fù),而所得結(jié)構(gòu)206和210可以隨時間來細(xì)化。在一個實施例中,復(fù)雜-自適應(yīng)系統(tǒng)212可以管理如下終端用戶的交互,這些終端用戶使用輸出結(jié)構(gòu)(即維度概念分類法210),以便在分類過程中利用人類認(rèn)知能力。這里描述的操作尋求相對簡單地將源數(shù)據(jù)結(jié)構(gòu)變換成更復(fù)雜的維度結(jié)構(gòu),以便可以用各種方式組織和訪問源數(shù)據(jù)對象??梢酝ㄟ^擴展許多類型的信息系統(tǒng)的下層數(shù)據(jù)結(jié)構(gòu)的維度性和復(fù)雜性來增強這些系統(tǒng)。正如更高分辨率提高圖像質(zhì)量一樣,更高維度性可以提高數(shù)據(jù)結(jié)構(gòu)的分辨率和細(xì)節(jié)特征性。這一增加的維度性又可以增強數(shù)據(jù)結(jié)構(gòu)的效用。可以通過改進(jìn)的、更靈活的內(nèi)容發(fā)現(xiàn)(例如通過搜索)、信息檢索的改進(jìn)和內(nèi)容聚集來實現(xiàn)增強效用。由于可以通過復(fù)雜系統(tǒng)來實現(xiàn)變換,所以維度性的增加并非必然是線性或者可預(yù)計的。變換也可以部分地依賴于源數(shù)據(jù)結(jié)構(gòu)中所含信息量。為了實施針對大型因特網(wǎng)規(guī)模的系統(tǒng),關(guān)鍵區(qū)別在于,對于節(jié)點和連接的集合呈指數(shù)增加,維度信息結(jié)構(gòu)最優(yōu)地提供如下可能性直到并且除非需要這些連接,否則不會造成實際地構(gòu)建這些連接的令人望而卻步的成本。維度知識表示模型圖3圖示了可以在圖2的操作中使用的包括知識表示實體、關(guān)系和變換方法的知識表示模型的一個實施例。在下文的描述中將參照圖3、18、圖19、圖32、圖33和圖4來描述了知識表示模型及其變換方法的更多細(xì)節(jié)。在本發(fā)明一個實施例中,知識表示實體是內(nèi)容節(jié)點302的集合、內(nèi)容容器304的集合、概念306的集合(為了簡化說明,在圖3中呈現(xiàn)僅一個概念)、關(guān)鍵詞308的集合和語素310的集合。將要分類的域的對象稱為內(nèi)容節(jié)點302。內(nèi)容節(jié)點可以包括服從于分類的任何對象。例如,內(nèi)容節(jié)點302可以是文件、文檔、文檔塊(如注釋)、圖像或者存儲的字符串。內(nèi)容節(jié)點302可以引用物理對象或者虛擬對象。內(nèi)容節(jié)點302可以包含于內(nèi)容容器304的集合中。內(nèi)容容器304可以提供可以用來取回內(nèi)容節(jié)點302的可尋址(或者可定位)信息。例如,可通過URL來訪問的Web頁面的內(nèi)容容器304可以包含以本和圖像形式的內(nèi)容節(jié)點302。內(nèi)容容器304可以包含一個或者多個內(nèi)容節(jié)點302。概念306可以與內(nèi)容節(jié)點302進(jìn)行關(guān)聯(lián),以抽象出一些含義(比如內(nèi)容節(jié)點302的描述、目的、使用或者意圖)。單獨內(nèi)容節(jié)點302可以被賦予以許多概念306;可以跨許多內(nèi)容節(jié)點302共享單獨概念306。可以通過概念與其他實體的關(guān)系來按照復(fù)合的抽象級、以及在結(jié)構(gòu)上按照其他更基本的知識表示實體(例如關(guān)鍵詞308和語素310)來定義概念306。這樣的結(jié)構(gòu)在這里稱為概念定義。語素310代表系統(tǒng)已知的(即,為了構(gòu)造語素詞典206而已經(jīng)對其分析的)跨域存在的最小的有意義的知識表示實體。單個語素310可以與許多關(guān)4建詞308相關(guān)聯(lián);單個關(guān)4建詞308可以包括一個或者多個語素310。另外,在術(shù)語"語素"在本說明書的上下文中的含義與它在語言學(xué)領(lǐng)域中的傳統(tǒng)定義有所區(qū)別。在語言學(xué)中,語素是"有意義的最小語言單位"。在本說明書的上下文中,語素是指"在系統(tǒng)已知的任何域中存在的最小的有意義的知識表示實體"。關(guān)鍵詞308包括語素310的集合(或者組)。單個關(guān)鍵詞308可以與許多概念306關(guān)聯(lián);單個概念306可以包括一個或者多個關(guān)鍵詞308。關(guān)鍵詞308因此可以代表在概念306與語素310之間的附加數(shù)據(jù)結(jié)構(gòu)級。它們有助于"原子概念"作為對用戶可識別的最低知識表示級。由于可以從內(nèi)容節(jié)點302抽象出概念306,所以概念簽名305可以用來表示概念節(jié)點302內(nèi)的概念306。概念簽名305是內(nèi)容節(jié)點302的如下特征,這些特征代表了存在于內(nèi)容中的組織主題。在本發(fā)明的一個實施例中,與初等構(gòu)造一樣,內(nèi)容節(jié)點302趨近它們的最不可縮減形式。內(nèi)容容器304可以縮減至與實際一樣多的內(nèi)容節(jié)點302。當(dāng)在本發(fā)明中與極精細(xì)的分類模式組合時,這些初等內(nèi)容節(jié)點302可以擴展用于內(nèi)容聚集和過濾的選項。因此可以在維度概念分類法中沿著任何維度來識別和重新組合內(nèi)容節(jié)點302。特殊類別的內(nèi)容節(jié)點302、也就是標(biāo)簽(在分類領(lǐng)域中常稱為"項,,)可以加入到各知識表示實體。與內(nèi)容節(jié)點302—樣,可以從相應(yīng)實體抽象出它們在知識表示模型中描述的標(biāo)簽。因此在圖3中標(biāo)識以下類型的標(biāo)簽用以描述內(nèi)容容器304的內(nèi)容容器標(biāo)簽304a;用以描述內(nèi)容節(jié)點302的內(nèi)容節(jié)點標(biāo)簽302a;用以描述概念306的概念標(biāo)簽306a;用以描述關(guān)鍵詞308的集合的關(guān)鍵詞標(biāo)簽308a的集合;以及用以描述語素310的集合的語素標(biāo)簽310a的集合。在圖18中呈現(xiàn)了語素310的樣本。語素310可以在從源數(shù)據(jù)派生的初等構(gòu)造之中。其他初等構(gòu)造集可以包括語素關(guān)系集。正如語素代表概念定義的初等構(gòu)建塊并且是從概念派生的一樣,語素關(guān)系代表概念之間關(guān)系的初等構(gòu)建塊并且是從這樣的概念關(guān)系派生的。下文將更具體地討論圖9-10中圖示的語素關(guān)系。標(biāo)記提供人類可辨別的知識表示實體。在一個實施例中,從源域的唯一詞匯表派生每個標(biāo)簽。換而言之,/人i^中呈現(xiàn)的語言和項汲取向各數(shù)據(jù)元素分配的標(biāo)簽。下文描述并在圖7-8中圖示了概念、關(guān)鍵詞和語素抽象。下文參照輸入數(shù)據(jù)抽象出更具體地討論概念簽名和內(nèi)容節(jié)點以及標(biāo)簽抽象(圖5)。本發(fā)明的一個實施例跨實體及其關(guān)系來使用多級知識表示模型。這使它有別于如圖1(現(xiàn)有技術(shù))中所示傳統(tǒng)分面式分類中的概念-原子概念二級模型及其平面式的(單級)關(guān)系結(jié)構(gòu)。雖然參照一種知識表示模型來描述操作和系統(tǒng)的某些方面,但是本領(lǐng)域普通技術(shù)人員將認(rèn)識到可以通過相應(yīng)地改造操作和系統(tǒng)來使用其他模型。例如,可以將概念組合在一起以創(chuàng)建更高階的知識表示實體(比如meme,作為用以包括觀念的概念匯集(collection))。也可以收縮表示模型的結(jié)構(gòu)。例如,可以移除關(guān)鍵詞抽象層,從而僅針對語素310定義概念。系統(tǒng)變換方法概況圖4圖示了圖2中介紹的變換操作800的一個實施例的廣義概況。輸入數(shù)據(jù)提取操作800可以開始于從將要分類的域200的域所有者的人工標(biāo)識??梢愿鶕?jù)域訓(xùn)練集802來定義源數(shù)據(jù)結(jié)構(gòu)202。訓(xùn)練集802可以是更大域200的代表性子集并且可以用作替代集。也就是說,訓(xùn)練集可以包括用于整個域200的源數(shù)據(jù)結(jié)構(gòu)202或者代表性部分。訓(xùn)練集在本領(lǐng)域中是公知的。可以從域訓(xùn)練集802提取(804)輸入數(shù)據(jù)集??梢苑治鲚斎霐?shù)據(jù)以發(fā)現(xiàn)和提取初等構(gòu)造(下文更具體地討論圖5中所示這一過程)。域分面分析和數(shù)據(jù)壓縮在本實施例中,上文介紹的和在圖33中描述的分析引擎204a可以如圖4中的括號所示遵循方法806至814。對輸入數(shù)據(jù)進(jìn)行分析和處理(806),以提供元結(jié)構(gòu)分析集。源數(shù)據(jù)分析可以提供與源數(shù)據(jù)結(jié)構(gòu)202的結(jié)構(gòu)特征有關(guān)的信息。下文更具體地討論圖6中所示這一過程??梢陨?808)初步概念定義集(下文更具體地討論圖7中所示這一過程)。初步概念定義可以在結(jié)構(gòu)上表示為關(guān)鍵詞308的集合。可以從初步概念定義中的關(guān)鍵詞308提取(810)語素310,由此將概念定義的結(jié)構(gòu)擴展至另一抽象級(下文更具體地討論圖8中所示這一過程)。為了開始構(gòu)造語素分級402的過程,可以計算(812)潛在語素關(guān)系集??梢愿鶕?jù)輸入數(shù)據(jù)中的概念關(guān)系的分析來派生潛在語素關(guān)系。語素結(jié)構(gòu)分析可以適用于潛在語素關(guān)系以標(biāo)識將用來創(chuàng)建語義分級的語素關(guān)系??梢越M裝被選擇(814)用于包含在語素分級中的語素關(guān)系,以形成語素分級402(下文更具體地討論圖9-15中所示這一過程)。維度結(jié)構(gòu)綜合和數(shù)據(jù)擴展在本實施例中,上文介紹的和在圖32中描述的構(gòu)建引擎可以如圖4中的括號所示遵循方法818至820。增強的分面式分類方法可以用來對復(fù)雜維度結(jié)構(gòu)210a和維度概念分類法210進(jìn)行綜合(下文更具體地討論圖20-22中所示這一過程)??梢詼?zhǔn)備(818)用于新維度結(jié)構(gòu)的輸出數(shù)據(jù)210a。輸出數(shù)據(jù)是用于域的分類方案的結(jié)構(gòu)表示。其可以用作分面式數(shù)據(jù),以創(chuàng)建維度概念分類法210。如上文所述,輸出數(shù)據(jù)可以包括與內(nèi)容節(jié)點302和關(guān)鍵詞分級710相關(guān)聯(lián)的概念定義708。具體而言,分面式數(shù)據(jù)可以包括關(guān)鍵詞分級710的結(jié)構(gòu)和概念定義中的關(guān)鍵詞308,其中按照語素詞典206的語素310來定義關(guān)鍵詞308(下文更具體地討論圖17中所示這一過程)。可以構(gòu)造(820)(聚集形式的多分級中的)維度概念關(guān)系集。維度概念關(guān)系表示維度概念分類法210中的概念關(guān)系??梢曰谠鰪姷姆置媸椒诸惙椒ǖ慕M織原理來計算維度概念關(guān)系。維度概念關(guān)系可以進(jìn)行合并,并且在概念306的分類內(nèi)(如概念定義中編碼的那樣)可以形成維度概念分類法210(下文更具體地討論圖20-22中所示這一過程)。對于增強的分面式分類方法而言,可以有各種綜合操作模式。在一個實施例中公開一種"范圍有限"分面式分類綜合操作的系統(tǒng),在該系統(tǒng)中根據(jù)分析引擎方法尚未完全處理或者完全沒有處理的域來綜合概念關(guān)系。在另一實施例中公開一種"動態(tài)"分面式分類綜合的系統(tǒng),在該系統(tǒng)中直接地基于為信息的終端用戶而提供的綜合參數(shù),來近實時地處理維度概念分級(下文更具體地討論綜合操作模式)。復(fù)雜-自適應(yīng)系統(tǒng)和用戶交互在本實施例中,上文介紹的和在圖2中描述的復(fù)雜-自適應(yīng)系統(tǒng)212的操作可以如圖4中的括號所示遵循與概念分類法210相關(guān)聯(lián)的方法212a、212b和804。如討論的那樣,可以通過表示層608向用戶表達(dá)維度概念分類法210。在一個實施例中,表示層608是網(wǎng)站(下文更具體地討論圖23-27和34-36中所示表示層)。經(jīng)由表示層608,可以將域200中的內(nèi)容節(jié)點302呈現(xiàn)為在與每個內(nèi)容節(jié)點302相關(guān)聯(lián)的概念定義內(nèi)進(jìn)行分類。這一表示層608可以提供用于收集用戶交互212a的集合作為維度概念分類法信息的環(huán)境。用戶交互212a可以包括終端用戶和域所有者可以與域維度概念分類法210交互的各種方式。用戶交互212a可以通過步驟804經(jīng)由反饋環(huán)耦合到分析引擎,以提取用以實現(xiàn)復(fù)雜-自適應(yīng)系統(tǒng)的輸入數(shù)據(jù)(下文更具體地討論圖27中所示這一過程)。在一個實施例中,可以對顯式反饋環(huán)中返回的用戶交互212a進(jìn)行排隊,以便在資源變得可用時處理。因而,可以提供隱式反饋環(huán)。隱式反饋環(huán)可以基于增強型分面式分類方法的組織原理的子集,以計算隱式概念關(guān)系212b。通過隱式反饋環(huán),可以近實時地處理與維度概念分類法210的用戶交互212a。通過復(fù)雜-自適應(yīng)系統(tǒng)212,可以持續(xù)地磨練和擴展用于派生維度概念分類法210的分類方案。分面分析方法提取輸入數(shù)據(jù)圖5圖示了在本發(fā)明的一個特定方面中的如下操作900,這些操作包括如參照圖4概要討論的用以提取(804)輸入數(shù)據(jù)的操作及其一些預(yù)備步驟。標(biāo)識結(jié)構(gòu)標(biāo)記器可以在訓(xùn)練集802內(nèi)標(biāo)識(902)結(jié)構(gòu)標(biāo)記器,以表明可以從訓(xùn)練集何處提取輸入數(shù)據(jù)。結(jié)構(gòu)標(biāo)記器可以包括源結(jié)構(gòu)模式。結(jié)構(gòu)標(biāo)記器可以存在于內(nèi)容容器304中,并且可以包括但不限于文檔的標(biāo)題、與內(nèi)容相關(guān)聯(lián)的描述元標(biāo)記、超鏈接、在數(shù)據(jù)庫中的表之間的關(guān)系或者存在于內(nèi)容容器中的關(guān)鍵詞308的普及度。標(biāo)記器可以由域所有者或者其他人標(biāo)識。可以利用跨域而適用的默認(rèn)結(jié)構(gòu)標(biāo)記器來配置操作900。例如,Web頁面的URL可以是用于內(nèi)容節(jié)點302的共用結(jié)構(gòu)標(biāo)記器。這樣,可以用如下多個默認(rèn)結(jié)構(gòu)模式來配置操作902,這些默認(rèn)結(jié)構(gòu)模式將在源結(jié)構(gòu)模式中的那些區(qū)域中不存在任何顯式引用時適用。結(jié)構(gòu)標(biāo)記器可以顯式地位于輸入數(shù)據(jù)中,或者可以位于用于輸入數(shù)據(jù)的替代數(shù)據(jù)中。例如,可以使用在內(nèi)容節(jié)點302中間的關(guān)系作為用于概念關(guān)系的替代結(jié)構(gòu)標(biāo)記器。的邏輯推斷。如果概念關(guān)系在源結(jié)構(gòu)模式中不是顯式的,則可以根據(jù)結(jié)構(gòu)標(biāo)記器(例如與內(nèi)容節(jié)點302相關(guān)聯(lián)的概念簽名)以及內(nèi)容節(jié)點關(guān)系集來推斷它們。例如,如進(jìn)一步所述,概念簽名可以是如下文檔中的標(biāo)題,該文檔被映射到用于將要定義的概念的替代概念。可以根據(jù)內(nèi)容節(jié)點302之間的結(jié)構(gòu)鏈接(例如連接網(wǎng)頁的超鏈接)來派生內(nèi)容節(jié)點關(guān)系。概念簽名到內(nèi)容節(jié)點302的連接以及內(nèi)容節(jié)點302到其他內(nèi)容節(jié)點302的連接可以推斷相交概念之間的概念關(guān)系。這些關(guān)系可以形成附加的(顯式)輸入數(shù)據(jù)。存在本領(lǐng)域普通技術(shù)人員所知的用以標(biāo)識結(jié)構(gòu)標(biāo)記器的許多不同方式。將源結(jié)構(gòu)模式映射至'j系統(tǒng)輸入模式可以將源結(jié)構(gòu)模式映射(904)到輸入模式。在一個實施例中,輸入模式可以包括概念簽名906的集合、概念關(guān)系908的集合和概念節(jié)點302的集合。這一模式設(shè)計是變換過程的代表而并非旨在于限制。輸入操作并不需要跨系統(tǒng)輸入模式中每個數(shù)據(jù)元素的源輸入數(shù)據(jù)以便涵蓋很簡單的結(jié)構(gòu)。系統(tǒng)輸入模式也可以擴展成映射到系統(tǒng)數(shù)據(jù)變換模式中的每個元素。系統(tǒng)數(shù)據(jù)變換模式可以對應(yīng)于變換過程中存在的每個數(shù)據(jù)實體。也就是說,系統(tǒng)輸入模式可以擴展成映射到系統(tǒng)中的每個數(shù)據(jù)實體。換而言之,源結(jié)構(gòu)模式可以包括系統(tǒng)輸入模式的子集。此外,域所有者可以映射來自非常復(fù)雜結(jié)構(gòu)的源數(shù)據(jù)模式。作為一個例子,關(guān)系數(shù)據(jù)庫的表和屬性可以在各種抽象級建模為分面分級,并且映射到系統(tǒng)數(shù)據(jù)變換模式的多級結(jié)構(gòu)。同樣,分析引擎204a和構(gòu)建引擎208a的操作提供數(shù)據(jù)結(jié)構(gòu)變換引擎,并且可以在將一類復(fù)雜數(shù)據(jù)結(jié)構(gòu)(比如在關(guān)系數(shù)據(jù)庫中建模的復(fù)雜數(shù)據(jù)結(jié)構(gòu))變換成另一類復(fù)雜數(shù)據(jù)結(jié)構(gòu)(通過這里描述的方法和系統(tǒng)所產(chǎn)生的復(fù)雜維度結(jié)構(gòu))時實現(xiàn)顯著的新效用。產(chǎn)品目錄提供了從這一類復(fù)雜數(shù)據(jù)結(jié)構(gòu)到復(fù)雜數(shù)據(jù)結(jié)構(gòu)的變換中受益的復(fù)雜數(shù)據(jù)結(jié)構(gòu)的一個例子。下文提供關(guān)于圖30中所示例子數(shù)據(jù)變換模式的更多信息。提取輸入數(shù)據(jù)可以對訓(xùn)練集應(yīng)用輸入數(shù)據(jù)映射,以將其源結(jié)構(gòu)模式映射到輸入模式,從而提取(804)輸入數(shù)據(jù)。如本領(lǐng)域中所知,本發(fā)明的一個實施例使用XSLT對用來從源XML文件提取數(shù)據(jù)的數(shù)據(jù)映射進(jìn)行編碼。提取方法因許多因素而變化,這些因素包括源結(jié)構(gòu)模式的參數(shù)和結(jié)構(gòu)標(biāo)記器的位置。例如,如果概念簽名是精確的(如文檔標(biāo)題、基于關(guān)鍵詞的元標(biāo)記或者數(shù)據(jù)庫關(guān)鍵詞段那樣),則可以直接使用簽名來表示概念標(biāo)簽。對于較為復(fù)雜的簽名(比如文檔本身中的關(guān)鍵詞的普及度),則可以使用普通文本挖掘方法。一種簡單方法使關(guān)鍵詞提取基于文檔中的最普及關(guān)鍵詞的簡單計數(shù)。在信息提取和文本挖掘的廣泛領(lǐng)域內(nèi),存在普通技術(shù)人員已知的許多其他提取方法。一旦被提取,則輸入數(shù)據(jù)可以存儲于耦合到分析引擎204a的一個或者多個存儲裝置中。為求便利,這里包含的圖和描述引用數(shù)據(jù)儲存器910作為存儲裝置,但是可以使用其他儲存器。例如,可以使用域數(shù)據(jù)儲存設(shè)備706,特別是在計算環(huán)境是受控環(huán)境的情況下。系統(tǒng)輸入數(shù)據(jù)可以拆分成它們的組成集,并且傳遞到變換引擎中的后續(xù)過程。概念關(guān)系是用于下文描述的和在圖6中圖示的源結(jié)構(gòu)分析的輸入(A)。可以處理概念簽名,以提取下文描述的和在圖7中圖示的初步概念定義(B)。可以將內(nèi)容節(jié)點作為下文描述的和在圖17中圖示的系統(tǒng)輸出數(shù)據(jù)來處理(C)。如上文所述從源數(shù)據(jù)結(jié)構(gòu)提取輸入數(shù)據(jù)是可以用于提取輸入數(shù)據(jù)的許多實施例之一。在一個實施例中,通向分析引擎204a的其他初步輸入通道包括復(fù)雜-自適應(yīng)系統(tǒng)的反饋環(huán)。這樣,返回用戶交互212a(0)以提供更多輸入數(shù)據(jù)。下文描述圖27中所示這一輸入數(shù)據(jù)通道和包括復(fù)雜-自適應(yīng)系統(tǒng)的反饋環(huán)的細(xì)節(jié)。處理源數(shù)據(jù)結(jié)構(gòu)圖6示出了在本發(fā)明的一個特定方面中用以提取源結(jié)構(gòu)分析的源數(shù)據(jù)結(jié)構(gòu)處理。源數(shù)據(jù)結(jié)構(gòu)分析可以提供涉及源數(shù)據(jù)結(jié)構(gòu)的拓樸的數(shù)據(jù)。源數(shù)據(jù)的拓樸是指對其形狀進(jìn)行描述的源數(shù)據(jù)結(jié)構(gòu)的技術(shù)特征集(特征例如結(jié)構(gòu)中所含節(jié)點的數(shù)目以及源數(shù)據(jù)結(jié)構(gòu)中的節(jié)點之間關(guān)系的分散模式)。這一分析方法的一個主要目的在于度量概念306的通用或者專用(關(guān)于訓(xùn)練集802中的其他概念306)的程度。這里,將概念的相性的度量稱為"通用性"。下文描述在一個實施例中分析的源數(shù)據(jù)特征。關(guān)于分析和特征的細(xì)節(jié)隨源數(shù)據(jù)結(jié)構(gòu)而變化??梢越M裝概念關(guān)系908以供分析??梢詷?biāo)識(表明存在非分級關(guān)系)并且求解概念306之間的循環(huán)關(guān)系1002??梢詮募?004刪減(prune)被系統(tǒng)標(biāo)識為非分級的所有概念關(guān)系。在后續(xù)處理中沒有涉及到刪減的概念關(guān)系,但是可以使這些概念關(guān)系可用于基于不同變換規(guī)則的處理??梢詫⑽磩h減的概念關(guān)系作為分級關(guān)系來處理。系統(tǒng)可以將這些概念關(guān)系1006組裝成被排序為擴展間接關(guān)系集的所有分級概念關(guān)系的輸入概念分級1008。組裝輸入概念分級1008可以包括到對集合體中的節(jié)點進(jìn)行排序,并且移除可以從其他關(guān)系集推斷的任何冗余關(guān)系。輸入概念分級1008可以包括多分級結(jié)構(gòu),其中實體可以具有多個直接父實體。一旦被組裝,則如在以下步驟中所述,輸入概念分級1008可以包括用于度量概念關(guān)系集中概念306的通用性的結(jié)構(gòu),并且可以用于變換過程中的其他方法。如下文所述和圖9-10中所示,輸入概念分級1008中的概念關(guān)系可以用來計算潛在語素關(guān)系(D)。如下文所述和圖17中所示,輸入概念分級中的概念關(guān)系也可以用來處理用于系統(tǒng)的數(shù)據(jù)(E)。對輸入概念分級的分析可以進(jìn)行至度量各概念1010的通用性。同樣,通用性是指任何給定節(jié)點相對于分級1008中的其他節(jié)點如何通用或者專用。各概念3006可以基于它在輸入概念分級1008中的位置來進(jìn)行通用性度量評估??梢杂嬎忝總€概念308同與概念306相交的樹中的每個根的加權(quán)平均分離度。加權(quán)平均分離度是指各概念306與在根節(jié)點處的概念306的距離。明確地為根節(jié)點的概念306被賦予唯一的通用性度量。通用性度量針對更具體的概念306而增加,這反映它們與駐留于根節(jié)點的最通用概念306的增加分離度。本領(lǐng)域技術(shù)人員將認(rèn)識到許多其他通用性度量是可能的。用于各概念306的通用性度量可以存儲于概念通用性指數(shù)1012中(例如數(shù)據(jù)儲存器910中)。如下文所述和圖12-圖13中所示,概念通用性指數(shù)1012可以用來推斷用于語素的一般性度量集(F)。在一個實施例中描述的方法可以適用于也稱為父-子關(guān)系的分級型關(guān)系。父-子關(guān)系涵蓋其可以支持的大量的各種關(guān)系類型。例子包括整體-部分、基因-物種、類型-實例和類-子類。換而言之,通過支持分級型關(guān)系,本發(fā)明適用于廣泛的分類任務(wù)。處理初步概念定義圖7圖示了用以生成初步概念定義的關(guān)鍵詞提取方法。這一過程的一個主要目的在于,按照關(guān)鍵詞308來生成用于概念306的結(jié)構(gòu)定義。在一個實施例中,在這一階段可以將概念定義描述為"初步"是因為它們將在以后階段中受到修正。本領(lǐng)域普通技術(shù)人員將認(rèn)識到,對于涉及提取關(guān)鍵詞308作為概念306的結(jié)構(gòu)表示這一目標(biāo),存在許多方法和技術(shù)。在一個實施例中,可以限制適用于關(guān)鍵詞提取的抽象級??梢栽O(shè)計這些限制以派生具有以下性質(zhì)的關(guān)4定詞關(guān)鍵詞是響應(yīng)于直接關(guān)系集內(nèi)詞的獨立性、使用(基于原子概念提取的)原子概念(其中概念存在于訓(xùn)練集的其他區(qū)域中)來定義的??梢詤R集概念簽名卯6和概念關(guān)系908以供分析。在一個實施例中,這一過程是基于文本實體的提取。這樣,在以下描述中,可以假設(shè)概念簽名906直接地映射到向概念306分配的概念標(biāo)簽。當(dāng)在概念標(biāo)簽906中標(biāo)識標(biāo)簽時,可以提取文本串的相關(guān)部分,并且使用該相關(guān)部分作為概念標(biāo)簽306a。在后續(xù)方法中,當(dāng)在概念306中標(biāo)識關(guān)鍵詞308和語素310時,可以從概念標(biāo)簽306a的相關(guān)部分提取用于關(guān)鍵詞308a和語素310a的標(biāo)簽。最終,這些域特有的標(biāo)簽可以寫入到輸出數(shù)據(jù)。如果操作800變換先前已經(jīng)分析和分類的數(shù)據(jù)結(jié)構(gòu),則實體標(biāo)簽可以直接在源數(shù)據(jù)結(jié)構(gòu)中可用。注意,在概念簽名與概念標(biāo)簽提取之間的這一接合點表示用于各類實體提取工具的整合點,其涉及許多類型的內(nèi)容節(jié)點302,如圖像、多媒體的廣泛各種實體提取工具與物理對象分類。可以在概念標(biāo)簽中標(biāo)識一系列關(guān)鍵詞描繪符??梢曰陉P(guān)鍵詞308的共用結(jié)構(gòu)描繪符(比如括號、引號和逗號)、根據(jù)概念標(biāo)簽306a來解析(1102)初步關(guān)鍵詞范圍。然后再次使用普通字描繪符(比如空格和語法符號)根據(jù)初步關(guān)鍵詞范圍來解析(1104)全部的字。用于文本實體解析的這些基于模式的方式在本領(lǐng)域中是公知的。來自初步關(guān)鍵詞范圍1102的解析詞可以包括用于關(guān)鍵詞提取過程中的下一階段的一個輸入集。其他輸入集可以是直接概念關(guān)系集1106??梢愿鶕?jù)概念關(guān)系908的集合來派生直接概念關(guān)系集1106。直接概念關(guān)系集1106可以包括用于每個概念306的所有直接關(guān)系(所有直接父關(guān)系和所有直接子關(guān)系)。這些輸入用來檢查初步關(guān)鍵詞范圍1108中詞的獨立性。直接關(guān)系集1106內(nèi)單個詞的獨立性可以包括用于關(guān)鍵詞308的描繪符。在描繪關(guān)鍵詞范圍之后,可以執(zhí)行校驗以保證所得出的關(guān)鍵詞308的所有部分有效。具體而言,被描繪為關(guān)鍵詞308的概念標(biāo)簽306a的所有部分最優(yōu)地通過詞獨立'性觀'J試。在一個實施例中,可以基于下文稱為"詞干化(stemming)"的詞干(或稱詞根)匹配方法來執(zhí)行針對詞獨立性的校驗。本領(lǐng)域中公知許多詞千化方法。如下文在圖8中所示語素提取方法中所述,詞干化為分類提供極為精細(xì)的基礎(chǔ)?;诔醪疥P(guān)鍵詞范圍中的詞獨立性,可以標(biāo)識潛在關(guān)鍵詞描繪符1110的附加集合。簡言之,如果一個詞在一個概念標(biāo)簽306a中與其他詞一起存在、而在相關(guān)概念標(biāo)簽306a中缺乏這些相同的詞,則該詞可以描繪關(guān)4定詞。然而,在基于這些關(guān)鍵詞描繪符將概念標(biāo)簽306a解析成關(guān)鍵詞標(biāo)簽308a之前,可以驗證(1112)候選關(guān)鍵詞標(biāo)簽。一般要求所有候選關(guān)鍵詞標(biāo)簽通過上述詞獨立性測試。這一校驗防止關(guān)鍵詞提取過程分裂在目標(biāo)抽象級以外的概念(即原子概念)。一旦生成關(guān)鍵詞標(biāo)簽的初步集合,系統(tǒng)可以檢查集合體中的所有初步關(guān)鍵詞標(biāo)簽。這里的意圖在于標(biāo)識復(fù)合關(guān)鍵詞1114。符合關(guān)鍵詞可以作為單個概念標(biāo)簽306a內(nèi)的多個有效關(guān)鍵詞標(biāo)簽而存在。這一測試可以直接基于作為概念-關(guān)鍵詞抽象范圍的原子概念目標(biāo)。在一個實施例中,可以使用遞歸來將復(fù)合關(guān)鍵詞的集合窮盡地拆分成由訓(xùn)練集802支持的關(guān)鍵詞308的最初等集合。如果復(fù)合關(guān)鍵詞保留于關(guān)鍵詞標(biāo)簽的演變匯集,則可以生成(1110)潛在關(guān)鍵詞描繪符的附加集合,其中使用匹配關(guān)鍵詞來對描繪符進(jìn)行定位。同樣,可以將描繪的關(guān)鍵詞范圍作為有效關(guān)鍵詞來校驗,提取關(guān)鍵詞,并且該過程重復(fù)直至無法找到更多復(fù)合關(guān)鍵詞。該方法的最后一輪聯(lián)合可以用以跨過整個域來消除關(guān)4定詞標(biāo)簽的不明確性。消除不明確性在本領(lǐng)域中是一個公知的要求,并且它有許多方式。一般而言,消除不明確性用來解決在實體共享相同標(biāo)簽時顯現(xiàn)的不明確性。在一個實施例中,可以通過將關(guān)鍵詞聯(lián)合為共享同一標(biāo)簽的單個結(jié)構(gòu)實體來提供一種消除不明確性的方法。具體而言,如果關(guān)鍵詞共享標(biāo)簽和相交的直接概念關(guān)系集,則可以存在用于關(guān)鍵詞標(biāo)簽、將其與單個關(guān)鍵詞實體進(jìn)行關(guān)聯(lián)的基礎(chǔ)。備選地,可以放寬這一消除不明確性的方法的限制。具體而言,通過移除相交的直接概念關(guān)系集的標(biāo)準(zhǔn),域中的所有共享關(guān)鍵詞標(biāo)簽可以聯(lián)合到相同關(guān)鍵詞實體。在域相對較小或者非常匯集于它的主題內(nèi)容時,這是一種有用的方式。備選地,可以通過直接和間接概念關(guān)系的更廣泛譜系來改變在這一消除不明確性方法中使用的概念關(guān)系集。許多消除不明確性的方法在本領(lǐng)域中是已知的。這一關(guān)鍵詞提取方法的結(jié)果可以是抽象至"原子概念"級的關(guān)鍵詞集合1118。將關(guān)鍵詞與派生它們的概念306相關(guān)聯(lián)(1120),作為初步概念定義708a。以后可以擴展這些初步概念定義708a以在它們的結(jié)構(gòu)中包括語素實體,從而擴展為更深和更基本的抽象級。如下文進(jìn)一步所述,可以進(jìn)一步擴展這些初步概念定義,以利用由輸入數(shù)據(jù)中的概念關(guān)系來表明的關(guān)鍵詞和語素的隱式屬性。從這一過程派生的實體708a可以傳遞到本公開內(nèi)容中描述的變換引擎中的后續(xù)過程。初步概念定義708a是向下文描述和在圖8中圖示的語素提取過程(G)以及下文描述和在圖17中圖示的輸出數(shù)據(jù)過程(H)的輸入。提取語素在傳統(tǒng)分面式分類中,用于分面的屬性一般可以限于可以使用人類認(rèn)知來標(biāo)識、并且與其他概念相關(guān)聯(lián)的概念。結(jié)果,屬性可以視為原子概念,因為屬性構(gòu)成概念而無需更深的上下文。這里描述的方法可以跨過大型數(shù)據(jù)集使用統(tǒng)計工具,以標(biāo)識初等的(語素性的)不可縮減的概念屬性及其關(guān)系。在這一抽象級,許多屬性將無法由人類分類者識別為概念。圖8圖示了可以用來解析語素310并且將語素與關(guān)鍵詞308進(jìn)行關(guān)聯(lián)以擴展初步概念定義708a的方法。該語素4是取方法可以從上文描述和在圖7中圖示的生成初步概念定義的方法繼續(xù)。注意,在一個實施例中,語素提取方法可以具有與關(guān)鍵詞提取方法公共的元素。這里,為對語素提取進(jìn)行較為粗略的處理而提供描述,其中這些方法于此重疊。關(guān)鍵詞的池庫1118和直接概念關(guān)系1116的集合可以是對這一方法的豸餘入??梢远x模式以用作用于標(biāo)識語素候選1202的標(biāo)準(zhǔn)。如本領(lǐng)域公知的,這些模式可以建立用于詞千化的參數(shù),并且可以包括用于整個詞以及部分詞匹配的才莫式。與關(guān)鍵詞提取一樣,直接概念關(guān)系1106的集合可以提供用于模式匹配的上下文??梢栽诔霈F(xiàn)關(guān)鍵詞的直接概念關(guān)系集內(nèi)針對關(guān)鍵詞的池庫1118來應(yīng)用模式(1024)??梢詷?biāo)識(1206)基于詞干化模式的共享根集。共享根集可以包括用于每個關(guān)鍵詞的候選語素根1208的集合??梢詫τ糜诿總€關(guān)鍵詞的候選語素根以保證它們相互一致(1210)。可以假設(shè),在同一關(guān)鍵詞的上下文和出現(xiàn)該關(guān)鍵詞的直接概念關(guān)系集內(nèi)駐留的根具有重疊根。另外,假設(shè)從這些重疊根的相交派生的初等根將保留在用來標(biāo)識有效語素的參數(shù)內(nèi)。這一驗證校驗可以提供一種用于在應(yīng)用模式匹配以標(biāo)識潛在語素時校正存在的錯誤(詞干化方法的一個通病)的方法。更重要的是,驗證可以約束過度的語素拆分并且可以提供上下文有意義的而仍然是基本的抽象級。在一個實施例中i殳計的對語素和關(guān)4建詞4是耳又的一系列約束還可以在復(fù)雜-自適應(yīng)系統(tǒng)的背景內(nèi)提供負(fù)反饋機制。具體而言,這些約束可以起到消除復(fù)雜性以及在用于分類的設(shè)置參數(shù)內(nèi)對其進(jìn)行管理的作用。通過這一語素驗證過程,可以從關(guān)鍵詞集合移除任何不一致的候選語素根(1212)??梢灾貜?fù)模式匹配以標(biāo)識語素候選的過程直至移除所有不一致的候選。一致語素候選集可以用來派生與關(guān)鍵詞相關(guān)聯(lián)的語素。與關(guān)鍵詞提取方法一樣,描繪符可以用來提取語素(1214)。通過檢查潛在根的群組,可以針對每個關(guān)鍵詞來標(biāo)識一個或者多個語素描繪符??梢曰诿枥L符在各關(guān)鍵詞標(biāo)簽內(nèi)的位置來提取語素(810)。更重要的是派生一個或者多個語素實體以向關(guān)鍵詞提供結(jié)構(gòu)定義的過程。可以通過將語素與派生它們的關(guān)鍵詞相關(guān)(或者映射)來構(gòu)造關(guān)鍵詞定義(1216)。這些關(guān)鍵詞定義可以存儲于域數(shù)據(jù)儲存設(shè)備706中??梢曰谡Z素類型(例如自由、受限、屈折或者派生)(1218)。在構(gòu)造過程的以后階段中,用于構(gòu)建概念的規(guī)則可以基于涉及到的語素類型以及這些語素是否受限于其他語素而變化。一旦被確定類型,則提取的語素可以包括域1220中所有語素的池庫。這些實體可以存儲于系統(tǒng)的語素詞典206中??梢跃S護(hù)每個語素標(biāo)簽的持久詳細(xì)目錄以用來通知將來多輪語素解析(關(guān)于更多信息,參見上文圖33中所示數(shù)據(jù)結(jié)構(gòu)變換的概述)。如下文所述和在圖9-圖IO中所示,從這一過程派生的語素可以傳遞到變換引擎中的后續(xù)過程,以處理語素關(guān)系(I)。本領(lǐng)域技術(shù)人員將認(rèn)識到,存在可以用來發(fā)現(xiàn)和提取包括語素的關(guān)鍵詞定義的許多算法。計算語素關(guān)系語素可以提供對系統(tǒng)的多級分面式數(shù)據(jù)結(jié)構(gòu)進(jìn)行錨定的一個初等構(gòu)造集。其他初等構(gòu)造可以是語素關(guān)系。如上文討論的和圖3、圖18-圖19中圖示的那樣。語素關(guān)系提供用于創(chuàng)建維度概念關(guān)系的有力基礎(chǔ)。然而,挑戰(zhàn)在于在分類數(shù)據(jù)中存在的不明確性噪聲中真實地標(biāo)識語素性的語素關(guān)系。本發(fā)明的多級結(jié)構(gòu)提供一種針對這一挑戰(zhàn)的解決方式。通過跨多個提取集來驗證關(guān)系,相繼地削減不明確性。以下部分解決了發(fā)現(xiàn)語素關(guān)系。具體而言,在本發(fā)明的這一特定方面中,模式擴充方法用來去掉噪聲以增強初等構(gòu)造的統(tǒng)計標(biāo)識。潛在語素關(guān)系概述圖9圖示了用于根據(jù)訓(xùn)練匯集的概念關(guān)系來推斷潛在語素關(guān)系的方法??梢杂嬎銤撛谡Z素關(guān)系以檢查所有概念關(guān)系的集合體中的獨立潛在語素關(guān)系的普及度?;谶@一檢查,可以應(yīng)用統(tǒng)計測試來標(biāo)識如下候選語素關(guān)系,這些候選語素關(guān)系在其中存在它們的所有概念關(guān)系的背景中成立的可能性高。在本發(fā)明的系統(tǒng)的一個實施例中,可以將潛在語素關(guān)系構(gòu)造為可以在相關(guān)概念中的語素之間存在的所有關(guān)系排列,其中保留關(guān)系的父-子方向性。在圖9中的例子中,輸入概念分級1008的一部分示出了兩個概念之間的關(guān)系。父概念及其有關(guān)子概念可以分別包含語素《A,B)和{C,D}。同樣,可以按照(在一個實施例中經(jīng)由關(guān)鍵詞來分組的)一個或者多個語素來定義概念。結(jié)果,在兩個概念之間的任何關(guān)系將意味著在定義這些概念的語素之間的至少一個(并且常常是多個)關(guān)系。在這一例子中說明了計算潛在語素關(guān)系的過程。可以根據(jù)單個概念關(guān)系來推斷四個潛在語素關(guān)系812a。維持通過概念關(guān)系來建立的父-子方向性并且不允許任何重復(fù),可以派生四個潛在語素關(guān)系A(chǔ).C、A.D、B.C、B.D。一般而言,如果父概念包含x個元素而子概念包含y個元素,則將存在xxy個潛在語素關(guān)系潛在語素關(guān)系的數(shù)目是父概念和子概念中的語素數(shù)目的乘積。在一個實施例中,可以對計算語素關(guān)系的這一簡單說明進(jìn)行細(xì)化,以改進(jìn)所生成的統(tǒng)計指示符。下文在對圖IO所示潛在語素關(guān)系計算方法的描述中指出了這些細(xì)化(即,排列語素)。對標(biāo)識潛在語素關(guān)系的基本方法的這些細(xì)化可以用以減少潛在語素關(guān)系的數(shù)目。這一減少又可以減少噪聲數(shù)量,由此擴充對語素關(guān)系進(jìn)行標(biāo)識的模式,并且使語素關(guān)系的統(tǒng)計標(biāo)識更可靠。同樣,本領(lǐng)域普通技術(shù)人員將認(rèn)識到,存在可以用來根據(jù)給定的概念關(guān)系集來派生潛在語素關(guān)系的許多算法。計算潛在語素關(guān)系的方法圖10更具體地給出了計算潛在語素關(guān)系的過程的一個實施例。這里的意圖在于生成如下潛在語素關(guān)系集,以后可以分析該潛在語素關(guān)系集,以評估它們本質(zhì)上真正是語素性(也就是說,它們在其出現(xiàn)的每個上下文中成立)的可能性。計算潛在語素關(guān)系的當(dāng)前方法從上文描述和在圖6中圖示的資源結(jié)構(gòu)分析方法D繼續(xù)。該方法也從如上文描述和在圖8中圖示的語素提取方法I擴展。對確定潛在語素關(guān)系的這一方法的輸入可以是從域提取的語素池庫1220和包含來自域的概念關(guān)系驗證集的輸入概念分級1008。可以校準(zhǔn)每個概念關(guān)系對內(nèi)的語素(1404),以減少可以推斷的潛在語素關(guān)系的數(shù)目。具體而言,如果校準(zhǔn)兩個數(shù)據(jù)元素,則這些元素可以與同一概念關(guān)系對內(nèi)的任何其他元素組合。通過校準(zhǔn),可以減少候選語素關(guān)系的數(shù)目。在一個實施例中,軸可以基于共享的語素來校準(zhǔn),并且包括限于共享語素的所有語素。例如,如果一個概念是"加拿大政治"而另一概念是"國際政治",則可以使用關(guān)鍵詞"政治"中的共享語素作為用于校準(zhǔn)的基礎(chǔ)。也可以基于語素詞典內(nèi)的現(xiàn)有語素關(guān)系來校準(zhǔn)軸。具體而言,如果可以通過語素詞典中的語素關(guān)系來表示(使用語素關(guān)系集來直接或者間接地構(gòu)造)任何給定的潛在語素關(guān)系,則可以在這一基礎(chǔ)上校準(zhǔn)潛在語素關(guān)系。外部詞典(圖10中未示出)也可以用來指導(dǎo)潛在語素關(guān)系的校準(zhǔn)。例如WORDNETTM是可以適用于校準(zhǔn)的詞典??梢允褂猛獠吭~典內(nèi)包含的各種信息作為用于指導(dǎo)的基礎(chǔ)。在一個實施例中,可以先通過言語部分對關(guān)鍵詞進(jìn)行分組;約束潛在語素關(guān)系以便僅在這些語法分組內(nèi)進(jìn)行組合。換而言之,如外部詞典所指導(dǎo)的那樣,校準(zhǔn)可以基于言語的語法部分。還可以使用可以根據(jù)外部詞典來推斷的直接語素關(guān)系作為校準(zhǔn)的基礎(chǔ)??梢杂嬎銤撛谡Z素關(guān)系(812)作為已校準(zhǔn)集合中未涉及到語素的所有組合。上文描述并在圖9中圖示了這一計算。潛在語素關(guān)系1406的所得集合可以保持于域數(shù)據(jù)儲存設(shè)備910中。這里,潛在語素關(guān)系的詳細(xì)目錄可以在它們存在于訓(xùn)練匯集時加以跟蹤,并且通過后續(xù)分析階段來刪減。根據(jù)這一過程來派生的潛在語素關(guān)系可以傳遞到如下文描述的和在圖11-圖13中圖示的用于刪減和語素關(guān)系組裝(J)的過程。刪減潛在語素關(guān)系可以將通過上文描述并在圖9-圖10中圖示的方法所生成的潛在語素關(guān)系池庫刪減成候選語素關(guān)系集??梢曰跐撛谡Z素關(guān)系在訓(xùn)練匯集的普及度的評估來刪減潛在語素關(guān)系。普及度高的那些潛在語素關(guān)系真正作為語素性(也就是關(guān)系在每個上下文中成立)的可能性更大。此外,可以假設(shè)語素關(guān)系在它們與更多通用(更廣義)的相關(guān)語素的關(guān)系上是明確的。用于這一不明確性的結(jié)構(gòu)標(biāo)記器可以是多分級。語素關(guān)系可以將更少屬性具體化并且提供用于相關(guān)語素的更多確定基礎(chǔ)。這樣,還可以在潛在語素關(guān)系存在于多分級中時對其進(jìn)行刪減??梢酝ㄟ^也是分級的語素關(guān)系對的集合來構(gòu)造語素關(guān)系分級。這樣,可以在集合體中分析潛在語素關(guān)系池庫以標(biāo)識與這一分級假設(shè)矛盾的關(guān)系。在這一刪減過程之后留存的候選語素關(guān)系可以組裝成語素分級。雖然候選語素關(guān)系是父-子配對,但是語素分級可以擴展到多代父-子關(guān)系。圖IIA和圖11B圖示了在潛在語素關(guān)系與減除后的候選語素關(guān)系集之間的差異。在圖11A中存在分級的四個潛在語素關(guān)系對(父-子)。這些關(guān)系中的前三個關(guān)系在域中相對地普及,但是第四個關(guān)系相對地少見。因而,從潛在語素關(guān)系集中減除第四對。潛在語素關(guān)系1406的集合中的前三個關(guān)系對也與分級假設(shè)一致。然而,雙向的第五關(guān)系1502與這一^f叚設(shè)沖突。關(guān)系D.C的方向與關(guān)系C.D的方向沖突。這一語素對被重新歸類為通過關(guān)聯(lián)關(guān)系而相關(guān),并且從候選語素關(guān)系1504的集合中被移除。圖IIB示出了減除后的候選語素關(guān)系集。組裝語義關(guān)系合并語義關(guān)系圖12圖示了將候選語素關(guān)系聯(lián)合為整體語素多分級。所有候選語素關(guān)系對可以并入到一個全集合中,該集合連接在邏輯上一致的世4義沖對(generationaltree)(^口下文更具體;也戶斤述)。這一數(shù)據(jù)結(jié)構(gòu)可以描述為"多分級",因為它可以造成在與更多通用語素(多個父節(jié)點)的一個以上的直接關(guān)系中涉及到的奇異語素(singularmorpheme)。這一多分級可以在該過程的后續(xù)階^:中變換成嚴(yán)格分級(僅單個父節(jié)點)。在(上文描述的和在圖11B中圖示)沖突刪減過程之后留存的潛在語素關(guān)系可以匯集到候選語義關(guān)系1504的集合中。候選語素關(guān)系集可以合并成整體語素多分級1602。在一個實施例中,對構(gòu)造整體多分級的過程的約束可以是1)多分級中的候選語素關(guān)系集在集合體中邏輯上是一致的;2)多分級使用創(chuàng)建邏輯上一致的結(jié)構(gòu)所需的最少數(shù)目的多分級關(guān)系。遞歸排序算法可以用來組裝樹并且突出沖突和提出的解決途徑。適用于下例的推理說明了這一算法的邏輯?;陉P(guān)系分級#1,A比C高級(也就是更通用)?;诜旨?2,B比C高級?;诜旨?3,A比D高級。四個語素可以與比C高級的A和C、以及比D高級的A在邏輯上組合。當(dāng)可能有不止一個邏輯排序,概念通用性指數(shù)1012可以用來解決不明確性(通過上文描述的和在圖6中圖示的源結(jié)構(gòu)分析方法來創(chuàng)建概念通用性指數(shù))。這一指數(shù)可以用來比較語素以評估語素比其他語素相對更通用還是更專用(按照從跟節(jié)點起的分離度來度量通用性)。在該例中,A和B基于候選語素關(guān)系均為邏輯上一致的最高節(jié)點。A和B也均為C的父節(jié)點。因此,可以在C處生成多分級的關(guān)系集。由于在樣本集中沒有與多分級的關(guān)系集沖突的信息,所以可以假設(shè)關(guān)系有效。處理可以繼續(xù)在后續(xù)階段中分解多分級。如果存在如下新數(shù)據(jù),該數(shù)據(jù)表明A和B代之以是經(jīng)過間接關(guān)系的相關(guān)節(jié)點,則系統(tǒng)可以立即分解多分級并且將A和B排序于同一樹中。可以通過通用性指數(shù)來確定A和B優(yōu)先級。這里,A具有低于B的通用性排名。因此在所得多分級1602中對其給予更高的(或者更通用的)位置。語素多分級組裝圖13圖示了可以用于從候選語素關(guān)系組裝語素多分級的方法??梢酝ㄟ^分析集合體中的候選語素關(guān)系來組裝語素多分級。與在輸入概念分級組裝中一樣,目的在于將獨立的關(guān)系對聯(lián)合成統(tǒng)一的整體。語素關(guān)系組裝方法可以從上文描述和在圖9-圖10中圖示的計算潛在語素關(guān)系的方法J繼續(xù)。潛在語素關(guān)系的集合1406可以是對這一方法的輸入。可以基于包含語素的概念關(guān)系的分析來對候選語素關(guān)系進(jìn)行排列(1702)??梢曰诟鞲拍铌P(guān)系對中的語素的總數(shù)來對概念關(guān)系進(jìn)行排列(最低到最高)。隨著概念關(guān)系對中包含的語素的數(shù)目減少,語素關(guān)系的可能性可以增加(因為按照該對中的潛在候選的數(shù)目將針對任何給定語素關(guān)系候選的概率因數(shù)化)。因此在一個實施例中,操作可以以更低語素計數(shù)的分析來區(qū)分概念關(guān)系的優(yōu)先次序。降低該對中的語素的數(shù)目,則可以增加發(fā)現(xiàn)真正語素性的語素關(guān)系的機會??梢栽O(shè)置用以限定語素關(guān)系的統(tǒng)計相關(guān)邊界的參數(shù)(1704)。這些參數(shù)可以是基于集合體中的語素關(guān)系的普及度。目的在于標(biāo)識域中流行度高的語素關(guān)系。對語素關(guān)系的這些約束也可以對復(fù)雜-自適應(yīng)系統(tǒng)的負(fù)反饋機制起作用??梢詫象w中的關(guān)系集進(jìn)行分析(1706)以確定各關(guān)系的總普及度。這一分析可以組合在由系統(tǒng)管理員控制的靈敏度參數(shù)內(nèi)進(jìn)行的統(tǒng)計工具。確切的參數(shù)可以針對各域來定制,并且可以由域所有者和系統(tǒng)管理員來改變。與概念關(guān)系分析一樣,可以使用循環(huán)關(guān)系U708)作為結(jié)構(gòu)標(biāo)記器來否定分級關(guān)系的假設(shè)。如果潛在語素關(guān)系沒有通過普及度和分級的過濾器則可以將其刪減(1710)。刪減后的潛在語素關(guān)系集可以包括候選語素關(guān)系的集合1504。如在概念通用性指數(shù)1012中具體化的那樣,可以根據(jù)源結(jié)構(gòu)概念的通用性來推斷語素的通用性(1010a)。可以使用將最低數(shù)目的語素具體化的概念作為用于各語素的通用性的替代概念。為了說明這一假設(shè)的基礎(chǔ),假設(shè)概念包括僅一個語素。在概念與包括它的單個語素之間的高相關(guān)程度的給定情況下,有可能的是語素的通用性將與概念的通用性緊密地相關(guān)。這一推理在一個實施例中指導(dǎo)語素通用性的計算。具體而言,系統(tǒng)可以收集將集合體中的最低數(shù)目的語素具體化的概念集。也就是說,系統(tǒng)可以選擇代表集合中所有語素的概念集。概念通用性指數(shù)1012可以用來區(qū)分維度概念關(guān)系的優(yōu)先次序,并且可以存儲(未示出)于域數(shù)據(jù)儲存設(shè)備706中。使用如上文描述的和在圖12中圖示的方法,語素分級可以組裝到整個多分級結(jié)構(gòu)(1712)中。這可以包括對集合體中的節(jié)點進(jìn)行排序,并且移除可以根據(jù)其他間接關(guān)系集來推斷的任何冗余關(guān)系。創(chuàng)建的概念通用性指數(shù)可以從最通用到最專用,來對語素進(jìn)行排序。本領(lǐng)域普通技術(shù)人員將認(rèn)識到,存在本領(lǐng)域中已知的可以用來將分級語素關(guān)系匯集合并成多分級的許多算法。組裝語素分級圖14-圖16圖示了將語素多分級變換成語素分級。語素多分級歸因(attribution)圖14A-圖14B圖示了語素歸因過程和例子結(jié)果。在此上下文中的歸因是指對分面屬性進(jìn)行排序并且將其分配給數(shù)據(jù)元素的方式。正如操作對實體提取(比如關(guān)鍵詞和語素提取)設(shè)置約束一樣,可以使用對語素關(guān)系的顯式約束來構(gòu)建語素分級。按照定義,將語素鏈接成為分級的語素關(guān)系是語素性的。語素實體是初等和明確的。一般要求語素僅涉及一個父節(jié)點。在語素關(guān)系集(語素分級)中,語素可以僅在一個位置中存在。基于一個知識表示模型中的這些定義,可以在語素數(shù)據(jù)分面分級內(nèi)將語素呈現(xiàn)為屬性。知識表示模型因此可以提供分面式數(shù)據(jù)和多級增強型分面式分類方法。在前述方法中,候選語素關(guān)系的聚集可以呈現(xiàn)語素多分級的集合1802。因此,歸因可以用來估算知識表示模型中的這些沖突并且給出解1804。在一個實施例中的歸因方法可以包括為分級中與語素分級要求沒有沖突的每個語素找到位置。多分級中的語素可以在它們的原有樹內(nèi)上升到新位置或者移動到全新的樹。這一歸因過程最終定義分面分級中的最高根語素節(jié)點。因此,可以將語素分級中的根語素節(jié)點定義為語素分面,其中各語素包含于語素分面屬性樹內(nèi)。以下討論說明了用于使用屬性概念來移除多個父節(jié)點的方法。同樣,用于沖突的結(jié)構(gòu)標(biāo)記器可以是語素多分級1802中出現(xiàn)的多個父節(jié)點的存在。為了移除沖突,可以將具有多個父節(jié)點的語素重新視為共享父節(jié)點的祖先的屬性??梢詣?chuàng)建屬性類以維持由重新組織的語素原來共享的父節(jié)點的分組,并且將語素保持于與這些父節(jié)點分離的屬性類中(在沒有唯一祖先的情況下,該方法將語素升級為分級的根級作為新的語素分面)。可以將關(guān)系重新組織成從根節(jié)點到葉節(jié)點的屬性類。可以先將多個父節(jié)點重新組織成屬性,從而可以標(biāo)識奇異父屬性。也就是說,語素關(guān)系的自上而下的遍歷提供了可以分解至解集1804的歸因。一般而言,如果兩個語素共享至少一個父屬性,則它們在該共享父節(jié)點的上下文中是兄弟(關(guān)聯(lián)關(guān)系)??梢栽趩蝹€屬性類之下對兄弟子節(jié)點進(jìn)行分組(注意子節(jié)點只需共享一個父節(jié)點;它們無需共享所有父節(jié)點)。如果語素沒有共享至少一個父節(jié)點,則可以將它們分組成共享祖先的單獨屬性。為了在兩種備選方式之間選擇,可以對源關(guān)系的相關(guān)度進(jìn)行加權(quán)。上文在圖6中所示源結(jié)構(gòu)分析的討論中介紹了關(guān)系相關(guān)度的度量。在上而下地開始,變換步驟可以分解如下1.兄弟組(B,C,D,F,H》共享單個父節(jié)點。校驗各獨立節(jié)點,以查看是否存在多個父節(jié)點。在這一情況下,這些節(jié)點無一具有多個父節(jié)點,因而無需重新組織這些關(guān)系。2.語素E具有多個父節(jié)點。E的最近的單親祖先是A。需要將E重新組織成A的屬性。3.在屬性類Al之下對(B,C,D,F,H}、E的父屬性進(jìn)行分組。E然后變成A1的兄弟,作為A的屬性4.語素G也具有多個父節(jié)點。與在步驟(2-3)中一樣,需要將它重新組織成A的屬性。此外,由于E和G共享至少一個父節(jié)點,所以可以將其分組在單個屬性類A2之下。5.語素J具有唯一父節(jié)點H。無需重新組織這一父-子關(guān)系。6.語素K具有多個父節(jié)點E和G。E和G的唯一祖先現(xiàn)在為A2。需要將K重新組織成A2的屬性。7.在屬性類A2-l之下對(E,G)、K的父屬性進(jìn)行分組。K然后變成A2-1的兄弟,作為A2的屬性。最終結(jié)果是與通過本發(fā)明的知識標(biāo)識模型來定義的真正語素屬性和語素關(guān)系的假設(shè)相符的語素分級。語素分級重新組織圖15給出了在一個實施例中可以提供歸因方法的遞歸算法。這一語素分級重新組織的核心邏輯可以是上文描述和在圖14A和圖14B中圖示的歸因方法。用于這一方法的輸入可以是上文描述并在圖11-圖13中圖示的語素多分級(K)。向本方法的輸入可以是語素多分級1602??梢詮母?jié)點到葉節(jié)點對關(guān)系進(jìn)行分類(1902)??梢葬槍Χ鄠€父節(jié)點來校驗語素多分級中的每個語素。這里,將作為分析焦點的語素稱為活躍語素。如果存在任何多個父節(jié)點,則可以將用于活躍約束的多個父節(jié)點的集合分組成下文稱為語素屬性類的集合(1906)??梢允褂谜Z素屬性類來指導(dǎo)應(yīng)當(dāng)如何對重新組織的樹中的語素進(jìn)行排序。對于每個語素屬性類,可以定位沒有多個父節(jié)點的唯一祖先(1908)。祖先可以僅與屬性類(由語素共享的父節(jié)點組)唯一地關(guān)聯(lián)。如果存在祖先,則系統(tǒng)可以創(chuàng)建一個或者多個虛擬屬性(1910)以包含語素屬性內(nèi)的所有語素。樹中的這一節(jié)點稱為"虛擬屬性"是因為它沒有直接地與任何語素相關(guān)聯(lián),因此不會包含在任何概念定義中。它是虛擬屬性而不是實際屬性。如果存在祖先并且創(chuàng)建一個或者多個屬性,則可以將活躍語素重新組織成祖先的屬性(1912),其或者與祖先直接相關(guān),或者與語素屬性類中的其他語素分組在一起。如果不存在唯一祖先,則可以將語素重新定位成樹中的根節(jié)點(分面)(1914)。系統(tǒng)也可以允許管理員人工更改(1916)語素關(guān)系池庫和所得語素分級以細(xì)化或者替換自動生成的結(jié)果。這一過程的最終結(jié)果可以是包括初等語素分級布置的語素分級402。作為系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)的初等構(gòu)造之一,語素分級可以用來將實體分類和布置到越來越復(fù)雜的抽象級中??梢栽谡Z素詞典206中錄入語素分級中的語素關(guān)系??梢曰谙到y(tǒng)中存儲的標(biāo)簽普及度將語素標(biāo)簽分配給語素??梢允褂孟到y(tǒng)中最普及的語素標(biāo)簽作為用于該語素的單個代表性標(biāo)簽。如下文所述和在圖17中所示,可以對該方法的輸出進(jìn)行處理作為系統(tǒng)輸出數(shù)據(jù)(L)。可以使用將多分級變換成嚴(yán)格分級的替代方式??梢曰诙鄠€加權(quán)因子中的任何加權(quán)因子來選擇單個父節(jié)點,以移除多個父節(jié)點的情形。在一個簡單解決方案中,可以刪除多個父節(jié)點的關(guān)系。圖16A圖示了來自組裝的語素分級的樣本樹片段。樹(例如2002a)中的各節(jié)點可以代表語素分級中的語素。文件夾圖標(biāo)用來表明如下語素,這些語素是下面嵌套的相關(guān)語素的父節(jié)點(語素關(guān)系)。在各節(jié)點旁邊的文本(例如2002b)是相關(guān)聯(lián)語素標(biāo)簽(在許多情況下為部分的詞)。分面式分類綜合的方法這里開始基于增強的分面式分類方法來構(gòu)建(或稱綜合)維度概念分類法210的過程。這一分類可以通過利用概念定義集(具體而言按照語素來定義,其中零個或者更多語素作為語素分級內(nèi)的語素屬性)檢查語素分級來生成維度概念關(guān)系??梢栽诙鄠€數(shù)據(jù)提取級應(yīng)用本發(fā)明的分面式分類方法。以此方式,多個域可以在維持對域特有的邊界之時共享用于分類的相同初等構(gòu)造。處理分面式數(shù)據(jù)集以下幾點總結(jié)了根據(jù)分析操作來準(zhǔn)備輸出數(shù)據(jù)以用于對分面式分類數(shù)據(jù)結(jié)構(gòu)進(jìn)行綜合(如下文進(jìn)一步所述)的一個方面中所包括的步驟對于將要分類的各域,可以輸出數(shù)據(jù)結(jié)構(gòu)作為域特有的關(guān)鍵詞分級和域特有的概念定義集合(具體而言,按照域特有的關(guān)鍵詞來定義,零個或者更多域特有的關(guān)鍵詞作為域特有的關(guān)鍵詞分級內(nèi)的關(guān)鍵詞屬性)??梢愿鶕?jù)跨域共享的初等構(gòu)造來派生上述域特有的分面式數(shù)據(jù)??梢杂眯滦畔硇拚兔黠@地擴展初步概念定義。這是通過將語素分級中的信息與訓(xùn)練集中的原有概念關(guān)系做比較來實現(xiàn)的。具體而言,綜合操作可以不僅基于由域所有者提供的顯式定義的分析而且通過集合體中所有相交概念和概念關(guān)系的分析,來向內(nèi)容節(jié)點分配概念定義??梢苑峙?顯式"屬性的初步定義,以后用與內(nèi)容節(jié)點相交的概念關(guān)系"暗示"的豐富的多的屬性集來補充該初步定義。候選語素關(guān)系可以組裝成整個語素分級,該語素分級將用作用于分面式分類的數(shù)據(jù)內(nèi)核??梢愿鶕?jù)各域中的關(guān)鍵詞及其語素的唯一相交來創(chuàng)建用于各域的單獨分面分級。這一數(shù)據(jù)結(jié)構(gòu)可以表達(dá)限于域邊界的語素分級。分面分解可以在域的詞匯表(它的唯一關(guān)^t詞集)中表達(dá),并且可以僅包括被因子化到域中的那些語素關(guān)系??梢暂敵鲇糜诟饔虻姆置媸椒诸愖鳛橛糜谠撚蚝头置娣旨壍母拍疃x集。因此在一個實施例中,可以根據(jù)匯集式語素分級來推斷域特有的分面分級。它可以針對更小的域提供更豐富的分面集。它可以建立在多個域的共享經(jīng)驗(可以糾正在更小的域中存在的錯誤)上,并且它可以有助于域的較快處理。在另一實施例中,系統(tǒng)可以直接地基于圖14-圖15中所示上述方法為域創(chuàng)建唯一分面分級。在這一實施例中,屬性分級組裝過程可以直接地適用于從各域提取的域特有的關(guān)鍵詞。在又一實施例中,綜合操作可以基于從其他傳統(tǒng)分類手段匯集分面式數(shù)據(jù)以及如形式概念分析中使用的嚴(yán)格屬性集來限定的概念。這些和其他補充分類方法是本領(lǐng)域#支術(shù)人員7>知的。圖16A-圖16B圖示了如在一個實施例中派生的來自組裝的語素分級2002(如上所述)的樹的片段和來自域特有的關(guān)鍵詞分級2004的樹的片段。注意到,在用于關(guān)鍵詞分級2004的樹片段中,在代表關(guān)聯(lián)關(guān)鍵詞標(biāo)簽的每個節(jié)點(例如2004b)旁邊的文本是完全的詞,因為它們將存在于域中。另外,用于關(guān)鍵詞分級2004的樹分段可以是用于語素分級2002的樹片段的如下子集,該子集被收縮成僅包括與派生關(guān)^t建詞分級的域相關(guān)的那些節(jié)點。圖17圖示了為增強的分面式分類方法準(zhǔn)備輸出數(shù)據(jù)的操作。輸出數(shù)據(jù)可以包括用于域的修正概念定義和關(guān)鍵詞分級。關(guān)鍵詞分級可以基于語素分級。該過程的輸入可以是將要被分類的內(nèi)容節(jié)點302的集合、輸入概念分級1008、語素分級402和初步扭X念定義708a。上文描述了用以生成或者以別的方式獲得這些輸入的相應(yīng)操作C、E、L和H。輸入概念關(guān)系以及第一概念定義708a內(nèi)的語素屬性的交集可以用來(2102)將第一概念定義708a修正為第二概念定義708b。具體而言,如果無法根據(jù)語義分級來推斷源數(shù)據(jù)中的概念關(guān)系,則可以擴展概念定義以提供由概念關(guān)系"暗示"的屬性。結(jié)果是修正的概念定義708b的集合??梢詷?biāo)識來自參與域的所有語素的集合的語素分級中的相關(guān)語素關(guān)系的集合(2106)??梢允褂脕碜杂虻年P(guān)鍵詞來標(biāo)記語素分級的縮減的、域特有的版本中的語素(2108)。對于各語素,可以選擇使用該語素的次數(shù)最多的簽名關(guān)鍵詞??梢苑峙溆糜诟麝P(guān)鍵詞的最普及關(guān)鍵詞標(biāo)簽。獨立關(guān)鍵詞可以限于在分面分級中出現(xiàn)一次。一旦使用關(guān)鍵詞作為簽名關(guān)鍵詞,則它可能無法用作用于其他語素的替代語素??梢詫⒄Z素分級聯(lián)合成如下語素關(guān)系集,該語素關(guān)系集僅包括參與域的語素,并且根據(jù)聯(lián)合的語素分級來推斷關(guān)鍵詞分級2112(2110)。代表分面式分類的輸出數(shù)據(jù)210a可以包括修正的概念定義708b、關(guān)鍵詞分級2112和內(nèi)容節(jié)點302。輸出數(shù)據(jù)可以傳送到域數(shù)據(jù)儲存設(shè)備706。輸入概念分級中的概念關(guān)系還可以直接地影響域數(shù)據(jù)儲存設(shè)備706中的輸出數(shù)據(jù)。具體而言,輸入概念分級可以用來對根據(jù)操作的綜合部分而推斷的關(guān)系進(jìn)行優(yōu)先級化。直接從源數(shù)據(jù)汲取的概念關(guān)系池庫可以代表"顯式"數(shù)據(jù),這不同于推斷的維度概念關(guān)系。在輸入概念分級中(直接地或者間接地)為顯式的推斷關(guān)系可以優(yōu)先于在源數(shù)據(jù)中不存在的關(guān)系。也就是說,可以認(rèn)為顯式關(guān)系比從該過程推斷的附加關(guān)系更有意義。輸出數(shù)據(jù)現(xiàn)在可以用作復(fù)雜的維度數(shù)據(jù)結(jié)構(gòu)以表現(xiàn)維度概念分類法(M)。應(yīng)用分面式分類方法在上文的圖3、圖18-圖19中首先圖示了增強的分面式分類方法的組織原理,并且在下文中進(jìn)行更具體地描述,在圖20-圖22進(jìn)行示出,通過這些組織原理可以對初等構(gòu)造進(jìn)行綜合,以創(chuàng)建復(fù)雜的維度結(jié)構(gòu)。如通過單式(未分裂)的復(fù)雜概念分級所提供的那樣,這一增強的分面式分類方法使分面式分類方案的靈活性益處與簡單性、可一見化和整體透一見的益處聯(lián)姻。將分面式分級與簡單(單式)分級形成對照闡明了這些益處。簡單分級是直觀的,并且易于可視化。它們常常同時整合許多組織基礎(chǔ)(或者分面),這提供了對所有相關(guān)屬性的較為整體的透視。跨分面邊界來耦合屬性并且可以并行導(dǎo)航屬性。通過整合屬性而不是分裂它們,這些屬性提供一種更為經(jīng)濟和魯棒的解釋性框架。本領(lǐng)域技術(shù)人員將認(rèn)識到,許多其他更簡單的和傳統(tǒng)的分類方法也可以如下文概括的那樣從本發(fā)明的各種部件和模式中受益。分面式分類和基于集合的分類構(gòu)造(如形式概念分析)的這些傳統(tǒng)過程說明了將從這里描述的系統(tǒng)中受益的兩個此類可選分類方法。維度概念綜合參照圖18,包括概念定義的語素310可以在語素分級402中相關(guān)。語素分級402可以是刪減冗余語素關(guān)系的、語素詞典206中已知的所有語素關(guān)系的全集合。如果可以使用其他語素關(guān)系的集合(即通過間接關(guān)系)在邏輯上構(gòu)造語素關(guān)系,則可以認(rèn)為這些語素關(guān)系是冗余的。可以按關(guān)鍵詞對獨立語素310a和310b進(jìn)行分組,以定義具體概念306b。注意,這些語素310a和310b因此可以與概念306b進(jìn)行關(guān)聯(lián)(經(jīng)由關(guān)鍵詞分組)并且與語素分級402中的其他語素310進(jìn)行關(guān)聯(lián)。通過這些互連,語素分級402可以用來創(chuàng)建概念關(guān)系的新的和擴展的集合。具體而言,包含通過語素關(guān)系來相關(guān)的語素310的任何兩個概念306本身可以是相關(guān)概念??梢允褂迷诟拍疃x內(nèi)語素的相伴出現(xiàn)作為用于創(chuàng)建概念關(guān)系分級的基礎(chǔ)。在概念306b的每個交線406a和406b(圖18)表示將概念306b連接到其他相關(guān)概念(未示出)的維度軸。如下維度軸的集合可以是復(fù)雜維度結(jié)構(gòu)的結(jié)構(gòu)基礎(chǔ),各維度軸代表由定義該軸的語素(或者分面屬性)集過濾的概念關(guān)系的單獨分級。構(gòu)造方法的簡化概況在圖19中繼續(xù)。維度概念分類法圖19圖示了用于基于維度軸的相交來定義維度概念分類法210的復(fù)雜維度結(jié)構(gòu)的構(gòu)造。利用分別由語素310c、310d和310e定義的概念306c、306d和306e以及由語素310c、310d和310e的集合定義的概念306f來說明四個概念306c、306d、306e和306f的集合。借助語素310c、310d和310e的交集,概念306c、306d、306e和306f可以共享概念關(guān)系。綜合操作(下文描述)可以基于概念定義中的語素310c、310d和310e來將維度軸406c、406d和406e創(chuàng)建為概念關(guān)系的不同分級。可以向域200中的所有或者一部分內(nèi)容節(jié)點302處理這一綜合維度概念關(guān)系的操作(下文描述圖22-圖23中所示的范圍有限的和動態(tài)的處理操作模式)。因此可以將內(nèi)容節(jié)點302分類到完全重新設(shè)計的復(fù)雜維度結(jié)構(gòu)中,如維度概念分類法210。如上所述,可以向單個內(nèi)容容器或者內(nèi)容節(jié)點(比如web頁面)分配多個概念。因而,單個內(nèi)容容器或者內(nèi)容節(jié)點在維度概念分類法中可以駐留于許多離散分級上。同樣,包含通過語素關(guān)系來相關(guān)的語素310的任何兩個概念306本身可以是相關(guān)概念。在一個實施例中,顯式和隱式語素關(guān)系可以與域的上下文調(diào)查組合,以推斷維度概念分類法中的復(fù)雜維度關(guān)系??梢允褂谜Z素作為分面屬性來描述概念定義。如上所述,分面屬性(語素)在詞典中是顯式的("已登記"或者"已知")還是隱式的("未登記"或者"未知,,)可以無關(guān)緊要。應(yīng)當(dāng)簡單地存在與概念定義相關(guān)聯(lián)的有效描述,以在維度概念分類法中承載其定義。有效概念定義可以提供用以描述內(nèi)容節(jié)點在維度概念分類法中的含義的原始素材。以這一方式,無論域中的對象先前是否作為訓(xùn)練集的部分來分析,都可以將它們在維度概念分類法中加以分類。如本領(lǐng)域中公知的,存在可用以向?qū)⒁诸惖膶ο蠓峙涓拍疃x的許多方法和技術(shù)。在本發(fā)明的一個實施例中,知識表示模型的結(jié)構(gòu)實體的相互影響(上文描述)可以在語素、語素關(guān)系、概念定義、概念節(jié)點和概念關(guān)系之間建立如下邏輯鏈接如果活躍內(nèi)容節(jié)點內(nèi)的概念包含與其他內(nèi)容節(jié)點(下文稱為"相關(guān)節(jié)點,,)中的概念具有相同譜系的分面屬性(下文稱為語素),則可以在活躍節(jié)點與相關(guān)節(jié)點的概念之間存在關(guān)系。換而言之,各概念可以繼承通過如它們存在于內(nèi)容節(jié)點中的語素之間的關(guān)系來推斷的所有關(guān)系。根據(jù)分面分級來直接推斷的維度概念關(guān)系在這里稱為顯式關(guān)系。在這里如下維度概念關(guān)系稱為隱式關(guān)系,該維度概念關(guān)系是根據(jù)向?qū)⒁诸惖膬?nèi)容節(jié)點分配的概念定義內(nèi)的分面屬性的交集來推斷的。綜合(構(gòu)建)規(guī)則可以通過檢查概念的概念關(guān)系中的屬性之間的關(guān)系來計算概念之間的顯式關(guān)系。如果該概念定義包含與正在分類的內(nèi)容節(jié)點(下文稱為"活躍節(jié)點")的屬性在分面分級中直接或者間接地相關(guān)(下文稱為"語系"相同)的屬性,則沿著由涉及到的屬性代表的維度軸在概念之間可以存在顯式關(guān)系。受制于有限制的約束(下文描述),可以在如下任何概念之間推斷隱式關(guān)系,這些概念共享其概念定義中的屬性子集。屬性的交集建立父-子關(guān)系??梢园凑辗置鎸傩约瘉矶x軸。在一個實施例中,可以通過分面分級中的分面(根節(jié)點)集來定義軸。這些屬性集然后可以用來將概率過濾成維度概念關(guān)系的聯(lián)合分級。備選的是,對于根據(jù)復(fù)雜維度結(jié)構(gòu)派生的動態(tài)構(gòu)造(定制)的分級,可以使用任何屬性集作為維度軸的基礎(chǔ)。如果可以針對父概念定義中的所有軸得到顯式和/或隱式關(guān)系,則存在維度概念關(guān)系。因此,維度概念關(guān)系跨過屬性定義的所有維度而在結(jié)構(gòu)上完整無缺。優(yōu)先級和方向性(如語素分級所表達(dá)的)分面分級可以用來對內(nèi)容節(jié)點進(jìn)行優(yōu)先級化。具體而言,各內(nèi)容節(jié)點可以具體化在分面分級中存在于至多一個位置的屬性。在分級中的屬性優(yōu)先級可以確定節(jié)點的優(yōu)先級??梢允紫韧ㄟ^檢查所討論的集合內(nèi)的任何已登記語素的全部優(yōu)先級,來確定概念關(guān)系內(nèi)的優(yōu)先級。最高的已登記語素可以建立用于集合的優(yōu)先級。例如,如果第一集合包括優(yōu)先級數(shù)為{3,37,303}的三個已登記語素,第二集合包括優(yōu)先級為{5,490}的兩個已登記語素,而第三集合包括優(yōu)先級為{5,296,1002}的三個已登記優(yōu)先級,則可以對集合進(jìn)行排序{3,37,303}、{5,296,1002}、{5,490}??梢曰谠谡Z素的集合中包含優(yōu)先級3的語素的最高總排行來將第一排序集合優(yōu)先級化。后兩個集合可以均具有最高語素優(yōu)先級{5}。因此,可以檢查各集合中的下一最高語素優(yōu)先級,以揭示包含優(yōu)先級為{296}的語素的集合應(yīng)當(dāng)是優(yōu)先級更高的集合。當(dāng)已登記語素沒有區(qū)分概念關(guān)系中的內(nèi)容節(jié)點時,系統(tǒng)可以使用隱式語素的數(shù)目作為優(yōu)先級化的基礎(chǔ)。可以假設(shè)語素數(shù)目最少的集合在分級中優(yōu)先級更高。當(dāng)內(nèi)容節(jié)點包含相同的顯式語素和相同數(shù)目的未登記隱式語素時,可以認(rèn)為內(nèi)容節(jié)點彼此處于同等地位。當(dāng)內(nèi)容節(jié)點處于同等地位時,可以按照系統(tǒng)發(fā)現(xiàn)這些內(nèi)容節(jié)點中各內(nèi)容節(jié)點的順序來建立優(yōu)先級。圖20提供了一個實施例的簡單圖示,該實施例用于構(gòu)造隱式關(guān)系和確定節(jié)點在所得分級中的優(yōu)先級。在本例中,在語素詞典中登記語素"商務(wù)"2201。假設(shè)通過用戶交互,利用如下概念定義來構(gòu)造內(nèi)容節(jié)點,該內(nèi)容定義包含這一語素加上在語素詞典中沒有識別的新語素"模型"2202。繼續(xù)上例,語素"商務(wù),,具有最高優(yōu)先級2203。集合"商務(wù)、模型"是"商務(wù),,的暗示子語素2204。向這一集合添加的任何附加語素如"廣告,,2205將創(chuàng)建分級中的附加層2206。任何語素,無論其在系統(tǒng)中是顯式的還是隱式的,都可以用作內(nèi)容分級的基礎(chǔ)(或者軸)。繼續(xù)上例,隱式語素"廣告"2207是基于這一語素的分級的父節(jié)點2208。集合"商務(wù)、模型、廣告"2205是這一分級中的子節(jié)點2209。包括"廣告"的任何附加集合也將是這一分級的成員。在該例中,集合"廣告、方法"2210也是"廣告"2^1的子節(jié)點。由于登記了語素"商務(wù)",所以集合"商務(wù)、模型、廣告"在廣告分級中被給予比僅包含隱式語素的集合"廣告、方法"更高的優(yōu)先級。節(jié)點進(jìn)行優(yōu)先級化的一個備選實施例涉及了"簽名"節(jié)點。這些被定義為最好地描述(或者給出含義)它們的關(guān)聯(lián)概念的內(nèi)容節(jié)點。例如,域所有者可以將與具體概念相關(guān)聯(lián)的照片作為用于該概念的簽名標(biāo)識符。因此可以區(qū)分簽名節(jié)點的優(yōu)先次序。存在用以實施簽名節(jié)點的許多方式。例如,一種方式是作為特殊一類內(nèi)容節(jié)點的標(biāo)簽??梢詫灻?jié)點分配特殊屬性,并且該屬性可以在分面分級中被給予最高優(yōu)先級?;蛘呖梢栽趦?nèi)容節(jié)點的表中使用字段以規(guī)定這一屬性??梢酝ㄟ^自動基礎(chǔ)(如按字母順序、數(shù)字和按事件順序的排列)來補充基于分面分級的優(yōu)先級化。在傳統(tǒng)分面式分類中,優(yōu)先次序區(qū)分和排列是符號表示和引證順序的問題。系統(tǒng)通常提供用于優(yōu)先次序區(qū)分和排列的動態(tài)的屬性重新排序。此外,在此不對這些操作進(jìn)行進(jìn)一步討論。軸定義和結(jié)構(gòu)完整性在系統(tǒng)的一個實施例中,用于構(gòu)建維度概念分類法的另一規(guī)則涉及維度軸的結(jié)構(gòu)完整性。作為概念定義(軸定義)的每個語素(屬性)集可以建立維度軸。根據(jù)這些語素來推斷的維度概念關(guān)系必須跨如由父節(jié)點確定的所有維度而在結(jié)構(gòu)上完整無缺。換言之,與父概念相交的所有維度也必須與節(jié)點的所有子概念相交。下例將說明考慮內(nèi)容定義為(A,B,C)的活躍內(nèi)容節(jié)點,其中A、B、C是概念定義中的三個語素,而語素E、F、G分別是A、B、C在語素分級中的子語素;{A,B,C)是指用語素A和B和C描述的概念定義;{A,*}是指用以建立作為A的隱式子語素的節(jié)點的顯式語素A和一個或者多個隱式語素{*}的組合;《AIB》是指語素{八}或者{B}?;钴S節(jié)點中的三個語素A、B、C在這一例子中可以用來在維度概念分級中建立三個維度(或者相交軸)。對于將作為這一節(jié)點的子節(jié)點的任何其他內(nèi)容節(jié)點,候選必須是相對于所有三個軸的子節(jié)點。以下符號表示是如本發(fā)明一個實施例定義的顯式關(guān)系和隱式關(guān)系的解集{(AIEIA,*IE,",(BIFIB,*IF,*),(C|G|C,*|G,*)},其中第一維度的語素為A或者E、或者A的隱式語素、或者E的隱式語素;其中第二維度的語素為B或者F、或者B的隱式語素、或者F的隱式語素;其中第三維度的語素為C或者G、或者C的隱式語素、或者G的隱式語素。可以通過約束維度軸的概念定義來進(jìn)一步限制處理范圍??梢酝ㄟ^引用來自父節(jié)點的語素子集來建立獨立軸(下文稱為"活躍軸"),由此約束可以鏈接到活躍節(jié)點的父節(jié)點(祖先)的集合。有效的是,與活躍軸相關(guān)聯(lián)的概念定義可以建立約束如下多分級的虛擬父節(jié)點,該多分級從活躍節(jié)點僅延伸到在由活躍軸的概念定義所定義的分級上駐留的那些內(nèi)容節(jié)點。下例利用概念定義(A,B,C)使用上文介紹的例子來說明這一約束。在這一例子中,派生的維度概念關(guān)系被約束至具有概念定義(A,B》的活躍軸。在這一約束之下,對活躍節(jié)點的可能父節(jié)點(祖先)的集合限于集合KA,B)1A1B}。換而言之,匹配的概念定義將僅包括A或者B的組合但是沒有C(同樣在本例中假設(shè)在語素分級中沒有A或者B的父節(jié)點)。語素中的顯式關(guān)系和隱式關(guān)系的組合因此可以建立用于在概念之間構(gòu)建分級關(guān)系的規(guī)則。如本領(lǐng)域中已知,存在用以優(yōu)化這些類型的過濾和排序功能的許多方式。它們包括數(shù)據(jù)管理工具如索引和高速緩存。這些細(xì)化在本領(lǐng)域中是公知的,并且在這里將不進(jìn)一步加以討論。綜合操作模式各種綜合操作模式對于本發(fā)明的分面式分類方法而言是可能的。可以改變綜合以適應(yīng)不同域的獨立要求和終端用戶要求。如下文所述,這些模式可以定義如下靜態(tài)綜合與動態(tài)綜合在一個實施例中,提供如下"靜態(tài)"分面式分類綜合,在該綜合中可以預(yù)先定義對維度概念分級進(jìn)行定義的軸。然后可以將所得維度概念分類法作為靜態(tài)結(jié)構(gòu)來利用。分面式分類綜合的靜態(tài)模式的優(yōu)點在于,域所有者可以按照它們的準(zhǔn)確規(guī)范來組織維度概念分類法。訪問和消費這些靜態(tài)結(jié)構(gòu)內(nèi)所含信息的終端用戶因此可以從域所有者的組織知識中受益。靜態(tài)綜合因此例如在信息的終端用戶對域內(nèi)所含信息幾乎一無所知時尤其有用。在另一實施例中,提供如下"動態(tài)"分面式分類綜合系統(tǒng),在該系統(tǒng)中可以直接地基于為信息的終端用戶而提供的綜合參數(shù),來近實時地處理維度概念分級。這一動態(tài)操作模式有助于信息結(jié)構(gòu)的遞增和完全"按需"組裝。動態(tài)處理可以提供巨大的信息經(jīng)濟和存儲益處,這消除了對預(yù)先創(chuàng)建和存儲終端用戶結(jié)構(gòu)的需要。更重要的是,動態(tài)處理可以允許終端用戶按照他們的要求來精確地定制輸出,這提供了個性化益處(下文更具體地討論綜合操作模式)。又一實施例組合了上文介紹的靜態(tài)和動態(tài)綜合模式。在這一混合的綜合模式之下,域所有者可以提供用于為維度概念分類法提供靜態(tài)"全局,,結(jié)構(gòu)的軸定義選集。在該全局結(jié)構(gòu)內(nèi),繼而可以使用動態(tài)綜合來使獨立終端用戶能夠按照他們的需要來進(jìn)一步定制結(jié)構(gòu)。這一混合模式因此組合了靜態(tài)綜合和動態(tài)綜合這二者的優(yōu)點。對概念分級和內(nèi)容節(jié)點的限制隨著域和分面分級的規(guī)模增加,可以推斷的維度概念關(guān)系的數(shù)目也迅速地增長。可以對生成的關(guān)系的數(shù)目設(shè)定限制??梢杂捎脩糨斎胂拗埔栽O(shè)置所得輸出分級中的有關(guān)概念或者關(guān)管理員可以將綜合操作配置成在系統(tǒng)將十個最緊密相關(guān)的概念組裝成分級之后停止處理??勺兂橄蠹壢缟衔脑谥R表示模型和分析操作的描述中所述,可以將包括概念定義的屬性定義成可變的抽象級。這里描述的一個實施例提供處于概念、關(guān)鍵詞和語素這些抽象級的實體。在綜合中所用概念定義的屬性的抽象級變化可以實現(xiàn)綜合操作的明顯不同的輸出。具體而言,由于屬性趨向于域內(nèi)更基本的語素實體,所以在使用這些屬性定義的復(fù)雜概念之間可能存在更多連接。定義這些語素項中的屬性因此可以提供用以組織所得綜合輸出的更大連接和更多樣方式。反之,由于屬性趨向于更抽象的復(fù)雜實體(如關(guān)鍵詞或者復(fù)雜概念),所以所得綜合結(jié)構(gòu)可以更精確,通常具有更少的連接、但是整體質(zhì)量更高。因此,改變綜合操作中的抽象級可以允許管理員、域所有者或者終端用戶根據(jù)他們的獨立要求來定制信息。域處理的范圍在一個實施例中,可以在生成維度概念分類法的完整視圖之前檢查和比較域中的所有內(nèi)容節(jié)點。換言之,系統(tǒng)可以發(fā)現(xiàn)域中的所有如下內(nèi)容節(jié)點,這些內(nèi)容節(jié)點可以在針對這些相關(guān)節(jié)點之間的直接分級關(guān)系進(jìn)行任何推斷之前是相關(guān)的。域中所有節(jié)點的完整檢查的益處在于它可以提供域內(nèi)信息的窮盡探測和發(fā)現(xiàn)。對于高精確度和取回(recall)要求,這一綜合模式可能是適合的。它對于相對更小的界定清晰的域而言也常常是優(yōu)選的。在另一實施例中,取代分析整個域,可以基于用戶的活躍焦點來分析域的局部化區(qū)域。這一局部化分析可以應(yīng)用于素材,無論其先前是否作為訓(xùn)練集的部分被加以分析。參數(shù)可以由管理員設(shè)置以平衡分析深度與處理時間(延時)。對于沒有作為訓(xùn)練集的部分來分析的素材,系統(tǒng)可以使用局部化分析的操作以在根據(jù)訓(xùn)練集素材所派生的增強型分面式分類方按之下對素材進(jìn)行分類。注意到,如下文更具體描述的那樣,對來自域的素材的局部子集進(jìn)行分類的搡作也可以用來對新的域進(jìn)行分類。換言之,可以使用來自一個域的訓(xùn)練集作為用于構(gòu)造方案的基礎(chǔ),以對來自新的域的素材進(jìn)行分類,由此支持多域分類環(huán)境。圖21更具體地圖示了各種綜合模式。在不限制本發(fā)明的范圍情況下,這些例子示范了通過各種模式來提供的綜合選項的廣大范圍。這一綜合靈活性的益處在于提供一種可以適應(yīng)為數(shù)眾多的域和用戶要求的系統(tǒng)。靜態(tài)(預(yù)索引)綜合圖21圖示了本發(fā)明在其一個實施例中的如下方法,通過該方法,用于增強型分面式分類方法的輸出數(shù)據(jù)可以產(chǎn)生用以重新組織域的維度概念分類詞210??梢陨奢敵鰯?shù)據(jù)(M)(如上文所述和在圖17中所示)。此方法的輸入可以是來自域的修正概念定義2104、關(guān)鍵詞分級2112和內(nèi)容節(jié)點302。各概念定義708b可以映射到關(guān)鍵詞分級2112中的關(guān)鍵詞2302??梢酝ㄟ^如上文所述和在圖3、圖18-圖20中所示的增強型分面式分類方法的規(guī)則來生成用于概念的新維度概念關(guān)系(820)。信息結(jié)構(gòu)的管理員可以偏好于人工調(diào)整(2304)自動生成的維度概念分類法構(gòu)造的結(jié)果。操作可以支持這些類型的人工千預(yù),但是針對全自動化操作無需用戶交互。分析(2306)可以用來評估所得維度概念分類法的參數(shù)。同樣,管理員可以將統(tǒng)計參數(shù)設(shè)置(2308)為用于維度概念分類法的縮放因子。它們也可以通過減少處理范圍將復(fù)雜性限制為復(fù)雜-自適應(yīng)系統(tǒng)中的負(fù)反饋,因此往回縮放所并入的分級的數(shù)目。如下文所述和在圖27中所示,維度概念分類法210可以用于用戶交互(N)。域子集(范圍有限的)綜合圖22圖示了從域中選擇內(nèi)容節(jié)點,并且將這些內(nèi)容節(jié)點排序成維度概念分級??梢圆捎糜蛳鄬τ诨钴S節(jié)點2402的受約束視圖。取代處理整個域的是,操作可以執(zhí)行活躍節(jié)點2402的緊接鄰近區(qū)2404中所有內(nèi)容節(jié)點(例如2406)的定向調(diào)查。遞歸概念分級組裝在一個實施例中,遞歸算法可以用于將未區(qū)分的相關(guān)內(nèi)容節(jié)點組細(xì)分成具體結(jié)構(gòu)組。"候選集"描述了與活躍概念定義相關(guān)的概念集和關(guān)聯(lián)內(nèi)容節(jié)點,而不考慮它們?nèi)绾尉_地相關(guān)??梢韵鄬τ诨钴S概念或者內(nèi)容節(jié)點將組描述為父節(jié)點和子節(jié)點(分級關(guān)系)以及兄弟節(jié)點(關(guān)聯(lián)關(guān)系)。這些組描述的結(jié)構(gòu)關(guān)系在本領(lǐng)域中是公知的。然后可以基于涉及到的下層語素關(guān)系和語素相對于活躍概念,來將這些鄰近概念和關(guān)聯(lián)內(nèi)容節(jié)點排序成分級關(guān)系。在圖22中將這一分級圖示為內(nèi)容節(jié)點候選集2404內(nèi)的內(nèi)容節(jié)點(例如2406)之間的關(guān)系子集。在分級2408中,與活躍節(jié)點2402直接相關(guān)的那些內(nèi)容節(jié)點(直接子節(jié)點)在候選集2404內(nèi)沒有其他父節(jié)點。候選集中的其余內(nèi)容節(jié)點可以在分級中定位得更深,其作為間接子節(jié)點(后代)。將一個域的分類方案應(yīng)用于第二個域圖23圖示了對不是用來開發(fā)分面式分類方案的訓(xùn)練集的部分、來自域的素材的局部子集進(jìn)行分類的操作??梢詮挠?00中選擇域素材2404a的局部子集以供處理??梢曰谟捎蛩姓呓⒌倪x擇標(biāo)準(zhǔn)(2502)來選擇素材??梢韵鄬τ谧鳛橛糜诰植炕瘏^(qū)域的基礎(chǔ)的活躍節(jié)點2504來進(jìn)行選擇。選擇過程可邊界進(jìn)行描述的搜索項列表。存在用于局部集的許多可能選擇標(biāo)準(zhǔn)。在一個實施例中,可以通過將與活躍節(jié)點相關(guān)聯(lián)的概念定義傳遞到全文本信息檢索(搜索)部件,以返回相關(guān)素材集來選擇素材。這樣的全文本信息檢索工具在本領(lǐng)域中是公知的。在一個替代實施例中,可以通過檢查關(guān)鍵詞分級根據(jù)活躍節(jié)點中的概念定義來派生擴展式搜索查詢,以派生相關(guān)關(guān)鍵詞的集合。這些相關(guān)關(guān)鍵詞又可以用來擴展搜索查詢以包括與活躍節(jié)點的概念定義相關(guān)的項。從選擇過程派生的域的局部子集2404a可以包括將要分類的候選內(nèi)容節(jié)點。對于局部子集中的各候選內(nèi)容節(jié)點,可以提取概念簽名(2508)。概念簽名可以由域所有者標(biāo)識并且可以用來映射(2302)為域特有的關(guān)鍵詞分級2112中的關(guān)鍵詞,以針對各候選內(nèi)容節(jié)點提供概念定義。同樣,構(gòu)建部件并不要求根據(jù)概念簽名來派生的所有關(guān)鍵詞都為系統(tǒng)所知(在關(guān)鍵詞分級中登記)。可以使用上述隱式和顯式關(guān)系的構(gòu)建規(guī)則針對候選內(nèi)容節(jié)點來計算概念分級(820)。最終結(jié)果可以是局部概念分類法210c,其中在根據(jù)訓(xùn)練集針對該域而派生的構(gòu)造方案之下,組織來自域的局部子集的內(nèi)容節(jié)點。局部概念分類法然后可以用作用戶交互的環(huán)境以進(jìn)一步對分類進(jìn)行細(xì)化。動態(tài)(實時;綜合、、、i、?、-:、、,'一,:、—。。的動態(tài)綜合模式。圖24-圖25和以下描述提供域在這一動態(tài)綜合模式內(nèi)的操作有關(guān)的更具體細(xì)節(jié)。在圖24中,在廣義的概況中圖示了動態(tài)綜合模式的一個實施例。動態(tài)綜合過程可以遵循請求-響應(yīng)的操作模型。動態(tài)綜合操作由用戶請求啟動(2402)。用戶他們對主題的看法以及受限制綜合參數(shù)集約束的他們的興趣范圍)。在圖24中,以簡化形式將這些用戶參數(shù)示意地表示為內(nèi)部包括更多初等屬性(四個點)2404的活躍概念定義(方框)。使用來自用戶的這一動態(tài)輸入,系統(tǒng)然后可以返回關(guān)聯(lián)的概念分級(輸出概念分級)2406。這一輸出概念分級然后可以是用戶進(jìn)一步探測的焦點,或者它可以充當(dāng)通向又一輪綜合操作的橋梁。為了處理這一請求,與活躍概念定義關(guān)聯(lián)的屬性集可以是用于來自指定域2408內(nèi)的如下概念集進(jìn)行定位的基礎(chǔ),該概念集將用作用于所綜合的概念分級的候選集2410。下文描述用以將這些概念與活躍概念定義相關(guān)的"派生"方法2412。派生可以對派生動態(tài)地進(jìn)行排列,并且用作用以構(gòu)造相關(guān)概念分級的參考。接著,提供域動態(tài)綜合模式的主要步驟和部件有關(guān)的更多細(xì)節(jié)。用戶啟動的綜合請求動態(tài)綜合操作由用戶請求啟動(3502)。為了啟動動態(tài)綜合過程,用戶可以提供域、活躍概念定義和軸定義。用戶也可以經(jīng)由下文討論的其他輸入綜合參數(shù)來約束的概念分級的規(guī)模和形狀。如下文在用戶界面系統(tǒng)實施的討論中所述,存在用以獲取這一類用戶輸入的許多技術(shù)手段。動態(tài)綜合輸入和綜合參數(shù)因此,對動態(tài)綜合模式的輸入可以包括用戶特有的綜合參數(shù)和域特有的分面式數(shù)據(jù)集。這些輸入可以將綜合操作約束于狹窄磨練的范圍或者對象區(qū)域、約束于用戶的精確要求。上文提供了與域特有的分面式數(shù)據(jù)集有關(guān)的細(xì)節(jié)。運行時間綜合參數(shù)如上文討論的那樣,動態(tài)綜合的一個實施例可以提供活躍域、活躍概念定義和活躍軸定義的用戶輸入。此外,用戶可以通過提供對分離度進(jìn)行規(guī)定的參數(shù)和按照概念和內(nèi)容節(jié)點對綜合操作的輸出進(jìn)行限制的參數(shù)來進(jìn)一步描述他們的要求。分離度參數(shù)指定在輸出概念分級中從活躍概念定義到相關(guān)概念定義的直接分級步驟的最大數(shù)目。例如,基于增強的分面式分類方法的構(gòu)建規(guī)則,并且在給定有代表性的活躍屬性集(A,B,q的情況下,以下屬性集將是被移除的一個分離度{A,B,C,?}:具有一個附加元素的所有超集,其中"?"代表一個其他屬性;{A,B},{A,C},{B,C}:基于隱式屬性關(guān)系的所有子集;{D,B,C},在給定A—D的情況下是顯式屬性關(guān)系。延時延時是終端用戶可以操控的另一綜合參數(shù)。在一個實施中,"上限,,響應(yīng)時間可以適用于系統(tǒng),使得綜合操作限于在用戶的綜合請求與用以滿足該請求的構(gòu)建引擎響應(yīng)和輸出之間的最大時間。這一延時控制的另一實施例將允許終端用戶增加或者減少請求-響應(yīng)的時間以調(diào)節(jié)性能,以匹配其獨立信息訪問和發(fā)現(xiàn)要求。用于動態(tài)綜合的候選集在圖25中圖示了用于動態(tài)綜合的候選集組裝的一個實施例。在動態(tài)綜合中,可以針對屬性分級來檢查活躍概念的屬性集,以便發(fā)現(xiàn)顯式的相關(guān)祖先和后代屬性集。上文在綜合(構(gòu)建)規(guī)則的描述之下提供了關(guān)于這些檢查的更多信息。同樣,無需在這一實時動態(tài)綜合模式之下完全地檢查整個域。系統(tǒng)僅檢查由候選集定義的域的子集。發(fā)現(xiàn)候選集如下可以考慮是子集或者具有如下元素或者兼而有之的屬性集,這些元素是活躍屬性集中的元素的顯式祖先(這些代表可能的祖先概念)。在這些相關(guān)屬性集2502a、2502b和2502c中的每個屬性集內(nèi),每個屬性可以具有它子集的匹配概念定義集。用于給定的活躍概念定義屬性集的這些概念集2504a、2504b和2504c的交集可以包含該屬性集的匹配概念(將匹配概念圖示為實心點;將非匹配概念圖示為空心點)。單獨使用如下相關(guān)屬性集來進(jìn)行類似過程,這些相關(guān)屬性集可以是超集或者具有如下元素或者兼而有之,這些元素是活躍屬性集中的元素的顯式后代(代表候選后代概念)。這里同樣,用于相關(guān)屬性集的概念集的交集可以包含該屬性的匹配概念。來自所有相關(guān)屬性集的交集的并集可以是候選集。可以將相關(guān)屬性集約束于指定的軸定義。它們的數(shù)目也可以受制于指定的最大限制和分離距離程度。用于概念分級組裝的派生在實時的動態(tài)綜合模式之下,延時可能是一個主要限制因素。具體而言,幾乎沒有時間來以窮盡方式處理甚至相對較小的候選集。如上文討論的那樣,使用概念分級綜合遞歸方法的靜態(tài)綜合手段常常由于它可能對更大的域引入的延時而在這一動態(tài)環(huán)境中錯用。這樣,動態(tài)綜合的一個實施例使用派生方法以動態(tài)地實時組裝概念分級。派生是對候選概念如何與活躍概念相關(guān)進(jìn)行描述的操作集。除了上文介紹的性能和減少延時的益處之外,派生還引入概念綜合的新穎益處、也就是將新概念定義推斷為下文討論的"虛擬概益處,即使這些新概念還沒有與內(nèi)容節(jié)點關(guān)聯(lián)。這些派生也提供強大的排列和過濾手段作為用戶可配置的群集機制??梢詮呐c活躍概念的屬性集相關(guān)的屬性集中發(fā)現(xiàn)候選集??梢詮姆置媸綌?shù)據(jù)集中的屬性分級中發(fā)現(xiàn)顯式相關(guān)的元素。隱式相關(guān)的屬性集可以由集合相交(也就是這些屬性集的子集和超集)暗示。而在域中,用來發(fā)現(xiàn)隱式后代屬性的附加屬性可以為系統(tǒng)所知或者可以不為系統(tǒng)所知?;钴S屬性集可以與候選集中的概念所關(guān)聯(lián)的各屬性集配對。對于各對,可以派生將活躍屬性集變換成它的配對集的集合操作序列。在試圖發(fā)現(xiàn)相關(guān)屬性集的過程中,可以對屬性集執(zhí)行四個派生操作。操作類型可以簡寫為如表1中所示。表1-派生操作類型為了派生隱式關(guān)系為了派生顯式關(guān)系對祖先對后代d:刪除屬性a:添加屬性p:用父屬性取代屬性c:用子屬性取代屬性注意,所有屬性關(guān)系的方向性必須與潛在概念關(guān)系對一致。屬性集對可以在它們元素之間具有祖先關(guān)系或者后代關(guān)系,但是并不兼有這二者。綜合過程通過僅應(yīng)用祖先操作(p,d)或者后代操作(c,a)但是并不兼用這二者,以建立概念之間的關(guān)系來保留這一方向性。這防止概念利用對應(yīng)于無關(guān)概念的那些屬性來替代讓其所有屬性。例如,在給定屬性為{A,B,C》的活躍概念以及屬性為{D,B,G,F}的候選概念的情況下,存在貫穿活躍概念與其三個屬性對應(yīng)的定義的三個軸。為了確定在概念之間是否存在關(guān)系,可以首先使用顯式關(guān)系,例如從A到D的顯式關(guān)系和從C到G的另一顯式關(guān)系。(這些均為c操作用子屬性取代屬性)。最后,使用添加后代屬性(即F)的隱式a操作獲得與候選后代的屬性集匹配活躍概念的屬性集。因此可以認(rèn)為該候選是活躍概念的后代。為了進(jìn)行說明,當(dāng)將活躍屬性集和候選屬性集配對時,存在三個可能的屬性組僅與候選集相關(guān)聯(lián)的屬性組("僅有候選"屬性);僅與活躍集相關(guān)聯(lián)的屬性組("僅有活躍,,屬性)。如果將活躍集轉(zhuǎn)換成候選集需要刪除"僅有活躍,,屬性,則候選集是活躍集的祖先。如果活躍集與候選集相同,則候選集是活躍集的兄弟。如果將活躍集轉(zhuǎn)換成候選集需要添加"僅有候選,,屬性,則候選集是活躍集的后代。通過刪除"僅有活躍"屬性并且添加"僅有候選,,屬性來將活躍集轉(zhuǎn)換成候選集是無效的,無論兩個原有集合是否已經(jīng)具有共同屬性。認(rèn)為這樣的一對集合無關(guān)。對此僅有例外是,當(dāng)"僅有,,集合中的屬性在屬性分級中相關(guān)時。在這樣的情況下,可以執(zhí)行兩個操作之一用活躍集屬性的父屬性取代該活躍集(其中候選集為活躍集的祖先);用活躍集屬性的子屬性取代該活躍集(其中候選集為活躍集的后代)。所得屬性然后是"兼有"集合的成員。在給定級,呈現(xiàn)兄弟的順序可能至關(guān)重要。對于用戶而言可能更重要的那些概念應(yīng)當(dāng)具有更高優(yōu)先級。候選集中的各概念可以具有將它連接到活躍概念的唯一派生系列。通過綜合對派生進(jìn)行排列和處置的順序影響結(jié)果分級中的概念排序。根據(jù)表2來確定分級中的候選概念的優(yōu)先級。表2-派生在確定結(jié)果分級時的優(yōu)先級<table>tableseeoriginaldocumentpage73</column></row><table>響應(yīng)于在用戶的請求中指定的要求,應(yīng)用可以返回根據(jù)與域內(nèi)可以將派生構(gòu)建成分級結(jié)果集。該分級中的各節(jié)點代表如下概念,該概念具有作為其概念定義的屬性集。分級中的各邊代表單個派生操作。虛擬概念在一些情況下,在概念分級節(jié)點的屬性集沒有匹配概念。可以使用虛擬概念作為用以表明這一點的占位符。例如,在給定屬性集(A,B,q的情況下,如果存在顯式關(guān)系A(chǔ)—D,顯式關(guān)系D—F,沒有具有(D,B,C》屬性集的概念,則{F,B,q將在具有來自{A,B,C》的一個分離度的候選集中。如果(D,B,Q屬性集沒有對應(yīng)概念,則在分級中的這一節(jié)點處是虛擬概念。從活躍域內(nèi),動態(tài)綜合過程可以隔離和返回與活躍概念相關(guān)的概念分級。相關(guān)概念可以沿著指定軸并且按照規(guī)定的那樣,從活躍概念在祖先(更廣義)和后代(更專用)的方向上產(chǎn)生分支。注意,出于多個目的,可以用多種方式來表示對維度概念分類法210進(jìn)行派生的數(shù)據(jù)結(jié)構(gòu)。在以下描述中圖示了終端用戶交互的目的。然而,這些結(jié)構(gòu)也可以在其他數(shù)據(jù)操控技術(shù)的服務(wù)中使用,例如用作對另一信息檢索或者數(shù)據(jù)挖掘工具(未示出)的輸入。復(fù)雜-自適應(yīng)反饋機制圖27圖示了用于在復(fù)雜-自適應(yīng)系統(tǒng)中處理用戶交互的方法。該方法在上述維度概念分類法過程N上構(gòu)建。用戶交互可以向系統(tǒng)建立一系列反饋??梢酝ㄟ^由終端用戶啟動的反饋來實現(xiàn)向復(fù)雜維度結(jié)構(gòu)的自適應(yīng)細(xì)化過程。圖37圖示了如下計算機系統(tǒng)4000的一種可能實施,該計算機系統(tǒng)4000允許以一個或者多個維度概念分類法4010的形式來操控分面式分類信息的各方面。系統(tǒng)4000可以包括計算機可讀介質(zhì)4020,如盤驅(qū)動或者其他形式的計算機存儲器,該計算機可讀介質(zhì)4020包含用于執(zhí)行該實施的計算機程序、軟件或者固件4080以及維度概念分類法的各方面,如例如概念定義4090、分級數(shù)據(jù)4100、內(nèi)容節(jié)點4110、與內(nèi)容節(jié)點對應(yīng)的定義4120或者維度概念分類法4010的每個方面的分類4130或者分類4130中的一個。系統(tǒng)4000也可以包括處理器4030、用戶接口4040(如鍵盤或者鼠標(biāo)以及顯示器4050)。在這一實施中,計算機處理器4030可以訪問計算機可讀介質(zhì)4020并且取回根據(jù)源數(shù)據(jù)生成的維度概念分類法4010的至少一部分,而且在顯示器4050上呈現(xiàn)分類法4010的該部分。處理器4030也可以從外界實體(用戶或者沖幾器)從如下界面4040(可選為用戶界面)輸入,該界面反映維度概念分類法4010的各方面的用戶操控。處理器4030可以將在第一維度概念分類法4010中發(fā)現(xiàn)的多個可能關(guān)系中的任一可能關(guān)系的所接收的外界實體操控并入到第二維度概念分類法中。例如,外界實體操控的形式可以是對第一維度概念分類法4010進(jìn)行更改或者添加數(shù)據(jù)、編輯概念定義、分級數(shù)據(jù)、改變與概念相關(guān)聯(lián)的內(nèi)容節(jié)點相對于與概念相關(guān)聯(lián)的其他內(nèi)容節(jié)點的位置、更改對內(nèi)容節(jié)點的主題內(nèi)容進(jìn)行描述的定義或者對分面式分類進(jìn)行的其他改變。第二維度概念分類法可以完全取代第一維度概念分類法4010、與第一維度概念分類法4010完全并行或者分開存在、作為第一維度分類法4010的特例表而存在等。另外,對第二維度概念分類法的訪問可以限于諸如域所有者和管理員、用戶、專用遠(yuǎn)程計算機設(shè)備等某些類的外界實體。顯示器4050可以呈現(xiàn)維度概念分類法4010的各方面,其形式是可以通過響應(yīng)于界面4040的、由處理器控制的顯示窗口或者編輯器4070。編輯器4070也可以采用web頁面的形式,并且可以呈現(xiàn)根據(jù)維度概念分類法4010或者其變型而派生的內(nèi)容節(jié)點和分面式分類。由編輯器示出的內(nèi)容節(jié)點和分面式分類可以對應(yīng)于由外界實體選擇的活躍節(jié)點,并且例如可以采用樹片段的形式。編輯器4070也可以呈現(xiàn)如下編輯功能,外界實體可以利用該功能來操控維度概念分類法4010的各方面或者引入新元素、關(guān)系和內(nèi)容。編輯功能還可以包括回顧界面,該回顧界面允許外界實體更改與節(jié)點內(nèi)容相關(guān)聯(lián)的一個或者多個語素組、以及節(jié)點在維度概念分類法中的位置,以使它們與節(jié)點的內(nèi)容一致。因此,可以將復(fù)雜-自適應(yīng)過程的方法總結(jié)如下提供維度概念分類法作為用于用戶交互212a的環(huán)境。一旦已經(jīng)將維度概念分類法210呈現(xiàn)給用戶,則它可以變成用于修正現(xiàn)有數(shù)據(jù)的環(huán)境以及用于新數(shù)據(jù)(維度概念分類法信息)的源。輸入數(shù)據(jù)804a包括用戶對現(xiàn)有數(shù)據(jù)的編輯和新數(shù)據(jù)的輸入。它還提供用于將分類進(jìn)行演變并使其適應(yīng)于動態(tài)域。用戶交互可以包括對系統(tǒng)的反饋??梢曰诩惺较到y(tǒng)中存儲的語素元素使用符號表示系統(tǒng),來唯一地標(biāo)識維度概念分類法信,包-中數(shù)據(jù)元素的唯一標(biāo)識符。因此,可以以如下方式標(biāo)識由系統(tǒng)產(chǎn)生的維度概念分類法中的各數(shù)據(jù)元素,該方式使得該數(shù)據(jù)元素可以合并回到集中式(共享)語素詞典中。因此,當(dāng)用戶操控這些元素時,可以跟蹤對相關(guān)語素元素的臨時效果。這些改變可以反映系統(tǒng)中的新顯式數(shù)據(jù),以對由系統(tǒng)自動生成的任何推斷數(shù)據(jù)進(jìn)行細(xì)化。換而言之,可以通過終端用戶的顯式交互來加強或者拒絕由系統(tǒng)原先推斷的數(shù)據(jù)。用戶交互可以包括新數(shù)據(jù)源和對已知數(shù)據(jù)源的修正??梢詫σ阎氐牟倏剞D(zhuǎn)換回到其語素祖先。系統(tǒng)沒有識別的任何數(shù)據(jù)元素可以代表新數(shù)據(jù)。然而,由于在由系統(tǒng)產(chǎn)生的現(xiàn)有維度概念分類法的上下文中進(jìn)行改變,所以此新數(shù)據(jù)可以放置于已知數(shù)據(jù)的上下文中。因此,可以在已知數(shù)據(jù)的上下文中提供由用戶添加的任何新數(shù)據(jù)元素。在已知與未知之間的關(guān)系可以對可以根據(jù)用戶的交互來行很大程度的擴展。系統(tǒng)中的"快捷"反饋212c可以提供用于終端用戶的實時交互環(huán)境。由用戶啟動的分類法和容器編輯2902可以在系統(tǒng)中排隊等候,并且在系統(tǒng)資源變得可用時正式加以處理。然而,用戶可能需要(或者偏好)他們對維度概念分類法的改變的實時反饋。為了通過系統(tǒng)的正式反饋來處理變化而需要的時間可能延遲向用戶的這一實時反饋。結(jié)果,系統(tǒng)的一個實施例提供快捷反饋。該快捷反饋可以開始于針對當(dāng)時存在的域數(shù)據(jù)儲存設(shè)備706來處理用戶編輯。由于用戶的改變可以包括在域數(shù)據(jù)儲存器中當(dāng)前不存在的維度概念分類法信息,所以系統(tǒng)必須使用與這些改變的效果逼近的過程。可以將用于創(chuàng)建隱含關(guān)系212b的規(guī)則(上文描述)應(yīng)用于新數(shù)據(jù)作為用于完全處理的短期替代規(guī)則。這一方式允許用戶立即插入新數(shù)據(jù)并且與該新數(shù)據(jù)交互。與通過系統(tǒng)的正式過程來計算的維度概念關(guān)系不同,這一逼近過程可以使用在已知語素集中存在的系統(tǒng)未知的語素,以限定和調(diào)整集合中已知語素的維度概念關(guān)系。將這些調(diào)整的關(guān)系描述為上文更具體描述的"隱式關(guān)系"216。對于新數(shù)據(jù)元素,可以基于隱式關(guān)系(上文描述)來分配短期概念定義,從而有助于實時交互處理。在完成對域的下一完全處理循環(huán)時,可以用由系統(tǒng)修正的完整概念定義取代短期的暗示概念定義。本領(lǐng)域技術(shù)人員將認(rèn)識到,可以存在許多算法用來逼近未知語素對系統(tǒng)中已知語素的關(guān)系的影響。提供用戶交互維度概念分類法提供用戶交互的環(huán)境。在本發(fā)明的一個實施例中,可以提供兩個主要用戶界面。導(dǎo)航"查看器"界面可以提供瀏覽分面式分類。這一界面是稱為"分面式導(dǎo)航"的類。其他界面可以稱為"概括器",該概括器可以允許終端用戶改變關(guān)系結(jié)構(gòu)、概念定義和內(nèi)容節(jié)點分配。分面式導(dǎo)航和概括器界面的一般特征在本領(lǐng)域中公知的。本領(lǐng)域技術(shù)人員將清楚下文描述的新穎方面,特別是所涉及的復(fù)雜-自適應(yīng)系統(tǒng)212。查看概念分類法可以通過表示層來表達(dá)維度概念分類法。在一個實施例中,表示層是網(wǎng)站。網(wǎng)站可以包括表現(xiàn)維度概念分類法視圖集的web頁面。視圖是活躍節(jié)點范圍內(nèi)的維度概念分類法的部分(例如由一個或者多個軸過濾的多分級的子集)。在本文中的活躍節(jié)點是維度概念分類法內(nèi)當(dāng)前作為終端用戶或者域所有者焦點的節(jié)點。在一個實施例中,"樹片段"用來代表這些關(guān)系。用戶可以向系統(tǒng)提供文本查詢,以直接地移動到它們的搜索和信息檢索的通用區(qū)域。正如本領(lǐng)域中公知的,可以通過與各概念相交的分面和屬性對視圖進(jìn)行過濾和排列。可以按照各概念對內(nèi)容節(jié)點進(jìn)行分類。也就是說,對于任何給定的活躍概念,可以呈現(xiàn)與由用戶過濾的該概念的屬性相匹配的所有內(nèi)容節(jié)點??梢試@各節(jié)點來改變各視圖的"分辨率"。這是指所顯示關(guān)系的廣度和總覽的窮盡度。也可以在已分析域部分的尺寸和選擇背景下考慮視圖的分辨率問題。同樣,在分析深度與處理所需時間量(延時)之間存在權(quán)衡。表示層可以操作用以基于活躍節(jié)點的位置、視圖的分辨率和由管理員配置的參數(shù),來選擇將要分析的域的一部分。在一個實施例中,查看維度概念分類法、操作動態(tài)綜合模式(如上文討論的那樣)這些交互可以生成用于本發(fā)明的復(fù)雜-自適應(yīng)系統(tǒng)的反饋。在這些條件之下,從終端用戶的角度來看,通過查看交互而生成的隱式反饋實質(zhì)上將是透明的。換而言之,終端用戶將僅通過查看維度概念分類法這些交互來為系統(tǒng)創(chuàng)建有價值的反饋。這一透明的由用戶生成的反饋存在許多益處。終端用戶將無需花費對維度概念分類法進(jìn)行直接編輯(如下文具體討論的那樣)所需要的精力。另外,由于在這一動態(tài)綜合模式之下,只有由用戶請求的維度概念分級包括作為用于后續(xù)分析操作的反饋而返回的維度概念分類法。將反饋集約束至只有由終端用戶實際上請求的信,^的這一更窄范圍,這具有改進(jìn)由系統(tǒng)生成的反饋數(shù)據(jù)的質(zhì)量的效果。編輯概念分類法表示層將維度結(jié)構(gòu)精精煉成人類交互所必需的簡化視圖(比如以下web頁面,其中包括指向維度概念分類法中有關(guān)頁面的鏈接)。這樣,表示層也可以倍增作為用于如下信息結(jié)構(gòu)的編輯環(huán)境,它是根據(jù)這些信息結(jié)構(gòu)而派生的。在一個實施例中,用戶能夠從表示層內(nèi)切換至'j編輯模式以立即編輯結(jié)構(gòu)。概括器為用戶提供用以操控分級數(shù)據(jù)的手段。概括器也允許用戶操控與結(jié)構(gòu)中的每個概念相關(guān)聯(lián)的內(nèi)容節(jié)點。用戶交互可以更改向維度概念分類法中的節(jié)點分配的上下文和/或概念。上下文是指節(jié)點相對于結(jié)構(gòu)中其他節(jié)點而言的位置(也就是建立結(jié)構(gòu)的維度概念關(guān)系)。概念關(guān)系描述了表達(dá)為語素匯集的節(jié)點的內(nèi)容或者主題。在一個實施例中,可以向用戶呈現(xiàn)回顧過程,以^便用戶能夠確認(rèn)這樣的用戶編輯的參數(shù)。可以向用戶展示以下維度概念分類法信息用于這一回顧l)節(jié)點的內(nèi)容;2)與內(nèi)容相關(guān)聯(lián)的語素組(表達(dá)為關(guān)鍵詞);以及3)節(jié)點在分類法結(jié)構(gòu)中的位置。用戶可以更改后兩個(語素和相對位置)的參數(shù)以使信息與前一個(在該節(jié)點的內(nèi)容)一致。因此,在本發(fā)明的一個實施例中的交互可以總結(jié)為兩個廣義類型的某一組合a)容器編輯;以及b)分類法編輯。容器編輯是對內(nèi)容容器(比如ULR地址)改變對在維度概念分類法內(nèi)分類的內(nèi)容節(jié)點的分配。容器編輯也改變對維度概念分類法內(nèi)的內(nèi)容節(jié)點的描述。分類法編輯是對維度概念分類法中節(jié)點位置的上下文改變。這些改變包括將新節(jié)點添加到結(jié)構(gòu)中和對現(xiàn)有節(jié)點重新定位。這一維度概念分類法信息可以作為對與受用戶交互影響的概念相關(guān)聯(lián)的語素關(guān)系的改變而反饋到系統(tǒng)中。利用分類法編輯,可以創(chuàng)建在分類法中的概念之間的新關(guān)系。可以通過用戶交互來構(gòu)造這些概念關(guān)系。由于這些概念是基于語素的,所以新概念關(guān)系可以與新語素關(guān)系集關(guān)聯(lián)。這一維度概念分類法信息可以反饋到系統(tǒng)中以重新計算這些暗示的語素關(guān)系。也可以在更初等的抽象級(如關(guān)鍵詞和語素)提供用戶交互。圖26圖示了容器編輯過程的一個實施例。容器編輯改變對描述各內(nèi)容節(jié)點的概念定義和下層語素。利用這些改變,用戶更改內(nèi)容節(jié)點的下層概念描述。在這樣做時,他們可以更改被映射到這些內(nèi)容節(jié)點處的概念定義的語素。用戶交互可以構(gòu)造表達(dá)為關(guān)鍵詞匯集的向內(nèi)容節(jié)點分配的概念定義。在這一構(gòu)造中,用戶可以與系統(tǒng)的語素詞典和域數(shù)據(jù)儲存設(shè)備交互。這里創(chuàng)建的任何新關(guān)鍵詞可以發(fā)送到如上文所述的系統(tǒng)的語素提取過程。在這一例子中,文檔2801是活躍容器。在用戶界面中,描述內(nèi)容的關(guān)鍵詞2802的集合可以連同文檔一起呈現(xiàn)給用戶(為簡化例子,這里沒有示出這一節(jié)點在維度概念分類法中的相對位置)。在該例中,當(dāng)用戶回顧內(nèi)容時,用戶可以確定與頁面相關(guān)聯(lián)的關(guān)鍵詞不是最優(yōu)??梢杂捎脩暨x擇新關(guān)鍵詞以取代載有頁面的集合(2803)。用戶將關(guān)鍵詞列表2804更新為與文檔相關(guān)聯(lián)的新概念定義。這些改變被傳送至域數(shù)據(jù)存儲設(shè)備706??梢詫?shù)據(jù)存儲設(shè)備進(jìn)行搜索以便標(biāo)識在系統(tǒng)中登記的所有關(guān)鍵字。在這一例子中,列表包括除了"狗"之外的由用戶標(biāo)識的所有關(guān)鍵詞。結(jié)果,"狗"將作為如下隱式關(guān)鍵詞來處理,該隱式關(guān)鍵詞修改在系統(tǒng)2806中登記的顯式關(guān)鍵詞。當(dāng)通過集中式變換引擎來回顧域時,可以完全地分析隱式關(guān)鍵詞。它然后可以由顯式關(guān)鍵詞(作為現(xiàn)有關(guān)鍵詞或者新關(guān)鍵詞)取代并且與一個或者多個語素相關(guān)聯(lián)。個性化圖28圖示了提供個性化特征的本發(fā)明的一個可選實施例,其中個性化的一個實施例提供用以將共同概念分類法210e連同用于各單獨用戶的個性化概念分類法210f—起進(jìn)行個性化的手段。在終端用戶與系統(tǒng)第一次交互時,各終端用戶可以參與共同概念分類法210e。后繼交互可以參與分類法210f的用戶的個性化看法。響應(yīng)于代表各終端用戶的偏好的用戶交互212a,通過核對數(shù)據(jù)結(jié)構(gòu)的唯一表示將數(shù)據(jù)結(jié)構(gòu)"個性化"??梢詫⒕庉嫷慕Y(jié)果存儲為來自用戶交互的個性化數(shù)據(jù)(3004)。在一個實施例中,將這些編輯存儲為共同概念分類法210e的"特例"。當(dāng)處理個人概念分類法210f時,系統(tǒng)可以替換它在用戶的特例表中發(fā)現(xiàn)的任何改變。所示元素可以標(biāo)識系統(tǒng)的復(fù)雜-自適應(yīng)過程中的協(xié)作者。它提供一種用以將唯一標(biāo)識符與每個用戶相關(guān)聯(lián)并且存儲他們的交互的手段。在另一實施例中,系統(tǒng)可以將唯一標(biāo)識符分配給通過表示層來與維度概念分類法210e交互的每個用戶。這些標(biāo)識符可以視為語素。每個用戶分配有全球唯一標(biāo)識符(GUID)、優(yōu)選為可以跨過所有計算機和網(wǎng)絡(luò)來使用的128位整數(shù)U6字節(jié))。用戶GUID作為系統(tǒng)中的語素而存在。與系統(tǒng)中的任何其他元素相似,用戶標(biāo)識符可以在語素分級中加以登記(顯式語素)或者是系統(tǒng)未知的(顯式語素)。按照本領(lǐng)域公知的術(shù)語,兩類標(biāo)識符之間的區(qū)別類似于登記的拜訪者和匿名的拜訪者之間的區(qū)別。可以用來生成標(biāo)識符并且將標(biāo)識符("跟蹤符")與用戶相關(guān)聯(lián)的各種方式在本領(lǐng)域中也是公知的并且將不在這里加以討論。當(dāng)用戶與系統(tǒng)交互(例如通過編輯內(nèi)容容器)時,系統(tǒng)可以將該用戶的標(biāo)識符添加到描述概念定義的語素集。系統(tǒng)還可以添加與系統(tǒng)所支持的各種交互性相關(guān)聯(lián)的一個或者多個語素。例如,用戶"鮑勃"可能希望編輯具有內(nèi)容定義"記錄、工作室"的容器以包括地理參考。系統(tǒng)因此可以創(chuàng)建鮑勃特有的用于該容器的以下概念定義{鮑勃,華盛頓,(記錄,工作室)}。利用此維度概念分類法信息,通過在上述增強的分面式分類方法中應(yīng)用相同的顯式和隱式關(guān)系則,系統(tǒng)可以以用戶鮑勃所特有的方式呈現(xiàn)容器。容器可以出現(xiàn)在用于鮑勃的個人Web頁面上。在他的個人概念分類法中,頁面將與華盛頓的資源相關(guān)。維度概念分類法信息還將為其他用戶全球可用,并且作為負(fù)反饋機制受制于由管理員建立的統(tǒng)計分析和障礙率。例如,如果足夠的用戶標(biāo)識了具有記錄工作室的華盛頓現(xiàn)場,則它將最終地作為有效關(guān)系呈現(xiàn)給所有用戶。對與內(nèi)容容器相關(guān)聯(lián)的概念定義的這一類修改實質(zhì)上將新的維度層添加到代表各層用戶交互性的維度概念分類法信息。它提供一種用于使用適用于其他信息和內(nèi)容形式的現(xiàn)有構(gòu)造過程來進(jìn)行個性化的多功能機制。正如本領(lǐng)域中公知的,存在可用于添加個性化和定制表示層的許多技術(shù)和架構(gòu)。這里討論的方法利用系統(tǒng)的核心結(jié)構(gòu)邏輯以組織協(xié)作者。它實質(zhì)上將用戶交互僅視為另一類信元,這說明了系統(tǒng)的靈活性和可擴展性。然而,它在用于向系統(tǒng)添加定制和個性化的各種方法方面沒有限制本發(fā)明的范圍?;跈C器的復(fù)雜—自適應(yīng)系統(tǒng)圖29圖示了提供用于提供復(fù)雜-自適應(yīng)系統(tǒng)的基于機器的手段的一個可選實施例,其中包括維度概念分類法210的維度概念關(guān)系作為系統(tǒng)輸入數(shù)據(jù)804b直接返回到變換引擎過程(3102)。注意,就此而言,本發(fā)明提供了如在本公開內(nèi)容中描述的終端用戶用以創(chuàng)建和管理數(shù)據(jù)結(jié)構(gòu)的能力。在本發(fā)明的某些方面中,終端用戶提供如下反饋,該反饋進(jìn)一步通知如這里說明的數(shù)據(jù)結(jié)構(gòu)的創(chuàng)建和管理。這一反饋不僅可以由終端用戶提供,而且還可以,例如,由例如從終端用戶匯集反饋的計算機這樣的機器、或者甚至是比如完全無人類介入的計算機這樣的機器提供。在本文中,終端用戶或者機器的角色在本公開內(nèi)容中稱為"反饋代理"。也應(yīng)當(dāng)注意到,出于說明的目的,在本公開內(nèi)容中提供的許多例子涉及終端用戶,但是應(yīng)當(dāng)理解,在這些情況中的許多情況下(即使不是在所有情況下),比如計算機這樣的機器可以取代終端用戶的角色。這一子標(biāo)題說明了這樣的實施。因而,本公開內(nèi)容應(yīng)當(dāng)這樣來解讀在許多情況下(即使不是在所有情況下),提及的"終端用戶,,可以解讀為指代"反饋代理"。注意,在從源數(shù)據(jù)結(jié)構(gòu)派生的原有概念關(guān)系與從系統(tǒng)構(gòu)建引擎的過程中表現(xiàn)出來的維度概念關(guān)系之間有重要區(qū)別。前者在源數(shù)據(jù)結(jié)構(gòu)中是顯式的;后者是根據(jù)針對語素詞典內(nèi)的初等構(gòu)造而應(yīng)用的構(gòu)造方法來派生的(或者通過這些構(gòu)造方法來顯現(xiàn))。因此,與基于用戶交互的復(fù)雜-自適應(yīng)系統(tǒng)相似,基于機器的方式可以提供如下手段,該手段通過由初等構(gòu)造來綜合(復(fù)雜的)維度概念關(guān)系在系統(tǒng)操作800中引入變化,然后在源結(jié)構(gòu)分析部件中該改變中選擇。在這一基于機器的操作模式之下,針對復(fù)雜-自適應(yīng)系統(tǒng)的選擇要求可以由源結(jié)構(gòu)分析部件(上文所述和在圖6中所示)承擔(dān)。具體而言,可以基于循環(huán)關(guān)系的標(biāo)識(1002)以及可以用來分解這些循環(huán)關(guān)系的各種模式和參數(shù)來選擇維度概念關(guān)系。如本領(lǐng)域中公知的,存在用以提供基于機器的復(fù)雜-自適應(yīng)系統(tǒng)的許多可選手段、選擇標(biāo)準(zhǔn)和分析工具??梢詮臄?shù)據(jù)集刪減與分級假設(shè)(該分級假設(shè)是通過循環(huán)關(guān)系的存在而在集合體中標(biāo)識的)相抵觸的維度概念關(guān)系(1004)。這一刪減后的數(shù)據(jù)集可以重新組裝(1006)到如下輸入概念分類法1008中,根據(jù)該輸入概念分類法,操作800可以通過分析引擎的其余操作來派生新的初等構(gòu)造集。這一類基于機器的復(fù)雜-自適應(yīng)系統(tǒng)可以與比如上文參照圖4和27描述的基于用戶交互的系統(tǒng)212這樣的其他復(fù)雜-自適應(yīng)系統(tǒng)結(jié)合使用。例如,圖30的基于機器的復(fù)雜-自適應(yīng)系統(tǒng)可以用來通過數(shù)次迭代該過程來對維度概念分類法進(jìn)行細(xì)化。隨后,可以在基于用戶的復(fù)雜-自適應(yīng)系統(tǒng)中向用戶介紹所得維度概念分類法以求進(jìn)一步細(xì)^匕和演變。實施如在系統(tǒng)架構(gòu)的這一描述中通篇強調(diào)的那樣,在包括數(shù)據(jù)儲存設(shè)備的用于設(shè)計本發(fā)明許多實施例的方法和技術(shù)中,存在大量可變性。可以通過在現(xiàn)有技術(shù)中同樣公知的多種形式的架構(gòu)設(shè)計來解釋和改變本發(fā)明的許多應(yīng)用。系統(tǒng)架構(gòu)部件計算環(huán)境圖30圖示了用于本發(fā)明的計算環(huán)境的一個實施例。在一個實施例中,可以將本發(fā)明實施為在四級架構(gòu)之下操作的計算機軟件程序。服務(wù)器應(yīng)用軟件和數(shù)據(jù)庫可以在集中式計算機和分布式的分散系統(tǒng)上執(zhí)行。可以使用因特網(wǎng)作為用以在集中式服務(wù)器和與它交互的各種計算設(shè)備和分布式系統(tǒng)之間通信的網(wǎng)絡(luò)。用于建立這一類計算環(huán)境的可變性和方法在本領(lǐng)域中是公知的。這樣,這里沒有包含計算環(huán)境的進(jìn)一步討論。所有適用環(huán)境的共同之處在于,用戶通過他的或者她的計算機或者計算設(shè)備來訪問公共或者私有網(wǎng)絡(luò)(如因特網(wǎng)或者公司的內(nèi)部網(wǎng)),由此訪問將本發(fā)明具體化的計算機軟件。服務(wù)級各個級可以負(fù)責(zé)提供服務(wù)。一級3202和二級3204在集中式處理模型之下操作。三級3206和四級3208在分布式(分散式)處理的模型之下操作。此四級模型根據(jù)由系統(tǒng)用來分析域的共享集中式數(shù)據(jù)來實現(xiàn)專用域數(shù)據(jù)的分散化。下文討論圖33中示出了在共享數(shù)據(jù)與私有數(shù)據(jù)之間的這一描纟會。在第一級,集中式數(shù)據(jù)儲存器代表由系統(tǒng)管理的各種數(shù)據(jù)和內(nèi)容源。在一個實施例中,數(shù)據(jù)庫服務(wù)器3210可以提供數(shù)據(jù)服務(wù)以及訪問和維護(hù)數(shù)據(jù)的手段。雖然在此將分布式內(nèi)容描述為包含于"數(shù)據(jù)庫,,內(nèi),但是數(shù)據(jù)可以存儲于多個鏈接的物理位置或者數(shù)據(jù)源中。元數(shù)據(jù)也可以是分散式的、并且存儲于系統(tǒng)數(shù)據(jù)庫外部。例如,HTML代碼段包含可以由系統(tǒng)操作的元數(shù)據(jù)。來自外部模式的元素可以映射到在本系統(tǒng)的模式中使用的元素。用于呈現(xiàn)元數(shù)據(jù)的其他格式在本領(lǐng)域中公知的。信息領(lǐng)域因此可以提供分布式內(nèi)容源的財富和用于終端用戶以分散方式管理信息的手段。用于跨多個鏈接的物理位置或者數(shù)據(jù)源來管理數(shù)據(jù)的技術(shù)和方法在本領(lǐng)域中公知的,并且將不在這里進(jìn)一步窮盡地加以討論。XML數(shù)據(jù)饋送和應(yīng)用編程接口(API)3212可以用來將數(shù)據(jù)儲存器3210連接到應(yīng)用服務(wù)器3214。同樣,本領(lǐng)域技術(shù)人員可以理解,XML可以符合廣泛的專用和開放式模式。一定范圍的數(shù)據(jù)交換技術(shù)提供用以將各種分布式內(nèi)容格式并入到系統(tǒng)中的基礎(chǔ)結(jié)構(gòu)。對一個實施例中所用連接器的這一討論和所有以下討論并不限制本發(fā)明的范圍。在第二級3204,在集中式服務(wù)器3214上駐留的應(yīng)用可以包含用于本發(fā)明的核心編程邏輯。應(yīng)用服務(wù)器可以提供用于實施本發(fā)明方法的各種方面的處理規(guī)則、以及對于數(shù)據(jù)庫服務(wù)器的連通性。上文中具體描述了圖4-圖17和圖20-圖23中所示這一編程邏輯。在一個實施例中,可以將應(yīng)用服務(wù)器所處理的結(jié)構(gòu)信息輸出為XML3216。XML可以用來將外部數(shù)據(jù)儲存設(shè)備和網(wǎng)站與應(yīng)用服務(wù)器進(jìn)行連接。同樣,XML3216可以用來將這一交互性傳達(dá)回到應(yīng)用服務(wù)器,以供在進(jìn)行優(yōu)化和細(xì)化的過程中進(jìn)一步處理。在第三級,分布式數(shù)據(jù)儲存器3218可以用來存儲域數(shù)據(jù)。在一個實施例中,此數(shù)據(jù)可以用XML文件的形式存儲于web服務(wù)器上。存在存儲域數(shù)據(jù)的許多可選模式,比如外部數(shù)據(jù)庫。分布式數(shù)據(jù)儲存設(shè)備可以用來將輸出數(shù)據(jù)分布到終端用戶的呈現(xiàn)設(shè)備。在一個實施例中,可以將輸出數(shù)據(jù)作為使用XSL變換文件(XSLT)3220來表現(xiàn)的XML數(shù)據(jù)饋送進(jìn)行分布。這些技術(shù)可以在第四級通過表示層來表現(xiàn)輸出數(shù)據(jù)。表示層可以是任何分散式網(wǎng)站、客戶端軟件或者如下其他介質(zhì),表示層可以代表由終端用戶用與分類法交互的環(huán)境和分類法的對外展現(xiàn)。在一個實施例中,可以將數(shù)據(jù)表現(xiàn)為網(wǎng)站,并且顯示于瀏覽器中。這一結(jié)構(gòu)化信息可以提供用于用戶協(xié)作和輸入的平臺。本領(lǐng)域技術(shù)人員將認(rèn)識到,XML和XSLT可以用來跨不同范圍的計算平臺和介質(zhì)來表現(xiàn)信息。這一靈活性允許在廣泛的信息處理任務(wù)內(nèi)將系統(tǒng)作為過程來使用。例如,可以使用數(shù)據(jù)饋送中的關(guān)4建詞來表達(dá)語素。通過在數(shù)據(jù)饋送中包括語素引用,系統(tǒng)可以響應(yīng)于具體語素標(biāo)識符在表示層上提供附加處理。上文在對個性化的討論中描述了這一靈活性的應(yīng)用(圖28)。使用基于web的表單和控件3224,用戶可以添加和修改系統(tǒng)中的信息。這一輸入繼而可以作為XML數(shù)據(jù)饋送3226和3"6經(jīng)由分布式數(shù)據(jù)儲存設(shè)備而返回到集中式處理系統(tǒng)。--------------此外,也可以從因特網(wǎng)并入開放式XML格式如RSS作為向系統(tǒng)的輸入??梢杂蓱?yīng)用服務(wù)器3214處理對結(jié)構(gòu)信息的修改。來自這一處理的共享語素數(shù)據(jù)可以經(jīng)由XML和API連接器3212返回,并且存儲于集中式數(shù)據(jù)儲存設(shè)備3210中。在廣泛的系統(tǒng)架構(gòu)領(lǐng)域內(nèi),存在許多公知的可能設(shè)計、模式和產(chǎn)品。這些包括集中式、分散式和開放式系統(tǒng)架構(gòu)訪問模型。在這里將不進(jìn)一步討論本發(fā)明所覆蓋的這些實施和各種可選實施的技術(shù)運轉(zhuǎn)。數(shù)據(jù)模型和模式圖31提供了本發(fā)明一個實施例中的系統(tǒng)內(nèi)的核心數(shù)據(jù)結(jié)構(gòu)的簡化概況。這一簡化模式說明了可以通過系統(tǒng)的應(yīng)用編程邏輯對數(shù)據(jù)進(jìn)行變換的方式。它也說明了如何可以析構(gòu)和存儲語素數(shù)據(jù)。將系統(tǒng)的數(shù)據(jù)架構(gòu)設(shè)計成在提供用于處理域特有的實體的臨時數(shù)據(jù)儲存器之時使語素詞典集中。注意,域數(shù)據(jù)可以流過系統(tǒng);可以不將其存儲于系統(tǒng)中。映射到域?qū)嶓w的表可以是臨時數(shù)據(jù)儲存設(shè)備,該臨時數(shù)據(jù)儲存設(shè)備繼而被變換成用于域的輸出數(shù)據(jù)和數(shù)據(jù)儲存器。域數(shù)據(jù)儲存器設(shè)備可以連同其他集中式資產(chǎn)一起存儲或者分布到由域所有者維護(hù)的存儲資源。在一個實施例中,應(yīng)用和數(shù)據(jù)服務(wù)器(上文所述和圖30中所示)可以主要地操控數(shù)據(jù)??梢栽谙到y(tǒng)中的三個廣義數(shù)據(jù)抽象區(qū)內(nèi)組織數(shù)據(jù)實體抽象層3302:其中實體是系統(tǒng)中的主要知識表示構(gòu)建塊。實體可以包括語素3304、關(guān)鍵詞3306、概念3308、內(nèi)容節(jié)點3310和內(nèi)容容器3312(由URL代表)。關(guān)系抽象層3314:其中實體定義由系統(tǒng)中所用各種實體之間的關(guān)系表示。實體關(guān)系可以包括語素關(guān)系3316、概念關(guān)系3318、關(guān)鍵詞-語素關(guān)系3320、概念-關(guān)鍵詞關(guān)系3322、節(jié)點-概念關(guān)系3324和節(jié)點內(nèi)容容器(URL)關(guān)系3326。標(biāo)記抽象層3328是如下層,其中用來描述實體的項與實體本身的結(jié)構(gòu)定義分離。標(biāo)簽3330可以包括語素標(biāo)簽3332、關(guān)鍵詞標(biāo)簽3334、概念標(biāo)簽3336和節(jié)點標(biāo)簽3338??梢訨,過各種實體來共享標(biāo)簽。備選的是,可以按實體類型來劃分標(biāo)簽。注意,這一簡化模式?jīng)Q不限制一個實施例中使用的數(shù)據(jù)庫模式。主要地考慮系統(tǒng)性能、存儲和優(yōu)化的問題。本領(lǐng)域技術(shù)人員已知,存在用以設(shè)計對這里描述的設(shè)計元素進(jìn)行反映的數(shù)據(jù)庫系統(tǒng)的許多方式。這樣,在這里將不進(jìn)一步討論可以在本發(fā)明中用作實施例的各種方法、技術(shù)和設(shè)計。維度變換系統(tǒng)圖32圖示了根據(jù)一個實施例的用以執(zhí)行上文描述和下文進(jìn)一步描述的數(shù)據(jù)結(jié)構(gòu)變換操作的系統(tǒng)概況??梢愿唧w地重新敘迷在一個實施例中存在的上文介紹的三個廣義變換過程l)域分析和壓縮,其按照復(fù)雜維度結(jié)構(gòu)中的初等構(gòu)造來定義的用以發(fā)現(xiàn)域200的結(jié)構(gòu)分面;2)綜合和擴展,其將域的復(fù)雜維度結(jié)構(gòu)綜合和擴展成維度概念分類法210,這是通過增強的分面式分類方法來提供的;以及3)管理,其通過分面式導(dǎo)航和編輯環(huán)境來管理維度概念分類法210內(nèi)的用戶交互,從而實現(xiàn)隨時間對結(jié)構(gòu)(例如206和210)進(jìn)^"細(xì)化的復(fù)雜-自適應(yīng)系統(tǒng)。分析初等構(gòu)造在一個實施例中示意地示出了分布式計算環(huán)境600。用于集中式處理的一個計算系統(tǒng)601可以作為用于數(shù)據(jù)結(jié)構(gòu)的變換引擎602進(jìn)行操作。變換引擎可以獲得來自一個或者多個域200的源數(shù)據(jù)結(jié)構(gòu)202來作為其輸入。變換引擎602可以包括分析引擎204a、語素詞典206和構(gòu)建引擎208a。這些系統(tǒng)部件可以提供上文介紹和在圖2中圖示的分析和綜合功能。在一個很具體的實施例中,可以將復(fù)雜維度結(jié)構(gòu)編碼成如下XML文件604,這些XML文件可以通過因特網(wǎng)606經(jīng)由web服務(wù)(或者API或者其他分布信道)分布到一個或者多個計算系統(tǒng)以供分散式處理(例如603)。通過這一和/或其他分布和分散模式,廣泛的開發(fā)者和發(fā)布者可以使用變換引擎602以創(chuàng)建復(fù)雜的維度結(jié)構(gòu)。應(yīng)用包括網(wǎng)站、知識庫、電子商務(wù)商店、搜索服務(wù)、客戶端軟件、關(guān)聯(lián)信息系統(tǒng)、分析等。這里注意,不應(yīng)將集中式和分散式處理的這些描述與可以用來提供這些處理模式的各種集中式和分散式物理系統(tǒng)相混淆。這里,"集中式處理"是指用于變換處理的共享的、公共的、和/或匯集式數(shù)據(jù)和服務(wù)。"分散式處理"是指域特有的數(shù)據(jù)和服務(wù)。如本領(lǐng)域中公知的,存在可以被實施成實現(xiàn)集中式和分散式處理這一混合的多個物理系統(tǒng)和架構(gòu)。利用增強型分面式分類實現(xiàn)的綜合在XML文件604中具體化的復(fù)雜維度結(jié)構(gòu)可以用作重新組織域內(nèi)容的基礎(chǔ)。在一個實施例中,一種增強的分面式分類方法可以用來重新組織域中的素材,其使用在XML文件604中具體化的復(fù)雜維度結(jié)構(gòu)在第二計算系統(tǒng)603處派生維度概念分類法210。通常,第二計算系統(tǒng)(如系統(tǒng)603)可以由如下域所有者維護(hù),這些域所有者也負(fù)責(zé)通過概念分類法210來重新組織域。下文提供并在圖33中示出了由系統(tǒng)使用的多級數(shù)據(jù)結(jié)構(gòu)相關(guān)的具體信息。在系統(tǒng)603的一個實施例中,可以提供用于維度概念分級210的表示層608或者圖形用戶界面(GUI)??蛻舳藗?cè)工具610(如瀏覽器、基于web的表單和軟件部件)可以允許域終端用戶和域所有者/管理員與維度概念分類法210交互。經(jīng)由用戶交互的復(fù)雜-自適應(yīng)處理維度概念分類法210可以由各獨立終端用戶和域所有者定制和劃界。這些用戶交互可以由第二計算系統(tǒng)(例如603)用來向分類系統(tǒng)提供人類認(rèn)知和附加處理資源。例如在XML212a中編碼的將用戶交互具體化的維度分類法信息可以通過經(jīng)由web服務(wù)或者其他裝置進(jìn)行分布來返回到變換引擎602。這允許數(shù)據(jù)結(jié)構(gòu)(例如206和210)隨時間而演變和改進(jìn)。從第二系統(tǒng)603到變換引擎602的反饋建立了復(fù)雜-自適應(yīng)的處理系統(tǒng)。盡管終端用戶和域所有者通過維度概念分類法210在高的抽象級交互,但是用戶交互可以轉(zhuǎn)譯成作為維度概念分類法信息的基礎(chǔ)的初等構(gòu)造(例如語素和語素關(guān)系)。通過將終端用戶和域所有者交互耦合到初等構(gòu)造以及將其反饋回變換引擎602,系統(tǒng)可以評價集合體中的交互。使用這一機制,可以移除在協(xié)作式分類中歷史上出現(xiàn)的不明確性和沖突。因此,這一協(xié)作式分類方式尋求在概念級上避免其他這樣的系統(tǒng)可能出現(xiàn)的個人和協(xié)作式協(xié)商。通過允許用戶通過他們的交互來共享內(nèi)容節(jié)點302和分類數(shù)據(jù)(維度概念分類法信息),用戶交互也擴展可用的源數(shù)據(jù)202,這增強了分類的整體質(zhì)量并且增加可用的處理資源。多級數(shù)據(jù)結(jié)構(gòu)圖33圖示了如下裝置,借助這些裝置,通過連續(xù)多級抽象和維度性來復(fù)合從各源數(shù)據(jù)結(jié)構(gòu)202收獲的初等構(gòu)造,從而創(chuàng)建用于各域200的維度概念分類法210。還圖示了在每個域200中具體化的分散式私有數(shù)據(jù)(708、710和302)與由集中式系統(tǒng)用來通知為每個域而生成的分類模式的共享初等構(gòu)造(語素詞典)206之間的描繪。初等構(gòu)造語素310和語素關(guān)系這些初等構(gòu)造可以作為集中式數(shù)據(jù)存儲于語素詞典206中??梢钥邕^分布式計算機環(huán)境600(例如經(jīng)由變換引擎系統(tǒng)601)來對集中式數(shù)據(jù)中,并且使其可用于所有域所有者和終端用戶,以便輔助域分類。由于集中式數(shù)據(jù)是初等的(語素性的)并且與由概念306和概念關(guān)系所代表的任何特有和私有知識的背景無關(guān)聯(lián),所以它可以在第二分散式計算系統(tǒng)603之間進(jìn)行共享。系統(tǒng)601無需持久地存儲包括各域中所含唯一信息的這些初等構(gòu)造的p眷一表達(dá)和組合。語素詞典206可以在語素屬性702的表集中存儲每個語素310的屬性。語素屬性702可以引用由變換引擎602的分析過程(如下文進(jìn)一步所述)使用的結(jié)構(gòu)參數(shù)和統(tǒng)計數(shù)據(jù)??梢栽诩象w中將語素關(guān)系排序成語素分級402。維度分面式輸出數(shù)據(jù)域數(shù)據(jù)儲存設(shè)備706可以存儲由變換引擎系統(tǒng)601根據(jù)源數(shù)據(jù)結(jié)構(gòu)202,并且使用語素詞典206而派生的域特有的數(shù)據(jù)(復(fù)雜維度結(jié)構(gòu)210a)。在一個實施例中,可以用XML形式來存儲域特有的數(shù)據(jù)。每個域數(shù)據(jù)儲存設(shè)備706中基于XML的復(fù)雜維度結(jié)構(gòu)210a可以包括域特有的關(guān)鍵詞分級710、內(nèi)容節(jié)點302的集合和概念定義708的集合。關(guān)鍵詞分級710可以包括關(guān)鍵詞關(guān)系的分級集合。XML輸出本身可以編碼為分面式數(shù)據(jù)。分面式數(shù)據(jù)代表作為其結(jié)構(gòu)分面的源數(shù)據(jù)結(jié)構(gòu)202的維度性和就分面屬性而言的源數(shù)據(jù)結(jié)構(gòu)202的內(nèi)容節(jié)點302。這一方式允許域特有的資源(例如系統(tǒng)603)來將復(fù)雜的維度結(jié)構(gòu)210a處理成更高的抽象級(如維度概念分類法210)??梢允褂脧?fù)雜維度結(jié)構(gòu)210a作為用以管理內(nèi)容節(jié)點302之間關(guān)系的組織基礎(chǔ)。新的組織原則集然后可以適用于初等構(gòu)造進(jìn)行分類。組織原則可以包括如下文詳述并在圖20-22中所示的增強的分面式分類方法。增強的分面式分類方法可以適用于復(fù)雜維度結(jié)構(gòu)210a。還可以應(yīng)用其他更簡單的分類方法,并且可以按照需要根據(jù)復(fù)雜維度結(jié)構(gòu)210a來創(chuàng)建其他數(shù)據(jù)結(jié)構(gòu)(筒單或者復(fù)雜)。在一個實施例中,可以使用顯式地表示分面式分類的輸出模式。可以使用其他輸出模式??梢允褂酶鞣N數(shù)據(jù)模型來代表為各域生成的分面式分類??捎玫姆诸惙椒ㄅc正在被分類的數(shù)據(jù)結(jié)構(gòu)類型緊密關(guān)聯(lián)。因此,用于分類的這些可選實施例可以與上文討論的可選維度性實施例直接地相聯(lián)系。域數(shù)據(jù)儲存設(shè)備706中包含的數(shù)據(jù)實體(例如708、710)包括對存儲于語素詞典206中的初等構(gòu)造的引用。以這一方式,在創(chuàng)建用于各域200的維度概念分類法210之后,可以對其進(jìn)行重新分析,以便適應(yīng)改變。當(dāng)域所有者希望更新其分類時,可以將域特有的數(shù)據(jù)重新裝載至分析引擎204a中用于處理??梢詫τ?00進(jìn)行實時(例如,通過經(jīng)由XML212a來通過終端用戶交互)分析,或者通過(以隊列方式)周期性更新對域200進(jìn)行分析。共享數(shù)據(jù)與私有數(shù)據(jù)維度知識表示模型的一個優(yōu)點在于,由系統(tǒng)用來將域處理成復(fù)雜維度結(jié)構(gòu)210a的私有域數(shù)據(jù)和共享數(shù)據(jù)的清晰分離。數(shù)據(jù)分離提供了分布式計算的益處,比如掌控的應(yīng)用服務(wù)提供商(ASP)處理模型、利用如上文所述環(huán)境這種效用計算環(huán)境的機會、或者作為服務(wù)的軟件(SaaS)應(yīng)用遞送模型。在這些模型之下,第三方可以向域所有者賦予變化引擎服務(wù)。域所有者因此可以利用這些類型的模型所提供的規(guī)模經(jīng)濟。域所有者的域特有的數(shù)據(jù)可以在各種存儲模型之下安全地加以掌控(例如經(jīng)由ASP),因為它可與共享數(shù)據(jù)(即語素詞典206)和其他域所有者的私有數(shù)據(jù)分離。備選地,域特有的數(shù)據(jù)可以由域所有者掌控、從共享數(shù)據(jù)在物理上加以移除。在這一分布式知識表示模型之下,域所有者可以受益于集中式知識變換服務(wù)的經(jīng)濟優(yōu)點和專門化中受益以及從集中式分類數(shù)據(jù)的"匯集智慧"。然而,通過保持必需的域特有的數(shù)據(jù)與這些集中式服務(wù)和數(shù)據(jù)資產(chǎn)分離,域所有者可以在整個用戶群體的共享知識(例如語素詞典)上構(gòu)建而無需有損于他們的獨有知識。企業(yè)設(shè)置內(nèi)的知識倉庫和內(nèi)部網(wǎng)在專用知識域的背景內(nèi)提供了這一共享匯集知識應(yīng)用的一個例子。目前,在需要維護(hù)私有知識以求竟?fàn)巸?yōu)勢的情況下,公司面臨著匯集知識的經(jīng)濟優(yōu)點與開放式協(xié)作之間的權(quán)衡。這里描述的系統(tǒng)允許這一類封閉式信息域,其不但從這里描述的集中式知識表示和變換服務(wù)以及如這里描述的語素詞典中的群體數(shù)據(jù)資產(chǎn)中受益,同時又保持它們的綜合知識和域特有的數(shù)據(jù)資產(chǎn)私有。分布式計算環(huán)境在一個實施例中,可以將構(gòu)建引擎分布為在開源平臺上運行的軟件應(yīng)用。一個這樣的開源平臺是包括LINUXTM、APACHE、MySQL以及可以包括Perl、PHP、Python和其他語言的編程技術(shù)在內(nèi)的"LAMP,,技術(shù)棧。通過這樣的應(yīng)用,可以在域所有者的分布式物理系統(tǒng)上直接讀取構(gòu)建引擎的綜合規(guī)則的多個副本。在這一模型之下,得到了運行集中式處理規(guī)則的分布式物理系統(tǒng)(因為構(gòu)建引擎的各副本具有相同指令)。使用這一方式,用于對每個域的復(fù)雜維度結(jié)構(gòu)進(jìn)行綜合的升級成本分布在了每個域所有者的資源中。以相似的方式,可以將構(gòu)建引擎分布為輕量級客戶端側(cè)應(yīng)用,該應(yīng)用按照這些應(yīng)用的終端用戶的需要來綜合復(fù)雜維度結(jié)構(gòu)。除了在域所有者和終端用戶的系統(tǒng)上直接運行這些分散式系統(tǒng)的機會之外,諸如AMAZONWEBSERVICES(AWS)的效用計算系統(tǒng)提供了一種用于集中式構(gòu)建引擎規(guī)則的經(jīng)濟分布機制(運行構(gòu)建引擎的可視化實例的直接成本可以多于以下,即跨域所有者的異型環(huán)境來分布和支持構(gòu)建引擎的間接成本的偏移量)。取代物理地分布構(gòu)建引擎的副本,可以在效用計算環(huán)境內(nèi)提供虛擬化構(gòu)建引擎應(yīng)用。例如在AWS內(nèi),將要創(chuàng)建用于構(gòu)建引擎的映像,并且將其上傳到AWS彈性計算云服務(wù)(EC2)的虛擬化環(huán)境。EC2可以提供一個或者多個虛擬服務(wù)器環(huán)境。AWS"映像"實質(zhì)上是虛擬服務(wù)器的盤映像;"實例"是基于該盤映像的操作虛擬服務(wù)器。將提供在虛擬服務(wù)器上運行的構(gòu)建引擎的新實例以隨需處理域和適應(yīng)用戶活動。在這一分散式環(huán)境(以及許多其他環(huán)境)中,可以對域特有的數(shù)據(jù)與構(gòu)建引擎進(jìn)行解耦合。在AWS內(nèi),EC2可以用于處理、簡單存儲服務(wù)(S3)可以用于數(shù)據(jù)存儲,而簡單隊列服務(wù)(SQS)可以用來協(xié)調(diào)上文介紹的并在下文更具體討論的跨分析和復(fù)雜-自適應(yīng)反饋的EC2、S3和其他集中式服務(wù)的消息傳送。AWSS3服務(wù)可以存儲和分發(fā)對用于域的維度復(fù)雜結(jié)構(gòu)進(jìn)行編碼的分面式數(shù)據(jù)集。這些域特有的分面式數(shù)據(jù)集可以在處理構(gòu)建引擎規(guī)則的多個虛擬服務(wù)器之間共享。綜合的概念關(guān)系可以存儲于這一分散式環(huán)境中??梢跃C合構(gòu)建請求,并且將構(gòu)建請求并行發(fā)送到終端用戶系統(tǒng)和S3。隨后,可以從S3中的概念關(guān)系高速緩存滿足域先前請求的參數(shù)匹配的綜合請求,或者如果需要更新則可以由構(gòu)建引擎直接地生成這些綜合請求。同樣重要的是,綜合的關(guān)系將可用作如上所述用于集中式分析引擎服務(wù)中的下一分析循環(huán)的反饋。本領(lǐng)域技術(shù)人員將認(rèn)識到,在分布式計算機領(lǐng)域中可以進(jìn)行許多架構(gòu)改進(jìn)和發(fā)展。這種類型改進(jìn)的示例例如跨多個虛擬機的并行化、以及跨域的負(fù)載平衡、以及用戶活動性。XML模式和客戶端側(cè)變換分面式輸出數(shù)據(jù)可以編碼為XML并且通過XSLT來表現(xiàn)。可以用許多不同方式重新組織和代表分面式輸出(例如參考公布的XFML模式)。用于代表分級的可選輸出是可用的。一個實施例中,XML變換碼(XSLT)在用來呈現(xiàn)表示層。由系統(tǒng)管理的所有信元(如果通過系統(tǒng)用信道發(fā)送分布式內(nèi)容,則包括該分布式內(nèi)容)可以通過XSLT來表現(xiàn)。數(shù)據(jù)饋送連接到系統(tǒng)表示層的過程。這些類型的連接器可以用來將來自應(yīng)用服務(wù)器的信息輸出到使用結(jié)構(gòu)信息的各種介質(zhì)。可以通過XSLT來處理來自應(yīng)用服務(wù)器的XML數(shù)據(jù)以便在web頁面上呈現(xiàn)。本領(lǐng)域技術(shù)人員將認(rèn)識到,XML技術(shù)和類似呈現(xiàn)技術(shù)將在本發(fā)明的服務(wù)中提供的當(dāng)前和將來功能。除了基本的發(fā)布和數(shù)據(jù)呈現(xiàn)之外,XSLL和類似技術(shù)還可以提供一定范圍的編程機會。復(fù)雜的信息結(jié)構(gòu)(例如由系統(tǒng)創(chuàng)建的信息結(jié)構(gòu))可以提供可作用信息(如數(shù)據(jù)模型)。軟件程序和代理可以對關(guān)于表示層的信息起作用,以提供復(fù)雜化交互性和自動化。這樣,由系統(tǒng)的核心結(jié)構(gòu)優(yōu)點提供的本發(fā)明范圍可以遠(yuǎn)遠(yuǎn)超出簡單發(fā)布以外擴展。本領(lǐng)域技術(shù)人員也將認(rèn)識到,可能用于設(shè)計這些XML和XSLT位置的可變性。例如,文件可以局部地存儲于終端用戶的計算機上或者使用web服務(wù)來生成。ASP代碼(或者類似技術(shù))可以用來插入由系統(tǒng)管理的關(guān)于分布式表示層的信息(比如第三方發(fā)布者或者軟件客戶的web頁面)。作為另一例子,包含來自系統(tǒng)的核心結(jié)構(gòu)信息的XML數(shù)據(jù)饋送可以與系統(tǒng)組織的分布式內(nèi)容組合。本領(lǐng)域技術(shù)人員將認(rèn)識到,用以將這兩類數(shù)據(jù)解耦綜合單獨數(shù)據(jù)饋送的機會。用于存儲和分布這些呈現(xiàn)文件和數(shù)據(jù)饋送的這些和其他架構(gòu)機會在本領(lǐng)域中公知的,因此在這里將不進(jìn)一步討論。用戶界面以下部分提供與用于上文討論的系統(tǒng)操作的各種用戶界面有關(guān)的實施細(xì)節(jié)。這些操作是查看維度概念分類法;提供在動態(tài)綜合模式下的綜合參數(shù);以及編輯維度概念分類法。本領(lǐng)域技術(shù)人員將認(rèn)識到,可以在上文討論的系統(tǒng)操作服務(wù)中實施的各種可能用戶界面。這樣,用戶界面實施的圖示和描述決不限制本發(fā)明的范圍。維度概念分類法查看器圖34提供了用于終端用戶查看和瀏覽的維度概念分類法呈現(xiàn)UI的主要部件的實例的截屏。內(nèi)容容器2600可以保持域中的各類內(nèi)容以及形成用于維度概念分類法的表示層的結(jié)構(gòu)鏈接和概念定義。一個或者多個概念定義可以與容器中的內(nèi)容節(jié)點相關(guān)聯(lián)。如這里所述,系統(tǒng)可以管理系統(tǒng)中登記的任一類信元以及URI和用來計算維度概念關(guān)系的概念定義。在一個實施例中,可以將通常與傳統(tǒng)線性(或者平面)信息結(jié)構(gòu)相關(guān)聯(lián)的用戶界面設(shè)備進(jìn)行復(fù)合或者堆疊,以表示復(fù)雜維度結(jié)構(gòu)中的維度性。復(fù)合傳統(tǒng)WebUI器件(如導(dǎo)航條、目錄樹2604和面包屑路徑2602)可以用來示出信息架構(gòu)中各種節(jié)點處的維度交集。與活躍內(nèi)容節(jié)點2606相交的各維度軸(或者分級)可以表示為單獨分級,一個分級用于一個相交軸。結(jié)構(gòu)關(guān)系可以由從活躍內(nèi)容容器到域中相關(guān)內(nèi)容容器的指針(或者鏈接)來定義。這可以提供如維度概念分類法規(guī)定的在活躍容器與相關(guān)容器之間的多個結(jié)構(gòu)鏈接。結(jié)構(gòu)鏈接可以通過各種方式來呈現(xiàn),這些方式包括概念的完全上下文呈現(xiàn)、僅顯示活躍軸上關(guān)鍵詞的概念的過濾呈現(xiàn)、內(nèi)容節(jié)點標(biāo)簽的呈現(xiàn)等。結(jié)構(gòu)鏈接可以提供用于維度概念分類法內(nèi)如下內(nèi)容節(jié)點2608的背景,這些內(nèi)容節(jié)點被組織在一個或者多個關(guān)系類型(例如父、子或者兄弟)內(nèi)優(yōu)先級化的內(nèi)容節(jié)點分組。XSLT可以用來將結(jié)構(gòu)信息呈現(xiàn)為網(wǎng)站上的導(dǎo)航路徑,該路徑允許用戶將結(jié)構(gòu)分級導(dǎo)航到與活躍容器相關(guān)的容器。作為網(wǎng)站上的導(dǎo)航器件的這一類結(jié)構(gòu)信息呈現(xiàn)可以存在于系統(tǒng)的多數(shù)基本應(yīng)用之中。這些和其他導(dǎo)航慣例在本領(lǐng)域中是公知的。動態(tài)綜合用戶界面面控制以提供動態(tài)綜合操作(如上所述)的用戶界面。用戶界面可以包括如下用戶界面控件,用戶可以利用這些用戶界面控件來指定活躍概念定義3602、活躍軸定義3604和活躍域3606。用于指定活躍概念定義和活躍軸定義的控件可以包括用于將概念定義規(guī)定為關(guān)鍵詞并且啟動編輯操作和基于文本的搜索(未示出)的鏈接(已示出)。在一個實施例中,用戶可以從現(xiàn)有概念分級3608內(nèi)布置的概念定義集中選擇活躍概念定義?;钴S概念定義的這一選擇可以是基于先前執(zhí)行的動態(tài)綜合操作,以提供用于維度概念分類法的全局導(dǎo)航結(jié)構(gòu)。在另一實施例中,為了指定活躍概念定義,用戶可以將查詢鍵入到文本框(未示出)中??梢葬槍εc域關(guān)聯(lián)的實體標(biāo)簽集來處理查詢。在鍵入它們時,可以基于與域中的概念、關(guān)鍵詞和語素這些其他實體所關(guān)聯(lián)的標(biāo)簽之間的比較來賦予建議列表(上文更具體討論了提取方法)。使用這些工具,用戶可以基于域特有的標(biāo)簽的定制詞匯表,來從賦予的建議中選擇概念定義??梢允褂没钴S概念定義的一個或者多個屬性的列表或者用戶可能希望組裝的屬性的任何組合(如上文在綜合操作的討論之下所述)來指定軸定義。以來自用于動態(tài)綜合操作的候選集內(nèi)的屬性的分析為基礎(chǔ)的"標(biāo)簽云"3610可以是一種用于提供可能軸定義的總覽的手段。例如,可以使用候選集中的最普遍關(guān)鍵詞的計數(shù)作為基礎(chǔ),該基礎(chǔ)既用于選擇用于呈現(xiàn)的關(guān)鍵詞子集,又用于基于關(guān)鍵詞總計數(shù)來改變關(guān)鍵詞標(biāo)簽的字體大小。在這一實施中,用戶可以通過/人3爭屏幕的頂部來定位的標(biāo)記集中選擇來選擇活躍域。為了控制該處理和所得綜合輸出的范圍,用以限定如上所述綜合參數(shù)的控制可以包括作為滑塊3610的分離程度和對作為鏈接3612而返回的內(nèi)容節(jié)點的數(shù)目的限制(在這一實施例中,對于顯示的內(nèi)容節(jié)點的數(shù)目的限制與對返回的概念的限制存在聯(lián)系。備選的是,可以移除對概念和內(nèi)容節(jié)點的限制的聯(lián)系,以在呈現(xiàn)中提供更多靈活性)。將可以用來顯示或者隱藏虛擬概念的手段圖示為復(fù)選框轉(zhuǎn)換控件3614。維度概念分類法概括器維度概念分類法的視圖可以通過上述用戶界面呈現(xiàn)給用戶。出于iC明的目的,々支i殳在回顧分類之后,用戶希望重新組織它。^^手、統(tǒng)的角度來看,這些交互將在復(fù)雜-自適應(yīng)系統(tǒng)內(nèi)生成顯式用戶反饋。圖36圖示了在一個實施例中可以提供這些交互的概括器用戶界面。它指示設(shè)備改變節(jié)點2702在結(jié)構(gòu)2704中的位置,并且編輯在各節(jié)點2076的容器和概念定義分配。在一個實施例中,使用客戶端側(cè)控制,用戶可以移動分級中的節(jié)點,以重新組織維度概念分類法。在這樣做時,用戶可以在節(jié)點之間建立新的父-子關(guān)系。在編輯節(jié)點的位置時,可以使下層語素之間新的成組關(guān)系相關(guān)。這由此可能需要重新計算以確定所推斷維度概念關(guān)系的新集合。這些變化可以排隊等候以計算通過概念關(guān)系來推斷的新語素關(guān)系??梢詫⒆兓鎯楣蚕砭S度概念分類法(下文稱為群體概念分類法)的特例,以滿足用戶的個性化需要(見下文關(guān)于個性化的更多細(xì)節(jié))。本領(lǐng)域技術(shù)人員將認(rèn)識到,存在可以向終端用戶呈現(xiàn)多維度信息結(jié)構(gòu)并且提供交互性的許多方法和技術(shù)。例如,多變量形式可以用來允許用戶同時沿著許多不同維度查詢信息架構(gòu)。比如"數(shù)據(jù)透視表(pivottable),,這樣的技術(shù)可以用來在信息結(jié)構(gòu)中保持一個維度(或者變量)恒定而改變其他變量。軟件部件如基于ActiveX和Ajax的部件可以嵌入于web頁面中以提供與下層結(jié)構(gòu)的交互性。可視化技術(shù)可以提供數(shù)據(jù)的三維視圖。這些和其他變化對于本領(lǐng)域技術(shù)人員而言將是清楚的并且沒有限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員將認(rèn)識到,本發(fā)明可以采用許多形式并且這樣的形式在要求保護(hù)的本發(fā)明范圍內(nèi)。因此,所附權(quán)利要求的精神和范圍不應(yīng)限于這里所含特定版本的描述。權(quán)利要求1.一種用于組織和管理數(shù)據(jù)結(jié)構(gòu)的方法,包括基于來自反饋代理的輸入,其特征在于a)適用于信息域的用于分面式分類的方法,所述分面式分類方法包括(i)對所述域的分面進(jìn)行分析或者接收對所述域的分面分析結(jié)果;以及(ii)應(yīng)用所述域的分面式分類綜合;以及b)復(fù)雜-自適應(yīng)方法,用于根據(jù)所述分面式分類綜合來選擇和返回關(guān)于一次或者多次迭代的信息,所述復(fù)雜-自適應(yīng)方法響應(yīng)于所述返回的信息來改變數(shù)據(jù)結(jié)構(gòu)的組織和管理。2.—種用于信息域的分面式分類的方法,其特征在于a)提供包括用來對信息進(jìn)行分類的分面屬性的分面式數(shù)據(jù)集,這種分面屬性可選地包括用于所述分面屬性的分面屬性分級;b)提供維度概念分類法,其中所述分面屬性根據(jù)將含義與待分類的所述域的對象進(jìn)行關(guān)聯(lián)的概念而分配給所述對象,所述概念由概念定義表示,所述概念定義在所述維度概念分類法中使用所述分面屬性來定義并且與所述對象相關(guān)聯(lián),所述維度概念分類法根據(jù)所述分面式數(shù)據(jù)集來表達(dá)所述概念定義之間的維度概念關(guān)系;以及c)提供或者實現(xiàn)一種復(fù)雜-自適應(yīng)系統(tǒng),其用于選擇和返回維度概念分類法信息,以響應(yīng)于所述維度概念分類法信息來改變所述分面式數(shù)據(jù)集和維度概念分類法。3.根據(jù)權(quán)利要求2所述的方法,其中所述對輸入信息的分面分析根據(jù)源數(shù)據(jù)結(jié)構(gòu)選自信息域,所述方法的特征在于使用模式擴充和/或統(tǒng)計分析來發(fā)現(xiàn)所述輸入信息的至少一個所述分面屬性,以標(biāo)識所述輸入信息中的分面屬性關(guān)系模式。4.根據(jù)權(quán)利要求3所述的方法,其特征在于根據(jù)從所述輸入信息獲得的概念定義和概念關(guān)系來推斷所述分面屬性關(guān)系,由此實現(xiàn)分面屬性分級的構(gòu)建,所述概念定義包括用于定義所述分面屬性的屬性。5.根據(jù)權(quán)利要求4所述的方法,其特征在于根據(jù)所述輸入信息中的概念定義和概念關(guān)系中的分面屬性關(guān)系排列,來建立潛在分面屬性關(guān)系。6.根據(jù)權(quán)利要求5所述的方法,其特征在于根據(jù)潛在分面屬性關(guān)系來建立分面屬性關(guān)系,以減少潛在分面屬性關(guān)系的數(shù)目,以便擴充用于統(tǒng)計分析的所述模式。7.根據(jù)權(quán)利要求6所述的方法,其特征在于根據(jù)如下各項中的至少一項來建立潛在分面屬性關(guān)系(a)存在跨過相關(guān)概念定義的配對而共享的分面屬性;(b)在所述分面屬性分級中直接或者間接地存在所述分面屬性關(guān)系;以及(c)外部詞典。8.根據(jù)權(quán)利要求7所述的方法,其特征在于對于每個潛在分面屬性關(guān)系,評估相應(yīng)潛在分面屬性關(guān)系保持基本上適用于其中存在所述相應(yīng)潛在分面屬性關(guān)系的所述概念關(guān)系的可能性;以及響應(yīng)于所述評估,使所述相應(yīng)潛在分面屬性關(guān)系構(gòu)成用于所述分面屬性分級的候選分面屬性關(guān)系。9.根據(jù)權(quán)利要求8所述的方法,其特征在于所述評估包括確定所述相應(yīng)潛在分面屬性關(guān)系在所有概念關(guān)系的集合體背景中的普及度,以及其中所述構(gòu)成響應(yīng)于所述普及度。10.根據(jù)權(quán)利要求8所述的方法,其特征在于所述評估包括標(biāo)識所述潛在分面屬性關(guān)系之中存在循環(huán)關(guān)系,以及標(biāo)識與分面屬性關(guān)系之間的分級假設(shè)相抵觸的相應(yīng)潛在分面屬性關(guān)系,并且其中所述變成響應(yīng)于所述標(biāo)識。11.根據(jù)權(quán)利要求8所述的方法,其特征在于將所述候選分面屬性關(guān)系組裝成分面屬性多分級,從而使所述多分級中的候選分面屬性關(guān)系集在所述集合體中在邏輯上基本一致。12.根據(jù)權(quán)利要求4所述的方法,其特征在于通過將具有多個父屬性的分面屬性的級別重新考慮為所述多個父屬性的祖先的屬性,來將所述分面屬性分級定義為嚴(yán)格分級。13.根據(jù)權(quán)利要求12所述的方法,其特征在于根據(jù)所述分面屬性分級內(nèi)的根節(jié)點來確定所述分面屬性。14.根據(jù)權(quán)利要求3所述的方法,其特征在于所述分面屬性是語素,并且所述分面屬性關(guān)系是語素關(guān)系。15.根據(jù)權(quán)利要求14所述的方法,其特征在于使用所述分面屬性以及可選地使用所述分面屬性分級,來對從第二信息域中選擇的更多輸入信息執(zhí)行分面分析。16.根據(jù)權(quán)利要求3所述的方法,其特征在于提供包括所述分面屬性以及可選地包括分面屬性分級的分面式數(shù)據(jù)集。17.根據(jù)權(quán)利要求16所述的方法,其特征在于將所述分面式數(shù)據(jù)集用于分面分類綜合。18.根據(jù)權(quán)利要求2所述的方法,其特征在于訪問包括多個統(tǒng)計分析的數(shù)據(jù)儲存設(shè)備,以及通過所述復(fù)雜-自適應(yīng)系統(tǒng)的操作將所述統(tǒng)計分析用于通過聚集所選維度概念分類法信息,來改變所述分面式數(shù)據(jù)集和維度概念分類法。19.一種用于組織和管理數(shù)據(jù)結(jié)構(gòu)的系統(tǒng),包括基于來自反饋代理的輸入,其特征在于所述系統(tǒng)包括或者鏈接到復(fù)雜-自適應(yīng)系統(tǒng),所述復(fù)雜-自適應(yīng)系統(tǒng)用于選擇和返回維度概念分類法信息,以響應(yīng)于維度概念分類法信息來改變分面式數(shù)據(jù)集和維度概念分類法,其中所述系統(tǒng)可操作用以處理分面式數(shù)據(jù)集,所述分面式數(shù)據(jù)集包括分面、分面屬性以及可選地包括用來對信息進(jìn)行分類的用于所述分面屬性的分面屬性分級;以及所述系統(tǒng)還可操作用以定義所述維度概念分類法,其中所述分面屬性根據(jù)將含義與待分類的所述域的對象進(jìn)行關(guān)聯(lián)的概念而分配給所述對象,所述概念由概念定義表示,所述概念定義在所述維度概念分類法中使用所述分面屬性來定義并且與所述對象相關(guān)聯(lián),所述維度概念分類法根據(jù)所述分面式數(shù)據(jù)集來表達(dá)所述概念定義之間的維度概念關(guān)系。20.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于所述復(fù)雜-自適應(yīng)系統(tǒng)可操作用以(i)根據(jù)源數(shù)據(jù)結(jié)構(gòu)來處理從信息域中選擇的輸入信息;以及(ii)使用模式擴充和/或統(tǒng)計分析來發(fā)現(xiàn)所述輸入信息的至少一個所述分面屬性,或者可選地發(fā)現(xiàn)所述輸入信息的所述分面屬性分級之一,以標(biāo)識所述輸入信息中的分面屬性關(guān)系模式。21.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于所述復(fù)雜-自適應(yīng)系統(tǒng)可#:作用以返回用于加強所述分面屬性或者可選地加強所述分面屬性分級的更多輸入信息,所述分面屬性和所述分面屬性分級構(gòu)成用于所述返回的更多輸入信息的基礎(chǔ),所述更多輸入信息根據(jù)基于機器或者基于用戶的返回路徑中的一個或者多個^各徑而派生。22.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于(a)所述更多輸入信息借助對所述復(fù)雜-自適應(yīng)系統(tǒng)生成的更多輸入信息的請求來獲得;(b)這種請求與用于響應(yīng)于這樣的請求的時間限制相關(guān)聯(lián)。23.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于所述復(fù)雜-自適應(yīng)系統(tǒng)包括或者鏈接到統(tǒng)計分析數(shù)據(jù)儲存設(shè)備;以及所述復(fù)雜-自適應(yīng)系統(tǒng)可操作用以通過聚集所選維度概念分類法信息基于所述統(tǒng)計分析,來改變所述分面式數(shù)據(jù)集和維度概念分類法。24.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于所述復(fù)雜-自適應(yīng)系統(tǒng)可操作用以響應(yīng)于所述維度概念分類法信息,來控制所述分面式數(shù)據(jù)集和維度概念分類法的變化。25.根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于所述復(fù)雜-自適應(yīng)系統(tǒng)可操作用以針對根據(jù)所述維度概念分類法信息派生的所述分面屬性,對于所述分面、所述分面屬性和所述分面屬性分級來應(yīng)用以下一個或者多個(i)統(tǒng)計障礙;以及(ii)模式匹配約束。26.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于所述復(fù)雜-自適應(yīng)系統(tǒng)包括基于機器的復(fù)雜自適應(yīng)系統(tǒng),所述基于機器的復(fù)雜自適應(yīng)系統(tǒng)可操作用以使用統(tǒng)計分析以分析所述維度概念分類法以及選擇將要返回的維度概念分類法信息。27.根據(jù)權(quán)利要求2所述的方法,其特征在于執(zhí)行分面式分類綜合以將概念集相關(guān),所述概念集由根據(jù)包括分面屬性以及可選地包括分面屬性分級的分面式數(shù)據(jù)集所定義的概念定義來表示,所述分面式分類綜合包括表達(dá)所述概念定義之間的維度概念關(guān)系,其中通過檢查顯式關(guān)系和隱式關(guān)系中的至少一個關(guān)系在兩個概念定義的所述相應(yīng)分面屬性之間在所述分面式數(shù)據(jù)集中是否存在,來確定所述兩個概念定義在特定維度概念關(guān)系中相關(guān)。28.根據(jù)權(quán)利要求27所述的方法,其特征在于在維度概念分級中組裝所述維度概念關(guān)系。29.根據(jù)權(quán)利要求27所述的方法,其特征在于根據(jù)一個或者多個分面屬性來定義維度軸,所述維度軸用來根據(jù)所述維度概念關(guān)系來生成維度概念分級。30.根據(jù)權(quán)利要求29所述的方法,其特征在于定義以下一個或者多個(i)將要分類的域,以及(ii)來自所述概念集之中的活躍概念,所述活躍概念用作用于生成所述維度概念分級的祖先概念或者后代概念。31.根據(jù)權(quán)利要求27所述的方法,其特征在于所述兩個概念定義的所述相應(yīng)分面屬性定義所述兩個概念關(guān)系之間的祖先或者后代關(guān)系。32.根據(jù)權(quán)利要求30所述的方法,其特征在于定義來自所述域中的一個或者多個概念的所述活躍概念。33.根據(jù)權(quán)利要求30所述的方法,其特征在于如果定義所述活躍概念,則根據(jù)所述活躍概念的一個或者多個分面屬性來定義所述維度軸。34.根據(jù)權(quán)利要求30所述的方法,其特征在于借助人類輸入來定義所述域、所述活躍概念和所述維度軸中的一個或者多個。35.根據(jù)權(quán)利要求30所述的方法,其特征在于借助機器輸入來定義所述域、所述活躍概念和所述維度軸中的一個或者多個。36.根據(jù)權(quán)利要求29所述的方法,其特征在于定義所述維度概念分級中的分級階躍的數(shù)目限制。37.根據(jù)權(quán)利要求29所述的方法,其特征在于定義將要相關(guān)的概念的數(shù)目限制。38.根據(jù)權(quán)利要求36或者37所述的方法,其特征在于借助人類輸入來定義所述限制。39.根據(jù)權(quán)利要求36或者37所述的方法,其特征在于借助機器輸入來定義所述限制。40.根據(jù)權(quán)利要求27所述的方法,其特征在于定義多個維度軸,各軸根據(jù)一個或者多個分面屬性的相應(yīng)集合來定義,以便定義多個維度概念分級。41.根據(jù)權(quán)利要求29所述的方法,其特征在于在特定維度概念關(guān)系中,如果兩個概念定義之一的所述分面屬性與所述兩個概念定義中另一概念定義的所有分面屬性或者分面屬性子集相關(guān),則在特定維度軸上對所述兩個概念定義進(jìn)行關(guān)聯(lián)。42.根據(jù)權(quán)利要求29所述的方法,其特征在于在特定維度概念關(guān)系中,如果兩個概念定義之一的所述分面屬性的子集與所述兩個概念定義中另一概念定義的所有分面屬性或者分面屬性子集相關(guān)聯(lián),則在特定維度軸上對所述兩個概念定義進(jìn)行關(guān)聯(lián)。43.根據(jù)權(quán)利要求29所述的方法,其特征在于選擇用于定義所述維度軸的一個或者多個分面屬性,根據(jù)以下各項中的至少一項進(jìn)行所述選擇(i)所述分面屬性分級中的所述分面屬性的相應(yīng)優(yōu)先級;以及(ii)用以將特定含義關(guān)聯(lián)到所述維度軸的、包括所述一個或者多個分面屬性的特定概念定義。44.根據(jù)權(quán)利要求27所述的方法,其特征在于針對間接關(guān)系的存在來評估維度概念關(guān)系集,以及組裝無所述間接關(guān)系的所述維度概念分級。45.根據(jù)權(quán)利要求27所述的方法,其特征在于基于以下各項中的至少一項為所述維度概念分級中的所述概念定義建立優(yōu)先級(i)所述分面屬性分級中的分面屬性優(yōu)先級;以及(ii)相關(guān)概念的所述相應(yīng)概念定義中所述分面屬性的分析。46.根據(jù)權(quán)利要求27所述的方法,其特征在于通過根據(jù)與將要分類的域的內(nèi)容節(jié)點相關(guān)聯(lián)的概念,將分面屬性分配給所述內(nèi)容節(jié)點來定義維度概念分類法,所述概念由在所述維度概念分級中使用所述分面屬性而定義的概念定義來表示。47.根據(jù)權(quán)利要求27所述的方法,其特征在于推斷兩個或者多個概念定義之間的概念關(guān)系,其中在所述兩個概念定義之間沒有顯式概念關(guān)系。48.根據(jù)權(quán)利要求46所述的方法,其特征在于將概念推斷為由一個或者多個分面屬性定義的概念定義,其中在所述域中沒有與所述兩個概念定義中的另一概念定義相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容節(jié)點。49.根據(jù)權(quán)利要求27所述的方法,其特征在于針對將要分類的域來定義所述維度概念關(guān)系,所述域包括各自與所述概念定義表示的一個或者多個概念相關(guān)聯(lián)的一個或者多個內(nèi)容節(jié)點。50.根據(jù)權(quán)利要求49所述的方法,其特征在于針對概念節(jié)點的相應(yīng)一個或者多個概念定義來檢查所述概念節(jié)51.根據(jù)權(quán)利要求49所述的方法,其特征在于針對將要分類的域來定義所述維度概念關(guān)系,從而所述定義限于使用與所選內(nèi)容節(jié)點鄰近的內(nèi)容節(jié)點來處理所述域的局部化區(qū)域。52.根據(jù)權(quán)利要求2所述的方法,其特征在于通過定義候選概念定義的集合使所述概念相關(guān),所述候選概念定義通過分析與所述概念相關(guān)聯(lián)的所述分面屬性或者所述分面屬性的子集而^皮確定為相互鄰近。53.根據(jù)權(quán)利要求27所述的方法,其特征在于基于與所述兩個概念相關(guān)聯(lián)的分面屬性,通過定義所述分面屬性分級來建立相互鄰近的概念定義,從而派生與所述兩個概念相關(guān)聯(lián)的候選概念定義集。54.—種計算機系統(tǒng),用于根據(jù)源數(shù)據(jù)結(jié)構(gòu)來執(zhí)行從信息域中選擇的輸入信息的分面分析,其特征在于所述計算機系統(tǒng)可操作用以使用模式擴充和統(tǒng)計分析來派生所述輸入信息的分面屬性,以及可選地派生所述輸入信息的分面屬性分級,以標(biāo)識所述輸入信息中的分面屬性關(guān)系模式。55.根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以根據(jù)從所述輸入信息獲得的概念定義和概念關(guān)系來推斷所述分面屬性關(guān)系,以由此構(gòu)建所述分面屬性分級,所述概念定義包括用于定義所述分面屬性的屬性。56.根據(jù)權(quán)利要求55所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可才乘作用以通過遞增地添加分面屬性關(guān)系,來構(gòu)建所述分面屬性分級。57.根據(jù)權(quán)利要求55所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以根據(jù)所述輸入信息中的概念定義和概念關(guān)系中的分面屬性關(guān)系排列來建立潛在分面屬性關(guān)系。58.根據(jù)權(quán)利要求57所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以根據(jù)概念關(guān)系配對的所述概念定義中的分面屬性的計數(shù),以對所述潛在分面屬性關(guān)系的處理進(jìn)行排序。59.根據(jù)權(quán)利要求57所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以校準(zhǔn)來自所述潛在分面屬性關(guān)系的分面屬性關(guān)系,以減少潛在分面屬性關(guān)系的數(shù)目,從而擴充用于統(tǒng)計分析的所述模式。60.根據(jù)權(quán)利要求57所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以根據(jù)以下各項中的至少一項來校準(zhǔn)所述潛在分面屬性關(guān)系(a)存在跨過相關(guān)概念定義配對而共享的分面屬性;(b)在所述分面屬性分級中直接或者間接地存在所述分面屬性關(guān)系;以及(c)外部詞典。61.根據(jù)權(quán)利要求57所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以對于各潛在分面屬性關(guān)系,評估相應(yīng)潛在分面屬性關(guān)系保持基本上適用于存在所述相應(yīng)潛在分面屬性關(guān)系的所述概念關(guān)系的可能性;以及響應(yīng)于所述評估使所述相應(yīng)潛在分面屬性關(guān)系構(gòu)成用于所述分面屬性分級的候選分面屬性關(guān)系。62.根據(jù)權(quán)利要求61所述的計算機系統(tǒng),其特征在于所述評估包括確定所述相應(yīng)潛在分面屬性關(guān)系在所有概念關(guān)系的集合體背景中的普及度,以及其中所述構(gòu)成響應(yīng)于所述普及度。63.根據(jù)權(quán)利要求62所述的計算機系統(tǒng),其特征在于所述評估包括確定所述潛在分面屬性關(guān)系之中存在循環(huán)關(guān)系,以及標(biāo)識與分面屬性關(guān)系之間的分級假設(shè)相抵觸的相應(yīng)潛在分面屬性關(guān)系,以及其中所述構(gòu)成響應(yīng)于所述標(biāo)識。64.根據(jù)權(quán)利要求62所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以如果可以使用其他候選分面屬性關(guān)系的集合來邏輯地構(gòu)造所述候選分面屬性關(guān)系之一,則刪減所述一個候選分面屬性關(guān)系。65.根據(jù)權(quán)利要求62所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以將所述候選分面屬性關(guān)系組裝成分面屬性多分級,從而所述多分級中的候選分面屬性關(guān)系集在所述集合體中在邏輯上基本一致。66.根據(jù)權(quán)利要求65所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作使得所述組裝使用為了創(chuàng)建所述邏輯一致多分級而必需的最少數(shù)目的多分級關(guān)系。67.根據(jù)權(quán)利要求65所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作使得所述組裝響應(yīng)于各分面屬性的相對通用性的度量來對所述多分級中的相應(yīng)分面屬性進(jìn)行排序。68.根據(jù)權(quán)利要求67所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作使得使用與相應(yīng)分面屬性相關(guān)聯(lián)的一個或者多個概念定義的通用性,來確定所述相應(yīng)分面屬性的通用性。69.根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以通過將具有多個父屬性的分面屬性的順序重新考慮為所述多個父屬性的祖先的屬性,來將所述分面屬性分級定義為嚴(yán)格分級。70.根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以根據(jù)所述分面屬性分級內(nèi)的根節(jié)點來確定所述分面屬性。71.根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以根據(jù)所述輸入信息來派生所述概念定義和所述概念關(guān)系,其中所述概念關(guān)系定義為分面屬性。72.根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以標(biāo)識所述輸入信息中的結(jié)構(gòu)標(biāo)記器,以及響應(yīng)于所述結(jié)構(gòu)標(biāo)記器從所述輸入信息提取屬性。73,根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述分面屬性是語素,并且所述分面屬性關(guān)系是語素關(guān)系。74.根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可使用所述分面屬性來操作,用以對從第二信息域中選擇的更多輸入信息執(zhí)行分面分析。75.根據(jù)權(quán)利要求54所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以提供包括所述分面屬性以及可選地包括所述分面屬性分級的分面式數(shù)據(jù)集。76.根據(jù)權(quán)利要求75所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以提供用于在多個域之間共享的所述分面式數(shù)據(jù)集,所述分面式數(shù)據(jù)集用來針對每個域派生所述相應(yīng)維度概念分類法。77.根據(jù)權(quán)利要求75所述的計算機系統(tǒng),其特征在于所述計算機系統(tǒng)可操作用以將所述分面式數(shù)據(jù)集用于分面分類綜合。78.—種用于使用戶能夠操控維度概念關(guān)系的計算機系統(tǒng),其特征在于所述系統(tǒng)包括處理器;與所述處理器進(jìn)行數(shù)據(jù)通信的計算機可讀介質(zhì),其中所述計算機可讀介質(zhì)上包括處理器可執(zhí)行的指令和確定為在特定維度概念關(guān)系中相關(guān)的多個數(shù)據(jù)元素;輸入工具,配置用以允許外界實體與所述處理器進(jìn)行接口通信;顯示器,操作用以提供至少所選數(shù)據(jù)元素的可視描繪;以及編輯器,允許所述外界實體修改所述數(shù)據(jù)元素和所述特定維度概念關(guān)系。79.根據(jù)權(quán)利要求78所述的計算機系統(tǒng),其特征在于所述編輯器包括web頁面,所述web頁面表現(xiàn)與所述外界實體選擇的活躍節(jié),S、對應(yīng)的所述數(shù)據(jù)元素的至少一部分的視圖。80.根據(jù)權(quán)利要求79所述的計算機系統(tǒng),其特征在于所述活躍節(jié),泉以樹片段形式來呈現(xiàn)。81.根據(jù)權(quán)利要求78所述的計算機系統(tǒng),其特征在于所述數(shù)據(jù)元素包括概念定義,并且所述編輯器允許所述外界實體修改概念定義。82.根據(jù)權(quán)利要求78所述的計算機系統(tǒng),其特征在于所述數(shù)據(jù)元素包括分級數(shù)據(jù),并且所述編輯器允許所述外界實體修改分級數(shù)據(jù)。83.根據(jù)權(quán)利要求78所述的計算機系統(tǒng),其特征在于所述數(shù)據(jù)元素包括內(nèi)容節(jié)點,并且所述編輯器允許所述外界實體在所述維度概念分類法中改變與概念相關(guān)聯(lián)的內(nèi)容節(jié)點相對于與概念相關(guān)聯(lián)的其他內(nèi)容節(jié)點而言的位置。84.根據(jù)權(quán)利要求78所述的計算機系統(tǒng),其特征在于所述編輯器允許所述外界實體改變對內(nèi)容節(jié)點的主題進(jìn)行描述的定義。85.根據(jù)權(quán)利要求78所述的計算機系統(tǒng),其特征在于所述編輯器還允許向外界實體顯示數(shù)據(jù)元素修改。86.根據(jù)權(quán)利要求78所述的計算機系統(tǒng),其特征在于所述編輯器還允許在所述計算機可讀介質(zhì)上存儲數(shù)據(jù)元素修改。87.根據(jù)權(quán)利要求49所述的計算機系統(tǒng),其特征在于針對將要分類的域來定義所述維度概念關(guān)系,從而所述定義限于使用與所選概念定義鄰近的概念定義的實時處理。88.根據(jù)權(quán)利要求49所述的計算機系統(tǒng),其特征在于針對將要分類的域來定義所述維度概念關(guān)系,從而使所述定義在時間上受到限制,以用于延時控制。全文摘要提供一種用于基于來自反饋代理的輸入來組織和管理數(shù)據(jù)結(jié)構(gòu)的系統(tǒng)、計算機系統(tǒng)和方法,該方法包括(a)適用于信息域的用于分面式分類的方法,所述分面式分類方法包括(i)對所述域進(jìn)行分面分析或者接收域的分面分析結(jié)果;以及(ii)應(yīng)用所述域的分面式分類綜合;以及(b)用于根據(jù)所述分面式分類綜合來選擇和返回關(guān)于一次或者多次迭代的信息的復(fù)雜-自適應(yīng)方法,所述復(fù)雜-自適應(yīng)方法響應(yīng)于所述返回的信息來改變數(shù)據(jù)結(jié)構(gòu)的組織和管理。文檔編號G06F17/30GK101595476SQ200780032062公開日2009年12月2日申請日期2007年8月31日優(yōu)先權(quán)日2006年8月31日發(fā)明者彼得·斯威尼,羅伯特·古德申請人:啟創(chuàng)互聯(lián)公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1