一種生成多媒體概念圖的方法

文檔序號：6575221閱讀：174來源：國知局

專利名稱：一種生成多媒體概念圖的方法
技術領域：
本發(fā)明屬于人機交互領域，具體涉及一種生成支持多通道輸入的多媒體概念圖的方法。
背景技術：
概念圖是某個主題的概念及其關系的圖形化表示，是用來組織和表征知識的工具(參考文獻Novak, J.D. and Cafias， A.J. The Theory Underlying Concept Maps and How to Construct Them, Technical Report IHMC CmapTools 2006-01, Florida Institute for Human and Machine Cognition, 2006.)。它包括概念和概念之間的關系，使用節(jié)點表示概念、連線表示概念之間的關系。概念圖由一系列具有時序信息的手繪筆劃組成，每個筆劃由一組包含二維坐標信息的點序列組成，概念圖以直觀形象的方式進行表達和思考，非常接近人的自然思維過程。它有助于創(chuàng)造性思維，可以用于表示知識、組織知識、協(xié)同與溝通、教育等領域(參考文獻Novak, J.D. Learning, Creating, and Using Knowledge: Concept Maps as Facilitative Tools in Schools and Corporations. Lawrence Erlbaum Associates: Mahwah， NJ， 1998.)。關于概念圖在上述領域作用的研究正逐漸成為熱點。2004年，首屆概念圖國際會議在西班牙召開，該會議主要側重于研究如何繪制概念圖、概念圖在教育、協(xié)同等方面的應用、計算機輔助的概念圖工具的作用等。目前出現(xiàn)了一些計算機輔助的概念圖繪制工具，如MindManager, Inspiration, FreeMind。這些工具主要采用基于鍵盤和鼠標的交互方式制作概念圖，其中一些工具支持包含圖片和超鏈接的多媒體概念圖。目前，也出現(xiàn)了基于數(shù)字筆的手繪概念圖制作方法，可以提取用戶用數(shù)字筆繪制的概念圖中的結構。人與人之間的交流通過使用多個通道而變得簡單，多通道界面也從多個通道的使用中獲益，它拓寬了用戶到計算機的通信帶寬(參考文獻董士海，王堅，戴國忠.人機交互和多通道用戶界面[M].北京科學出版社，1999.)。近年來，隨著計算設備的不斷發(fā)展，越來越多的設備(如智能手機、UMPC、 TabletPC等)開始支持數(shù)字筆、語音、視頻、圖片等類型的輸入。人與計算設備之間的交流也可以通過使用多個通道變得更加簡單。目前已有的概念圖制作方法，大部分是基于鍵盤和鼠標的交互方式，部分方法采用數(shù) 字筆的交互方式。它們并沒有充分利用多通道輸入的優(yōu)勢。發(fā)明內容本發(fā)明的目的在于利用多通道輸入，提供一種生成多媒體概念圖的方法，從而提高生成概念圖的效率?；诙嗝襟w概念圖，用戶可以將多媒體信息以概念圖的方式組織，從而支持多媒體信息的快速査看。本發(fā)明概念圖中的多媒體對象由多個通道采集得到，這些通道既可以是配備數(shù)字筆的設備上的通道，也可以是獨立的多媒體設備。配備數(shù)字筆的設備，如MID (MobileInemet Device,移動互聯(lián)網(wǎng)設備)、PDA (Personal Digital Assistant個人數(shù)碼助理)、Tablet PC 等；獨立的多媒體設備，如麥克風、攝像機、相機和攝像頭等。具體來說，本發(fā)明的技術方案如下1、用數(shù)字筆創(chuàng)建包含節(jié)點和連線的概念圖，同時多媒體設備通過設備驅動程序創(chuàng)建多媒體對象，并保存到音頻文件、圖片文件或視頻文件。多媒體設備可以是配備了數(shù)字筆的設備，也可以是支持采集多媒體對象的設備；本發(fā) 明創(chuàng)建的多媒體對象包括視頻、音頻、圖片。保存多媒體文件時，用戶可以修改多媒體對象的名稱并為多媒體對象手動添加屬性 (如作者信息、備注等)，以更好的描述多媒體對象，并便于多媒體對象的檢索和察看。每個屬性的具體內容為文本，文本的添加方式可以采用傳統(tǒng)的鍵盤輸入，也可以通過手寫輸入或語音輸入，并將輸入識別為文本。2、采用解析裝置解析上述概念圖的結構，獲得概念圖中的節(jié)點、連線以及節(jié)點連線之間的關系，利用識別裝置識別出概念圖中節(jié)點含義，得到步驟1)創(chuàng)建的概念圖節(jié)點對應的正規(guī)漢字或數(shù)字。這里可以通過輸入支持多字符識別的識別引擎(如漢王手寫識別引擎)進行識別；也可以通過將手繪概念圖的一個節(jié)點切分為多個字符的裝置，進行識別。解析概念圖的方法如圖3所示，具體如下1)預處理。將繪制的概念圖中距離小于某閾值的筆劃合并為筆劃塊，得到由筆劃塊組成的概念圖，并構建表示筆劃塊間的遠近關系的圖，創(chuàng)建的圖中節(jié)點對應筆劃塊，連線上的值為相鄰節(jié)點對應的筆劃塊之間的距離；即構建的圖中的節(jié)點對應創(chuàng)建的概念圖的筆劃塊，構建圖中相鄰節(jié)點之間的距離對應概念圖中筆劃塊間的距離；2) 圖劃分為子圖。采用圖劃分的方法(可參考文獻Karypis, G. and Kumar, V. hMETIS: A Hypergraph Partitioning Package (Version 1.5.3) [EB/OL]. http:〃glaros.dtc.umn.edu/gkhome/views/metis/hmetis/download.htm1.)對預處理得至!j的圖進行分割，將上述表示筆劃塊間遠近關系的圖分割為幾個子圖，從而可以降低提取手繪概念圖中節(jié)點和連線筆劃塊的時間復雜度；3) 提取每個子圖中的筆劃塊。采用動態(tài)規(guī)劃的方法提取手繪概念圖中的節(jié)點筆劃塊和連線筆劃塊，由于手繪概念圖中節(jié)點筆劃塊密度往往大于連線筆劃塊、屬于同一節(jié)點的筆劃塊的距離小于屬于不同節(jié)點的筆劃塊間的距離、節(jié)點與連線交替出現(xiàn)，動態(tài)規(guī)劃方法利用了手繪概念圖的筆劃塊密度、筆劃塊間距離以及筆劃塊的上下文信息。4) 根據(jù)手繪概念圖中的筆劃塊，構建節(jié)點和連線筆劃塊之間是否相鄰的關系，解析出概念圖的結構。3、分析創(chuàng)建的概念圖與多媒體對象屬性之間的關系，査找與概念圖節(jié)點匹配的多媒體對象，建立多媒體對象與手繪概念圖節(jié)點之間的關聯(lián)，因而生成一個包含多媒體對象的多媒體概念圖。多媒體對象的主要屬性可以描述為<名稱，類型，創(chuàng)建時間，作者信息，備注>。這些屬性可以由系統(tǒng)自動設定或者由用戶修改得到。多媒體對象的類型包括視頻、音頻和圖片。每類多媒體對象均包括時間屬性，且設定與多媒體類型相關的關鍵詞列表。視頻相關的關鍵詞包括視頻、錄像等，音頻相關的關鍵詞包括錄音、音樂、聲音等，圖片相關的關鍵詞包括合影、照片、拍照等。其它的關鍵詞可以由用戶自由添加。多媒體對象往往與手繪概念圖中的葉子節(jié)點相關聯(lián)。對每個概念圖的葉節(jié)點，査找其相關的多媒體對象并建立多媒體節(jié)點，如圖4所示。其過程如下1) 在多媒體對象的時間屬性中査找該葉節(jié)點的時間節(jié)點，若未找到，則將所有多媒體對象加到候選多媒體對象集合，轉步驟2;否則，設定時間節(jié)點的時間為該葉節(jié)點內容的時間；建立多媒體對象與該葉節(jié)點的關聯(lián)；2) 對候選多媒體對象集合中的每個多媒體對象，將其名稱、類型、作者信息、備注等屬性以及該多媒體對象類型相關的關鍵詞分別與葉節(jié)點的識別結果進行匹配。若葉節(jié)點的識別結果與多媒體對象的某個屬性存在相同的字或詞，則建立該多媒體對象與當前葉節(jié) 點的關聯(lián)；若葉結點識別結果與某多媒體對象的所有屬性均無相同的字或詞，則該葉節(jié)點與該多媒體對象之間無關聯(lián)；3) 建立與葉節(jié)點相關的多媒體對象與葉節(jié)點間的關聯(lián)，即為創(chuàng)建的概念圖節(jié)點添加多媒體對象的縮略圖，并提供縮略圖指向多媒體對象的鏈接?？s略圖的一種定義如下音頻對象的縮略圖對應音頻對象的名稱，圖片對象的縮略圖為縮小的圖片，視頻對象的縮略圖為視頻第一幀對應的縮小的圖片。多媒體節(jié)點關聯(lián)的對象的可視化效果可以由用戶定義的其它方式，如呈現(xiàn)每個多媒體對象的名稱。指向多媒體對象的鏈接可以在用戶點擊多媒體對象縮略圖的時候，用相應的多媒體播放器打開多媒體對象文件進行察看。進一步，本發(fā)明還可以采用筆手勢對生成的多媒體概念圖進行編輯，如刪除節(jié)點、移動節(jié)點、交換節(jié)點、放縮等。筆手勢是指由數(shù)字筆的筆劃作為控制命令，與多媒體概念圖交互。不同的筆手勢對應不同的交互含義。筆手勢的識別可以采用常用的Rubine手勢識別算法(參考文獻Rubine D. Specifying gestures by example. ACM SIGGRAPH Computer Graphics, 1991， 25(4)， 329-337.)和易于實現(xiàn)的$1手勢識別算法(參考文獻Wobbrock， J.O., Wilson, A.D. and Li, Y. Gestures without libraries, toolkits or training: a $1 recognizer for user interface prototypes. In Proc. UIST 2007,159-168.)。綜上，和現(xiàn)有技術相比，本發(fā)明具有的優(yōu)點和積極效果如下1、本發(fā)明支持用數(shù)字筆繪制概念圖，釆用筆手勢的交互方式操縱多媒體概念圖，模擬傳統(tǒng)的記筆記方式，符合用戶的習慣，更加自然和高效。2、本發(fā)明支持多個交互通道的輸入，得到各種多媒體信息，從而可以生成包含各種多媒體信息的多媒體概念圖。3、本發(fā)明支持自動建立手繪概念圖節(jié)點與多媒體對象之間的關聯(lián)，將手繪概念圖轉化為多媒體概念圖。

圖1本發(fā)明生成多媒體概念圖的示意圖。圖2本發(fā)明多媒體對象的建立過程。圖3本發(fā)明解析概念圖的流程圖。圖4本發(fā)明多媒體對象與手繪概念圖節(jié)點之間建立關聯(lián)的過程。圖5本發(fā)明一個手繪概念圖的實例及由本發(fā)明提取的結構和含義。(a)為創(chuàng)建的概念圖；(b)為解析后的概念圖。圖6加入縮略圖的多媒體概念圖實例。圖7本發(fā)明編輯多媒體概念圖的實例圖。(a)刪除節(jié)點；(b)節(jié)點交換；(C)放大節(jié)點；(d)縮小節(jié)點；(e)粘貼節(jié)點。圖8本發(fā)明概念圖編輯的節(jié)點交換手勢。圖9本發(fā)明具體實施例生成的多媒體概念圖。
具體實施方式
為了使本技術領域的人員更好的理解本發(fā)明，下面采用一個具體的實施例來對本發(fā)明作進一步的詳細說明。以配備了數(shù)字筆、攝像頭和麥克風的MID多媒體設備為例。用數(shù)字筆在MID上創(chuàng)建了一個為期一天的某會議計劃的概念圖(如圖5(a)所示)。 MID通過解析裝置解析上述創(chuàng)建的概念圖結構，分別采用預處理、圖劃分為子圖、提取筆劃塊和生成概念圖結構四個階段，獲得用戶創(chuàng)建的概念圖結構(如圖5(b)所示)。之后，通過手寫識別引擎對手繪概念圖的節(jié)點進行識別，得到手繪概念圖節(jié)點的含義(如圖5(c) 所示)，并獲得概念圖中的節(jié)點、連線以及節(jié)點連線之間的關系。這樣，用戶解析出的概念圖結構能夠被MID所理解。在會議當天，用戶為整個會議創(chuàng)建了一些多媒體內容。如上午開會的時候，用戶為會議錄制了視頻；會議結束的時候，用戶為所有參會者留影作為紀念。這些多媒體內容通過使用MID或者其它設備(如攝像機)采集并保存。會議結束后，這些多媒體內容被導入到MID上。用戶編輯這些多媒體對象，修改視頻名字為"會議錄像"，對照片(名稱為"MG一0001.jpg")未做任何修改。用戶打開最初的手繪概念圖，通過時間屬性建立多媒體對象與手繪概念圖中節(jié)點的關聯(lián)，得到多媒體概念圖(如圖6所示)。由于視頻的創(chuàng)建時間為10: 35,它與多媒體概念圖中節(jié)點"10: 30" 連接的葉節(jié)點"開會"在時間上較為接近，且頁節(jié)點的識別結果"開會"與"會議錄像" 是相關的，因此錄像與"開會"自動建立關聯(lián)。而葉節(jié)點"合影"的時間為17: 30,照片的拍攝時間為17: 25，兩者的時間間隔較小。另外，葉節(jié)點的識別結果"合影"與圖片相關的關鍵詞中的"合影" 一致。因而，照片與葉節(jié)點"合影"建立關聯(lián)。為可視化多媒體對象與手繪概念圖節(jié)點間的關聯(lián)，在概念圖節(jié)點右側顯示多媒體對象的縮略圖。"開會"后面顯示的是"會議錄像"視頻的第一幀對應的圖像的縮略圖。"合影"后面顯示的為照片的縮略圖。通過點擊縮略圖，可以進行多媒體信息的詳細瀏覽。本發(fā)明可以采用筆手勢的交互方式對建立的多媒體概念圖進行編輯整理。筆手勢為用數(shù)字筆繪制的筆劃作為控制命令。圖7表示了一些筆手勢的實例，包括刪除節(jié)點、節(jié)點交換、放大、縮小、粘貼手勢，其中用圓圈圈中的點為筆手勢的起始點。這些筆手勢需要作用在已選中的待操作的對象上。圖8示例了用戶使用節(jié)點交換手勢將兩個節(jié)點對換的情況。用戶若希望交換多媒體概念圖中的兩個節(jié)點，首先需要選中一個待交換的節(jié)點，之后在另外一個待交換的節(jié)點上完成節(jié)點交換手勢，則兩個節(jié)點將互換。即若要將10: 30開會的節(jié)點與13: OO開會的節(jié)點交換，首先選中10: 30開會的節(jié)點，并在13: 00開會的節(jié)點上做交換的筆手勢，就完成了節(jié)點交換。多媒體概念圖將更新其結構，反映節(jié)點交換后的多媒體概念圖。本實施例對建立的多媒體概念圖實現(xiàn)編輯后，得到了如圖9所示的一個多媒體概念圖，其中圖中一些節(jié)點包含了圖片和視頻內容。以上對本發(fā)明所述的生成多媒體概念圖的方法進行了詳細的說明，但顯然本發(fā)明的具體實現(xiàn)形式并不局限于此。對于本技術領域的一般技術人員來說，在不背離本發(fā)明所述方法的精神和權利要求范圍的情況下對它進行的各種顯而易見的改變都在本發(fā)明的保護范圍之內。
權利要求
1、一種生成多媒體概念圖的方法，其步驟包括1)用數(shù)字筆創(chuàng)建包含節(jié)點和連線的概念圖，同時利用多媒體設備創(chuàng)建多媒體對象，保存在多媒體設備上；2)采用解析裝置解析上述概念圖結構，獲得概念圖的節(jié)點、連線及節(jié)點連線間的關系，利用識別裝置識別出概念圖中節(jié)點對應的漢字或數(shù)字；3)通過匹配多媒體對象的屬性與概念圖節(jié)點識別結果的關系，建立多媒體對象與概念圖節(jié)點間的關聯(lián)，生成多媒體概念圖。
2、如權利要求l所述的一種生成多媒體概念圖的方法，其特征在于步驟2)中解析裝置中解析概念圖結構的方法為a) 概念圖中距離小于一定閾值的筆劃合并為筆劃塊，以概念圖的筆劃塊為節(jié)點，相鄰筆劃塊間的距離為節(jié)點連線值，構建表示筆劃塊間關系的圖；b) 采用圖劃分的方法將上述表示筆劃塊間關系的圖分割為幾個子圖； C)采用動態(tài)規(guī)劃的方法提取各子圖中節(jié)點筆劃塊和連線筆劃塊；d)以提取的節(jié)點筆劃塊和連線筆劃塊，構建節(jié)點和連線筆劃塊之間的相鄰關系，解析出概念圖結構。
3、如權利要求l所述的一種生成多媒體概念圖的方法，其特征在于步驟2)中所述識別裝置為支持多字符識別的識別引擎或具有切分概念圖節(jié)點分為多個字符的裝置。
4、如權利要求1所述的一種生成多媒體概念圖的方法，其特征在于采用筆手勢對上述步驟3)生成的概念圖進行編輯，所述編輯方法包括刪除節(jié)點、交換節(jié)點、放大縮小節(jié)點及粘貼節(jié)點。
5、如權利要求1所述的一種生成多媒體概念圖的方法，其特征在于所述多媒體設備為配備了數(shù)字筆的設備或支持采集多媒體對象的設備。
6、如權利要求5所述的一種生成多媒體概念圖的方法，其特征在于所述多媒體設備包括MID、 PDA、 Tablet PC、麥克風、攝像機、相機和攝像頭。
7、如權利要求1所述的一種生成多媒體概念圖的方法，其特征在于所述多媒體對象包括音頻、圖片和視頻。
8、如權利要求7所述的一種生成多媒體概念圖的方法，其特征在于步驟3)中所述關聯(lián) 是指在概念圖節(jié)點添加多媒體對象的縮略圖，所述音頻對象的縮略圖為音頻對象的名稱，圖片對象的縮略圖為縮小的圖片，視頻對象的縮略圖為視頻第一幀對應的縮小圖片。
9、如權利要求1所述的一種生成多媒體概念圖的方法，其特征在于匹配多媒體對象的屬性與概念圖節(jié)點識別結果關系的步驟為-a) 將概念圖葉節(jié)點相鄰節(jié)點的時間節(jié)點與多媒體對象的時間屬性分別進行匹配；若一葉節(jié)點相鄰節(jié)點的時間節(jié)點與多媒體對象的時間屬性相同，則設定時間節(jié)點的時間為該葉節(jié)點的時間；建立多媒體對象與該葉節(jié)點的關聯(lián)；b) 否則將概念圖葉節(jié)點的識別結果分別與每個多媒體對象的名稱、類型、作者信息和備注屬性以及該多媒體對象類型相關的關鍵詞進行匹配；若一葉節(jié)點識別結果與多媒體對象的一屬性相同，則該多媒體對象與當前葉節(jié)點關聯(lián)。
全文摘要
本發(fā)明屬于人機交互領域，具體涉及一種生成多媒體概念圖的方法。本發(fā)明利用數(shù)字筆創(chuàng)建概念圖，并通過多通道輸入多媒體對象，將輸入的多媒體信息以概念圖的方式組織，生成包含各種多媒體信息的多媒體概念圖，同時能夠采用筆手勢的交互方式編輯多媒體概念圖，支持多媒體信息的快速查看。本發(fā)明支持用數(shù)字筆繪制概念圖，模擬傳統(tǒng)的記筆記方式，符合用戶的習慣，更加自然和高效；本發(fā)明支持自動建立手繪概念圖節(jié)點與多媒體對象之間的關聯(lián)，將用數(shù)字筆創(chuàng)建的概念圖轉化為多媒體概念圖，提高生成多媒體概念圖的效率。
文檔編號G06T11/80GK101620738SQ20091008961
公開日2010年1月6日申請日期2009年7月24日優(yōu)先權日2009年7月24日
發(fā)明者姜映映, 王宏安, 豐田申請人:中國科學院軟件研究所

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：田豐;姜映映;王宏安
技術所有人：中國科學院軟件研究所
我是此專利的發(fā)明人

上一篇：一種動態(tài)隨機測試方法
上一篇：一種基于傅氏頻譜的漢字圖像紋理特征提取方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種生成多媒體概念圖的方法