檢索設(shè)備和檢索方法
【專(zhuān)利摘要】根據(jù)實(shí)施例,提供一種檢索設(shè)備和檢索方法。設(shè)備包括獲取部、分割部、提取部、計(jì)算部和檢索部。獲取部被配置成獲取多個(gè)第一點(diǎn)序列。分割部被配置成將多個(gè)第一點(diǎn)序列的每一個(gè)分割成多個(gè)第二點(diǎn)序列。提取部被配置成提取多個(gè)第二點(diǎn)序列中的每一個(gè)的特征向量。計(jì)算部被配置成基于多個(gè)第二點(diǎn)序列之間的最佳路徑,計(jì)算多個(gè)第一點(diǎn)序列之間的距離,多個(gè)第二點(diǎn)序列屬于多個(gè)第一點(diǎn)序列中的每一個(gè)。檢索部被配置成使用距離來(lái)檢索與多個(gè)第一點(diǎn)序列相對(duì)應(yīng)的數(shù)據(jù)。
【專(zhuān)利說(shuō)明】檢索設(shè)備和檢索方法
[0001] 相關(guān)申請(qǐng)的交叉引用
[0002] 本申請(qǐng)是基于并且要求2013年5月31日提交的第2013-116419號(hào)日本專(zhuān)利申請(qǐng) 的優(yōu)先權(quán);其全部?jī)?nèi)容通過(guò)引用而結(jié)合在本文中。
【技術(shù)領(lǐng)域】
[0003] 這里所述的實(shí)施例一般與檢索設(shè)備和檢索方法有關(guān)。
【背景技術(shù)】
[0004] 已知一種從數(shù)據(jù)庫(kù)檢索與由點(diǎn)序列組成的查詢(xún)相匹配或類(lèi)似的數(shù)據(jù)的技術(shù)。
【發(fā)明內(nèi)容】
[0005] 實(shí)施例的目的在于提供一種檢索設(shè)備,該檢索設(shè)備能夠在提高檢索精確度的同時(shí) 抑制檢索速度的減少。
[0006] 根據(jù)實(shí)施例,設(shè)備包括獲取部、分割部、提取部、計(jì)算部和檢索部。獲取部被配置成 獲取多個(gè)第一點(diǎn)序列。分割部被配置成將多個(gè)第一點(diǎn)序列的每一個(gè)分割成多個(gè)第二點(diǎn)序 列。提取部被配置成提取多個(gè)第二點(diǎn)序列中的每一個(gè)的特征向量。計(jì)算部被配置成基于多 個(gè)第二點(diǎn)序列之間的最佳路徑來(lái)計(jì)算多個(gè)第一點(diǎn)序列之間的距離,該多個(gè)第二點(diǎn)序列屬于 多個(gè)第一點(diǎn)序列中的每一個(gè)。檢索部被配置成使用距離來(lái)檢索與多個(gè)第一點(diǎn)序列相對(duì)應(yīng)的 數(shù)據(jù)。
[0007] 根據(jù)如上所述的設(shè)備,檢索速度的減少能夠被抑制并且檢索精確度能夠被提高。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0008] 圖1是圖解實(shí)施例的典型檢索設(shè)備的配置圖;
[0009] 圖2是圖解實(shí)施例中的筆劃的實(shí)例的圖;
[0010] 圖3是圖解實(shí)施例中的筆劃的實(shí)例的圖;
[0011] 圖4是圖解實(shí)施例中的墨水?dāng)?shù)據(jù)(ink data)的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的圖;
[0012] 圖5是圖解表示實(shí)施例中的副筆劃的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的圖;
[0013] 圖6是圖解實(shí)施例中的DP匹配的實(shí)例的圖;
[0014] 圖7是圖解實(shí)施例的檢索實(shí)例的圖;
[0015] 圖8是圖解實(shí)施例的顯示實(shí)例的圖;
[0016] 圖9是圖解實(shí)施例的處理實(shí)例的流程圖;
[0017] 圖10是圖解實(shí)施例的檢索設(shè)備的典型硬件配置的圖;
[0018] 圖11是圖解實(shí)施例的檢索設(shè)備的實(shí)例的圖。
【具體實(shí)施方式】
[0019] 下面參照附圖將給出實(shí)施例的詳細(xì)描述。
[0020] 在實(shí)施例中,將給出以下情況的描述:由用戶(hù)手寫(xiě)的手寫(xiě)字符串被用作從預(yù)先書(shū) 寫(xiě)的(例如,大量的)手寫(xiě)文檔進(jìn)行檢索的查詢(xún)。這里,在實(shí)施例中,主要地,例如,將給出字 符串的描述。但是,查詢(xún)可以是自由手寫(xiě)的,由用戶(hù)繪畫(huà)的諸如線(xiàn)或者標(biāo)記的字符碼沒(méi)有被 分割給自由手寫(xiě)。任何方法可以被用作用于通過(guò)用戶(hù)指定手寫(xiě)字符串的方法。例如,用戶(hù)可 以實(shí)際上手寫(xiě)字符串以指定查詢(xún)。用戶(hù)可以從現(xiàn)存的手寫(xiě)文檔選擇要被用作查詢(xún)的部分。 用戶(hù)可以從用于查詢(xún)的模板中選擇要被用作查詢(xún)的部分??梢允褂眠@些方法的結(jié)合。
[0021] 圖1是圖解實(shí)施例的典型檢索設(shè)備10的配置圖。如圖1所示,檢索設(shè)備10包括 輸入單元11、獲取單元13、墨水?dāng)?shù)據(jù)存儲(chǔ)單元15、分割單元17、提取單元19、特征向量存儲(chǔ) 單元21、計(jì)算部23、檢索單元25、顯示控制單元27和顯示單元29。
[0022] 輸入單元11能夠通過(guò)例如輸入裝置來(lái)實(shí)現(xiàn),輸入裝置允許手寫(xiě)輸入,輸入裝置諸 如是觸摸屏、觸摸板、電子筆或者計(jì)算機(jī)鼠標(biāo)。獲取單元13、分割單元17、提取單元19、計(jì)算 部23、檢索單元25和顯示控制單元27可以通過(guò)例如由諸如中央處理單元(CPU)的處理單 元執(zhí)行程序來(lái)實(shí)現(xiàn),即,通過(guò)軟件來(lái)實(shí)現(xiàn),或者可以通過(guò)諸如集成電路(1C)的硬件來(lái)實(shí)現(xiàn)。 換句話(huà)說(shuō),這些單元可以通過(guò)結(jié)合軟件和硬件來(lái)實(shí)現(xiàn)。墨水?dāng)?shù)據(jù)存儲(chǔ)單元15和特征向量存 儲(chǔ)單元21可以通過(guò)例如存儲(chǔ)裝置來(lái)實(shí)現(xiàn),該存儲(chǔ)裝置允許磁的、光的或電的存儲(chǔ),例如可 以是硬盤(pán)驅(qū)動(dòng)器(HDD)、固態(tài)驅(qū)動(dòng)器(SSD)、存儲(chǔ)卡、光盤(pán)或者隨機(jī)存取存儲(chǔ)器(RAM)。顯示 單元29可以通過(guò)例如諸如觸摸顯示器和液晶顯示器的顯示裝置來(lái)實(shí)現(xiàn)。
[0023] 輸入單元11將多個(gè)第一點(diǎn)序列輸入到檢索設(shè)備10。在實(shí)施例中,輸入單元11將 多個(gè)筆劃(多個(gè)第一點(diǎn)序列的一個(gè)實(shí)例)輸入到檢索設(shè)備10,筆劃是用戶(hù)以字符和類(lèi)似的內(nèi) 容為意圖而手寫(xiě)(繪畫(huà))或指定的。但是,不應(yīng)該以限定意義來(lái)解釋。在實(shí)施例中,輸入單元 11是觸摸屏。假定用戶(hù)使用用于在觸摸屏上手寫(xiě)的記錄筆或者手指,以便輸入多個(gè)筆劃。 但是,不應(yīng)該以限定意義來(lái)解釋。輸入單元11可以通過(guò)例如觸摸板、電子筆或者計(jì)算機(jī)鼠 標(biāo)來(lái)實(shí)現(xiàn)。
[0024] 筆劃意思是通過(guò)用戶(hù)手寫(xiě)的一個(gè)筆劃,即,從記錄筆或者手指與觸摸屏的輸入表 面開(kāi)始接觸的時(shí)間直到記錄筆或者手指舉起離開(kāi)輸入表面(從筆向下?tīng)顟B(tài)直到筆向上狀 態(tài))的軌跡。例如,表示筆劃的數(shù)據(jù)包括在記錄筆或者手指相對(duì)于觸摸屏的輸入表面的軌跡 上的采樣點(diǎn)(時(shí)間序列坐標(biāo)值)、軌跡的外接矩形和軌跡的筆壓力。
[0025] 具體地,當(dāng)記錄筆或者手指相對(duì)于觸摸屏的輸入表面變成筆向下?tīng)顟B(tài)時(shí),觸摸屏 對(duì)記錄筆或者手指相對(duì)于輸入表面的軌跡上點(diǎn)、軌跡的筆壓力和從開(kāi)始輸入軌跡的時(shí)間所 經(jīng)過(guò)的時(shí)間進(jìn)行周期性采樣。當(dāng)記錄筆或者手指變成筆向上狀態(tài)時(shí),觸摸屏提取軌跡的外 接矩形,以便生成表示筆劃的數(shù)據(jù),并且將該數(shù)據(jù)輸入到檢索設(shè)備10。
[0026] 圖2和圖3是圖解實(shí)施例中的筆劃的實(shí)例的圖。在圖2所示的實(shí)例中,圖解筆劃 的采樣點(diǎn)。在圖3所示的實(shí)例中,圖解在圖2中所示的采樣點(diǎn)按時(shí)間順序經(jīng)過(guò)線(xiàn)性插值的 筆劃。在圖2和圖3所示的實(shí)例中,周期性地執(zhí)行采樣(以固定周期)。但是,由于用戶(hù)的書(shū) 寫(xiě)速度而改變了采樣點(diǎn)之間的坐標(biāo)距離。這里,筆劃中的采樣點(diǎn)的數(shù)目對(duì)于每個(gè)筆劃是不 同的。
[0027] 獲取單元13獲取多個(gè)第一點(diǎn)序列。在實(shí)施例中,獲取單元13從輸入單元11順序 地獲取筆劃輸入,以便獲取多個(gè)筆劃。當(dāng)筆劃的獲得完成時(shí),即,當(dāng)從輸入單元11完成筆劃 的輸入時(shí),獲取單元13將墨水?dāng)?shù)據(jù)存儲(chǔ)在墨水?dāng)?shù)據(jù)存儲(chǔ)單元15中,該墨水?dāng)?shù)據(jù)為表示獲取 的筆劃的一組數(shù)據(jù)。這里,從輸入單元11輸入筆劃的完成包括用戶(hù)結(jié)束書(shū)寫(xiě)手寫(xiě)字符串的 情況,進(jìn)行手寫(xiě)字符串的保存操作的情況,以及類(lèi)似的情況。即,墨水?dāng)?shù)據(jù)起到表示對(duì)于每 個(gè)頁(yè)面(文檔)的筆劃組的數(shù)據(jù)。
[0028] 在獲取單元13將多個(gè)筆劃組存儲(chǔ)在墨水?dāng)?shù)據(jù)存儲(chǔ)單元15中的情況下,墨水?dāng)?shù)據(jù) 能夠與頁(yè)面(文檔)ID相關(guān)聯(lián),以便識(shí)別個(gè)別筆劃組。換句話(huà)說(shuō),獲取單元13能夠使表示筆 劃的數(shù)據(jù)與筆劃ID相關(guān)聯(lián),以便識(shí)別個(gè)別筆劃。
[0029] 圖4是圖解實(shí)施例中的墨水?dāng)?shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的圖,并且圖解通過(guò)獲取單元 13在墨水?dāng)?shù)據(jù)存儲(chǔ)單元15中存儲(chǔ)的墨水?dāng)?shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。在實(shí)施例中,墨水?dāng)?shù)據(jù)通過(guò)三層 數(shù)據(jù)結(jié)構(gòu)被表示,該三層數(shù)據(jù)結(jié)構(gòu)包括墨水?dāng)?shù)據(jù)結(jié)構(gòu),筆劃結(jié)構(gòu)和點(diǎn)結(jié)構(gòu)。但是,不應(yīng)該以 限定意義來(lái)解釋。
[0030] 墨水?dāng)?shù)據(jù)結(jié)構(gòu)是包括構(gòu)成筆劃組的筆劃的總數(shù)和構(gòu)成筆劃組的各個(gè)筆劃的筆劃 結(jié)構(gòu)的結(jié)構(gòu)。筆劃結(jié)構(gòu)是包括以下的結(jié)構(gòu):構(gòu)成筆劃的采樣點(diǎn)的總數(shù)、開(kāi)始輸入筆劃的開(kāi)始 時(shí)間(筆向下?tīng)顟B(tài)開(kāi)始的時(shí)間)、筆劃的外接矩形、和構(gòu)成筆劃的各個(gè)采樣點(diǎn)的點(diǎn)結(jié)構(gòu)。在實(shí) 施例中,筆劃的外接矩形具有包含筆劃的最小面積的矩形形狀。但是,不應(yīng)該以限定意義來(lái) 解釋。點(diǎn)結(jié)構(gòu)是包括X坐標(biāo)、y坐標(biāo)、筆壓力和距離采樣點(diǎn)的開(kāi)始時(shí)間的時(shí)間差的結(jié)構(gòu)。這 里,包括X坐標(biāo)和y坐標(biāo)的坐標(biāo)系統(tǒng)能夠是這樣的坐標(biāo)系統(tǒng),原點(diǎn)在觸摸屏的輸入表面上的 左上角(角度),X坐標(biāo)的值朝著觸摸屏的右側(cè)變得更大,并且y坐標(biāo)的值朝著觸摸屏的下側(cè) 變得更大。
[0031] 在觸摸屏不能對(duì)筆壓力進(jìn)行采樣的情況下,或者在筆壓力不被用于隨后的處理的 情況下,點(diǎn)結(jié)構(gòu)中的壓力可以被省略或者指示無(wú)效的值可以被設(shè)定成點(diǎn)結(jié)構(gòu)中的筆壓力。 在觸摸屏不能對(duì)諸如開(kāi)始時(shí)間和距離開(kāi)始時(shí)間的時(shí)間差的時(shí)間進(jìn)行采樣的情況下,或者在 時(shí)間不被用于隨后的處理的情況下,指示點(diǎn)結(jié)構(gòu)的次序可以被設(shè)定成點(diǎn)結(jié)構(gòu)中的時(shí)間差, 點(diǎn)結(jié)構(gòu)中的時(shí)間差可以被省略,或者指示無(wú)效的值可以被設(shè)定成點(diǎn)結(jié)構(gòu)中的時(shí)間差。
[0032] 在筆劃結(jié)構(gòu)的每個(gè)項(xiàng)目中,可以書(shū)寫(xiě)實(shí)際數(shù)據(jù)。為了分別管理來(lái)自彼此的墨水?dāng)?shù) 據(jù)結(jié)構(gòu)的數(shù)據(jù)和筆劃結(jié)構(gòu)的數(shù)據(jù),對(duì)應(yīng)筆劃結(jié)構(gòu)的鏈接信息可以被寫(xiě)入墨水?dāng)?shù)據(jù)結(jié)構(gòu)中的 筆劃結(jié)構(gòu)的區(qū)域中。類(lèi)似地,在點(diǎn)結(jié)構(gòu)的每個(gè)項(xiàng)目中,可以書(shū)寫(xiě)實(shí)際數(shù)據(jù)。為了分別管理來(lái) 自彼此的筆劃結(jié)構(gòu)的數(shù)據(jù)和點(diǎn)結(jié)構(gòu)的數(shù)據(jù),對(duì)應(yīng)點(diǎn)結(jié)構(gòu)的鏈接信息可以被寫(xiě)入筆劃結(jié)構(gòu)中 的點(diǎn)結(jié)構(gòu)的區(qū)域中。
[0033] 分割單元17將通過(guò)獲取單元13獲取的多個(gè)第一點(diǎn)序列中的每一個(gè)分割成多個(gè)第 二點(diǎn)序列。在實(shí)施例中,分割單元17將構(gòu)成筆劃組(多個(gè)筆劃)的每個(gè)筆劃分割成多個(gè)副筆 劃,筆劃組由存儲(chǔ)在墨水?dāng)?shù)據(jù)存儲(chǔ)單元15中的墨水?dāng)?shù)據(jù)指示。分割單元17將表示各個(gè)副 筆劃的數(shù)據(jù)和指示哪個(gè)數(shù)據(jù)表示這個(gè)數(shù)據(jù)所屬于的筆劃的鏈接信息添加到墨水?dāng)?shù)據(jù)存儲(chǔ) 單元15中存儲(chǔ)的墨水?dāng)?shù)據(jù)。
[0034] 圖5是圖解表示實(shí)施例中的副筆劃的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的圖,并且圖解通過(guò) 分割單元17添加到墨水?dāng)?shù)據(jù)存儲(chǔ)單元15中的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。在實(shí)施例中,表示副筆劃 的數(shù)據(jù)通過(guò)兩層數(shù)據(jù)結(jié)構(gòu)被表示,兩層數(shù)據(jù)結(jié)構(gòu)包括副筆劃結(jié)構(gòu)和點(diǎn)結(jié)構(gòu)。但是,不應(yīng)該以 限定意義來(lái)解釋。
[0035] 副筆劃結(jié)構(gòu)是包括以下的結(jié)構(gòu):構(gòu)成副筆劃的采樣點(diǎn)的總數(shù)、開(kāi)始輸入副筆劃的 開(kāi)始時(shí)間、對(duì)于副筆劃所屬于的筆劃的筆劃結(jié)構(gòu)的指針、副筆劃的外接矩形、和構(gòu)成副筆劃 的各個(gè)采樣點(diǎn)的點(diǎn)結(jié)構(gòu)。
[0036] 分割單元17將筆劃分割成多個(gè)副筆劃,因此例如多個(gè)副筆劃的各個(gè)曲率變成等 于或小于閾值。這里,筆劃的曲率可以在每個(gè)采樣點(diǎn)被計(jì)算。但是,采樣點(diǎn)的數(shù)目依賴(lài)于筆 劃的尺寸和采樣率而改變。因此,在這樣的情形下,允許計(jì)算曲率的點(diǎn)對(duì)于每個(gè)筆劃改變。
[0037] 因此,分割單元17通過(guò)固定數(shù)量的采樣點(diǎn)來(lái)近似筆劃,并且進(jìn)行重新采樣,以便 確保采樣點(diǎn)之間的恒定距離。分割單元17例如通過(guò)線(xiàn)性插值計(jì)算重新采樣點(diǎn)的坐標(biāo)值,以 便確保采樣點(diǎn)之間的恒定距離。在這種情況下,在分割單元17減少重新采樣點(diǎn)的數(shù)目時(shí), 筆劃被近似成直線(xiàn)。
[0038] 例如,在作為分割目標(biāo)的筆劃S中從重新采樣點(diǎn)Sbase到重新采樣點(diǎn)Si的曲率C s (base,i )由方程式(1)來(lái)表不。
[0039]
【權(quán)利要求】
1. 一種設(shè)備,其特征在于,所述設(shè)備包含: 獲取部,所述獲取部被配置成獲取多個(gè)第一點(diǎn)序列; 分割部,所述分割部被配置成將所述多個(gè)第一點(diǎn)序列中的每一個(gè)分割成多個(gè)第二點(diǎn)序 列; 提取部,所述提取部被配置成提取所述多個(gè)第二點(diǎn)序列中的每一個(gè)的特征向量; 計(jì)算部,所述計(jì)算部被配置成基于所述多個(gè)第二點(diǎn)序列之中的最佳路徑,來(lái)計(jì)算所述 多個(gè)第一點(diǎn)序列之間的距離,所述多個(gè)第二點(diǎn)序列屬于所述多個(gè)第一點(diǎn)序列中的每一個(gè), 和 檢索部,所述檢索部被配置成使用所述距離來(lái)檢索與所述多個(gè)第一點(diǎn)序列相對(duì)應(yīng)的數(shù) 據(jù)。
2. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述分割部被配置成將所述多個(gè)第一點(diǎn)序列中的每一個(gè)分割成所述多個(gè)第二點(diǎn)序列, 以使所述多個(gè)第二點(diǎn)序列中的每一個(gè)的曲率變成等于或小于閾值。
3. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述分割部被配置成將所述多個(gè)第一點(diǎn)序列中的每一個(gè)分割成所述多個(gè)第二點(diǎn)序列, 以使所述多個(gè)第二點(diǎn)序列中的每一個(gè)的長(zhǎng)度變成等于或小于閾值。
4. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述分割部被配置成將所述多個(gè)第一點(diǎn)序列中的每一個(gè)分割成所述多個(gè)第二點(diǎn)序列, 以使所述多個(gè)第二點(diǎn)序列的數(shù)目變成第一數(shù)目。
5. 如權(quán)利要求1所述的設(shè)備,其特征在于,進(jìn)一步包含顯示控制器,所述顯示控制器被 配置成在顯示單元上顯示檢索的數(shù)據(jù)。
6. 如權(quán)利要求5所述的設(shè)備,其特征在于, 所述多個(gè)第一點(diǎn)序列構(gòu)成由用戶(hù)手寫(xiě)的字符串的筆劃組, 所述多個(gè)第二點(diǎn)序列中的每一個(gè)與所述筆劃組的筆劃的副筆劃相對(duì)應(yīng), 所述數(shù)據(jù)是指示字符串的字符串?dāng)?shù)據(jù), 所述獲取部被配置成通過(guò)順序地獲取構(gòu)成所述筆劃組的筆劃,來(lái)獲取所述筆劃組, 所述分割部被配置成將構(gòu)成所述筆劃組的每個(gè)所述筆劃分割成多個(gè)副筆劃, 所述計(jì)算部被配置成基于屬于構(gòu)成所述筆劃組的每個(gè)所述筆劃的所述副筆劃之間的 最佳路徑,來(lái)計(jì)算構(gòu)成所述筆劃組的所述筆劃之間的距離, 所述檢索部被配置成使用所述距離,來(lái)檢索與所述筆劃組相對(duì)應(yīng)的所述字符串?dāng)?shù)據(jù), 并且 所述顯示控制器被配置成在所述顯示單元上顯示檢索的所述字符串?dāng)?shù)據(jù)。
7. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述獲取部被配置成獲取由用戶(hù)指定的所述多個(gè)第一點(diǎn)序列。
8. -種方法,其特征在于,包含: 獲取多個(gè)第一點(diǎn)序列; 將所述多個(gè)第一點(diǎn)序列中的每一個(gè)分割成多個(gè)第二點(diǎn)序列; 提取所述多個(gè)第二點(diǎn)序列中的每一個(gè)的特征向量; 基于屬于所述第一點(diǎn)序列中的每一個(gè)的所述多個(gè)第二點(diǎn)序列之間的最佳路徑,來(lái)計(jì)算 所述多個(gè)第一點(diǎn)序列之間的距離;并且 使用所述距離來(lái)檢索與所述多個(gè)第一點(diǎn)序列相對(duì)應(yīng)的數(shù)據(jù)。
【文檔編號(hào)】G06F17/30GK104216940SQ201410082975
【公開(kāi)日】2014年12月17日 申請(qǐng)日期:2014年3月7日 優(yōu)先權(quán)日:2013年5月31日
【發(fā)明者】柴田智行, 登內(nèi)洋次郎 申請(qǐng)人:株式會(huì)社東芝