本發(fā)明屬于信息處理技術(shù)領(lǐng)域,尤其涉及一種搜索方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)時代浪潮到來,教育行業(yè)也慢慢在開始被顛覆,在線教育產(chǎn)品也隨著這個趨勢井噴式的爆發(fā)出來,在這些產(chǎn)品之中最為突出的產(chǎn)品類型當屬題庫類和拍照答疑類,為了解決現(xiàn)在學生們作業(yè)多,作業(yè)中遇到難題等問題,智能終端類產(chǎn)品出現(xiàn)了許多題庫類和拍照答疑類的產(chǎn)品解決學生作業(yè)難題,如小猿搜題、學霸君、作業(yè)幫等等,用戶在這類產(chǎn)品上能夠搜索到他們想要的題目及其答案解析。然而,當由于目前圖像識別技術(shù)受限,使用傳統(tǒng)方法的拍照答疑類產(chǎn)品拍出來的照片經(jīng)過圖像識別后,對于識別出來的生僻漢字文本,程序無法進行有效處理,而這部份生僻字文本的存在可能使得查找出來的題目與學生們拍照上傳的題目不符,影響搜索匹配結(jié)果,導(dǎo)致題目搜索匹配的準確率不高。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提供了一種搜索方法及裝置,以解決現(xiàn)有技術(shù)中對識別出來的生僻漢字文本無法進行有效處理,從而導(dǎo)致題目搜索匹配的準確率不高的問題。
本發(fā)明實施例是這樣實現(xiàn)的,一種搜索方法,所述搜索方法包括:
獲取待搜索題目的文本信息;
對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語;
根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重;
基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
本發(fā)明實施例的另一目的在于提供一種搜索裝置,所述搜索裝置包括:
信息獲取單元,用于獲取待搜索題目的文本信息;
分詞處理單元,用于對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語;
字數(shù)權(quán)重設(shè)置單元,用于根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重;
匹配推送單元,用于基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
本發(fā)明實施例與現(xiàn)有技術(shù)相比存在的有益效果是:本發(fā)明實施例通過獲取待搜索題目的文本信息,對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語,根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重,基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果,由于生僻字單字居多,較難與其他字組成多字詞語,,因此,按分詞詞語的字數(shù)對應(yīng)的第一預(yù)設(shè)權(quán)重設(shè)置每個分詞詞語的權(quán)重,降低了生僻字在匹配過程中的影響,從而可提高題目搜索的準確率。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的一種搜索方法的實現(xiàn)流程圖;
圖2是本發(fā)明實施例提供的另一種搜索方法的實現(xiàn)流程圖;
圖3是本發(fā)明實施例提供的一種搜索裝置的結(jié)構(gòu)框圖;
圖4為本發(fā)明實施例提供的一種智能終端的結(jié)構(gòu)示意圖。
具體實施方式
以下描述中,為了說明而不是為了限定,提出了諸如特定系統(tǒng)結(jié)構(gòu)、技術(shù)之類的具體細節(jié),以便透徹理解本發(fā)明實施例。然而,本領(lǐng)域的技術(shù)人員應(yīng)當清楚,在沒有這些具體細節(jié)的其它實施例中也可以實現(xiàn)本發(fā)明。在其它情況中,省略對眾所周知的系統(tǒng)、裝置、電路以及方法的詳細說明,以免不必要的細節(jié)妨礙本發(fā)明的描述。
為了說明本發(fā)明所述的技術(shù)方案,下面通過具體實施例來進行說明。
實施例一:
圖1示出了本發(fā)明第一實施例提供的一種搜索方法的實現(xiàn)流程圖,詳述如下:
步驟s101,獲取待搜索題目的文本信息。
其中,待搜索題目的文本信息可以是用戶輸入的文本信息,也可以是待搜索題目的圖像經(jīng)轉(zhuǎn)化后生成的文本信息。
可選地,為獲取待搜索題目的文本信息,所述步驟s101具體包括:
a1、獲取待搜索題目的圖像。
a2、對所述待搜索題目的圖像進行圖像識別,生成文本信息。
具體地,用戶可通過智能終端的攝像頭拍攝待搜索題目,獲取待搜索題目的圖像,并對該圖像進行光學字符識別(opticalcharacterrecognition,ocr)(本地ocr),以將圖像上待搜索題目信息識別為文本信息。其中,ocr是指電子設(shè)備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。由于通過本地ocr識別抓取的數(shù)據(jù),因此,能夠提高數(shù)據(jù)的識別速度。用戶通過拍攝并上傳待搜索題目的圖像即可進行搜索,無需用戶手動輸入待搜索題目,提高了搜索效率,同時提高了用戶體驗。
經(jīng)過圖像識別生成文本信息時,可能會產(chǎn)生大量的亂碼、錯誤字符,導(dǎo)致搜索該文本信息查找出來的題目與用戶拍攝上傳的待搜索題目不符,因此,可選地,所述步驟a2之后還包括:
a3、若檢測到所述文本中存在亂碼或錯誤字符,則刪除所述文本信息中的亂碼或錯誤字符。其中,所述錯誤字符是指無法識別的字符。
在本發(fā)明實施例中,對生成的文本信息進行預(yù)處理,將所述文本信息中的亂碼以及錯誤刪除,從而提高待搜索題目的文本信息的準確性。
步驟s102,對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語。
其中,可采用現(xiàn)有的分詞技術(shù)對所述文本信息進行分詞處理,例如,中文分詞法。中文分詞方法包括基于字符串匹配的分詞方法、基于統(tǒng)計的分詞方法?;谧址姆衷~方法主要依據(jù)詞典的信息,按照一定的策略將待切分的漢字串與詞典中的詞條逐一匹配,若在詞典中找到該詞條,則匹配成功,否則做其它相應(yīng)的處理?;诮y(tǒng)計的分詞方法通過對語料中相鄰共現(xiàn)的各個字的組合頻度進行統(tǒng)計,計算它們的互現(xiàn)信息,互現(xiàn)信息體現(xiàn)了漢字之間結(jié)合關(guān)系的緊密程度,當緊密程度高于某一個閾值時,可判定該字組構(gòu)成一個詞?;诮y(tǒng)計的分詞方法的優(yōu)點是不受待處理文本領(lǐng)域的限制,不需要專門的詞典。進一步地,本發(fā)明實施例中,可使用ik分詞器進行分詞處理。
可選地,基于最小粒度的文本數(shù)據(jù)對所述文本信息進行分詞處理。具體地,分詞粒度可選擇粗粒度或細粒度,本發(fā)明實施例中基于最小粒度的文本數(shù)據(jù)對所述文本信息進行分詞處理。
步驟s103,根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重。
具體地,本發(fā)明實施例中,根據(jù)經(jīng)分詞處理后的每個分詞詞語的字數(shù)來分別設(shè)置每個分詞詞語的權(quán)重,分詞詞語的字數(shù)與權(quán)重成正比例關(guān)系。可選地,當分詞詞語的字數(shù)小于或等于指定字數(shù)時,所述分詞詞語的字數(shù)與權(quán)重成正比例關(guān)系,即分詞詞語的字數(shù)越少,對應(yīng)的權(quán)重越小,分詞詞語的字數(shù)越多,對應(yīng)的權(quán)重越大。當分詞詞語的字數(shù)大于指定字數(shù)時,所述分詞詞語的權(quán)重對應(yīng)固定權(quán)重。例如,當分詞詞語為1個字時,該分詞詞語的權(quán)重為0.1,當分詞詞語為2個字時,該分詞詞語的字數(shù)為0.2,當分詞詞語為3個字時,該分詞詞語的權(quán)重為0.3,當分詞詞語的字數(shù)大于3時,該分詞詞語的權(quán)重為0.5。
在本發(fā)明實施例中,由于生僻字很難與其他字組成詞語,經(jīng)過分詞處理后,字數(shù)少的分詞詞語存在生僻字的可能更大,因此,根據(jù)分詞詞語的字數(shù)設(shè)置該分詞詞語的權(quán)重,從而降低生僻字在搜索匹配過程中對搜索結(jié)果的影響。
可選地,為提高搜索效率,所述步驟s103包括:
b1、將字數(shù)少于或等于預(yù)設(shè)字數(shù)的分詞詞語刪除。
具體地,生僻字為單字的可能性很大,通過直接將字數(shù)少于或等于1的分詞詞語刪除,降低生僻字在搜索匹配過程中對搜索結(jié)果的影響,并提高搜索匹配的效率。
步驟s104,基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
其中,題庫可以為智能終端的本地題庫,也可以為云端題庫。可選地,為了提高搜索的全面性以及準確的,本發(fā)明實施例中采用云端題庫。可選地,為提高搜索推送結(jié)果的準確性,所述步驟s104具體包括:
c1、基于所述分詞詞語的字數(shù)權(quán)重,計算所述分詞詞語與題庫中的題目匹配的相似度。
c2、將匹配結(jié)果按所述相似度從高到低進行排序。
c3、基于排序后的匹配結(jié)果推送搜索結(jié)果。
具體地,在本發(fā)明實施例中,在計算分詞詞語與題庫中的題目匹配的相似度時,結(jié)合考慮分詞詞語的字數(shù)權(quán)重,根據(jù)字數(shù)權(quán)重計算分詞詞語在文本信息中的重要程度。一般地,分詞詞語的字數(shù)越少,字數(shù)權(quán)重越小,該分詞詞語在該文本信息中的重要程度越低。將相似度參考字數(shù)權(quán)重后的匹配結(jié)果按相似度從高到低排序,根據(jù)排序后的匹配結(jié)果推送搜索結(jié)果。
本發(fā)明第一實施例中,通過獲取待搜索題目的文本信息,對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語,根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重,基于所述分詞詞語的權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果,由于生僻字單字居多,較難與其他字組成多字詞語,因此,按分詞詞語的字數(shù)對應(yīng)的第一預(yù)設(shè)權(quán)重設(shè)置每個分詞詞語的權(quán)重,降低了生僻字在匹配過程中的影響,從而可提高題目搜索的準確率。同時,還可以將字數(shù)少于或等于預(yù)設(shè)字數(shù)的分詞詞語刪除,減少匹配的時間,提高搜索效率。
實施例二:
圖2示出了本發(fā)明第一實施例提供的一種協(xié)議解析方法的實現(xiàn)流程圖,詳述如下:
步驟s201,獲取待搜索題目的文本信息。
步驟s202,對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語。
步驟s203,根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重。
本實施例中,步驟s201至步驟s203的具體步驟參見實施例一步驟s101至步驟s103,在此不再贅述。
步驟s204,基于待搜索題目的文本信息,獲取待搜索題目所屬的學科。
步驟s205,根據(jù)所述學科設(shè)置預(yù)設(shè)字詞或符號對應(yīng)的學科權(quán)重。
具體地,在不同學科中,某些特定字詞、特殊符號所表達含義、在題目中的重要程度可能不同,因此,預(yù)先設(shè)置預(yù)設(shè)字詞或符號的在不同學科的學科權(quán)重,當所述分詞詞語為預(yù)設(shè)字詞或符號時,根據(jù)學科設(shè)置所述預(yù)設(shè)字詞或符號的對應(yīng)的學科權(quán)重。
步驟s206,基于所述分詞詞語的字數(shù)權(quán)重與學科權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
在本發(fā)明實施例中,所述步驟s206具體包括:
d1、基于所述分詞詞語的字數(shù)權(quán)重與學科權(quán)重,計算所述分詞詞語與題庫中的題目匹配的相似度。
d2、將匹配結(jié)果按所述相似度從高到低進行排序。
d3、基于排序后的匹配結(jié)果推送搜索結(jié)果。
具體地,在本發(fā)明實施例中,在計算分詞詞語與題庫中的題目匹配的相似度時,結(jié)合考慮分詞詞語的字數(shù)權(quán)重,當分詞詞語中存在預(yù)設(shè)字詞或特殊字符時,則同時結(jié)合考慮學科權(quán)重。首先,根據(jù)字數(shù)權(quán)重計算分詞詞語在文本信息中的重要程度。一般地,分詞詞語的字數(shù)越少,字數(shù)權(quán)重越小,該分詞詞語在該文本信息中的重要程度越低,但是,若該分詞詞語為預(yù)設(shè)字詞或特殊字符時,則再根據(jù)該分詞詞語的學科權(quán)重計算該分詞詞語在該文本信息中的重要程度。例如,數(shù)字和算術(shù)符號在數(shù)學學科中的重要程度比在語文學科中的重要程度高。將相似度參考字數(shù)權(quán)重和學科權(quán)重后的匹配結(jié)果按相似度從高到低排序,根據(jù)排序后的匹配結(jié)果推送搜索結(jié)果。
本發(fā)明第二實施例中,通過獲取待搜索題目的文本信息,對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語,根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重,基于至少一個分詞詞語的語義信息,獲取待搜索題目所屬的學科,根據(jù)所述學科設(shè)置預(yù)設(shè)字詞或符號對應(yīng)的學科權(quán)重,基于所述分詞詞語的字數(shù)權(quán)重與學科權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果,由于生僻字單字居多,較難與其他字組成多字詞語,因此,按分詞詞語的字數(shù)對應(yīng)的第一預(yù)設(shè)權(quán)重設(shè)置每個分詞詞語的權(quán)重,降低了生僻字在匹配過程中的影響,同時考慮不同學科中不同詞語含義、重要程度的不同,從而進一步提高題目搜索的準確率。
應(yīng)理解,上述實施例中各步驟的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。
實施例三:
對應(yīng)于上文實施例所述的一種搜索方法,圖3示出了本發(fā)明實施例提供的裝置的結(jié)構(gòu)框圖,該搜索裝置可應(yīng)用于智能終端,該智能終端可以包括經(jīng)無線接入網(wǎng)ran與一個或多個核心網(wǎng)進行通信的用戶設(shè)備,該用戶設(shè)備可以是移動電話(或稱為“蜂窩”電話)、具有移動設(shè)備的計算機等,例如,用戶設(shè)備還可以是便攜式、袖珍式、手持式、計算機內(nèi)置的或者車載的移動裝置,它們與無線接入網(wǎng)交換語音和/或數(shù)據(jù)。又例如,該移動設(shè)備可以包括智能手機、平板電腦、個人數(shù)字助理pda或車載電腦等。為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。
參照圖3,該搜索裝置包括:其中:信息獲取單元31,分詞處理單元32,字數(shù)權(quán)重設(shè)置單元33,匹配推送單元34,其中,
信息獲取單元31,用于獲取待搜索題目的文本信息;
分詞處理單元32,用于對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語;
字數(shù)權(quán)重設(shè)置單元33,用于根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重;
匹配推送單元34,用于基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
可選地,為獲取待搜索題目的文本信息,所述信息獲取單元31包括:
圖像獲取模塊,用于獲取待搜索題目的圖像;
信息生成模塊,用于對所述待搜索題目的圖像進行圖像識別,生成文本信息。
可選地,所述信息獲取單元31還包括:
亂碼刪除模塊,用于若檢測到所述文本中存在亂碼或錯誤字符,則刪除所述文本信息中的亂碼或錯誤字符。其中,所述錯誤字符是指無法識別的字符。
可選地,為提高搜索效率,所述權(quán)重設(shè)置單元33包括:
刪除模塊,用于將字數(shù)少于或等于預(yù)設(shè)字數(shù)的分詞詞語刪除。
可選地,所述搜索裝置還包括:
學科獲取單元,用于基于待搜索題目的文本信息,獲取待搜索題目所屬的學科;
學科權(quán)重設(shè)置單元,用于根據(jù)所述學科設(shè)置預(yù)設(shè)字詞或符號對應(yīng)的學科權(quán)重;
所述匹配推送單元34,還用于基于所述分詞詞語的字數(shù)權(quán)重和學科權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
可選地,所述匹配推送單元34包括:
匹配模塊,用于基于所述分詞詞語的字數(shù)權(quán)重,計算所述分詞詞語與題庫中的題目匹配的相似度;
排序模塊,用于將匹配結(jié)果按所述相似度從高到低進行排序;
推送模塊,用于基于排序后的匹配結(jié)果推送搜索結(jié)果。
可選地,所述匹配模塊,還用于基于所述分詞詞語的字數(shù)權(quán)重與學科權(quán)重,計算所述分詞詞語與題庫中的題目匹配的相似度。
本發(fā)明第三實施例中,本發(fā)明實施例通過獲取待搜索題目的文本信息,對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語,根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重,基于所述分詞詞語的權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果,由于生僻字一般為單字,因此,按分詞詞語的字數(shù)對應(yīng)的第一預(yù)設(shè)權(quán)重設(shè)置每個分詞詞語的權(quán)重,降低了生僻字在匹配過程中的影響,從而可提高題目搜索的準確率。
實施例四:
本發(fā)明實施例還提供一種智能終端,下面對本發(fā)明實施例中的智能終端進行描述,請參閱圖4,本發(fā)明實施例中的智能終端400包括:一個或一個以上計算機可讀存儲介質(zhì)的存儲器401、輸入單元402、顯示單元403、一個或者一個以上處理核心的處理器404、以及電源405等部件。本領(lǐng)域技術(shù)人員可以理解,圖4中示出的智能終端結(jié)構(gòu)并不構(gòu)成對智能終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。其中:
存儲器401可用于存儲軟件程序以及模塊,處理器404通過運行存儲在存儲器401的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。存儲器401可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)智能終端400的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器401可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。相應(yīng)地,存儲器401還可以包括存儲器控制器,以提供處理器404和輸入單元402對存儲器401的訪問。
輸入單元402可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標、操作桿、光學或者軌跡球信號輸入。具體地,輸入單元402包括觸敏表面4021以及其他輸入設(shè)備4022。觸敏表面4021,也稱為觸摸顯示屏或者觸控板,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸敏表面4021上或在觸敏表面4021附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動相應(yīng)的連接裝置??蛇x的,觸敏表面4021可包括觸摸檢測裝置和觸摸控制器兩個部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點坐標,再送給處理器404,并能接收處理器404發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實現(xiàn)觸敏表面4021。除了觸敏表面4021,輸入單元402還可以包括其他輸入設(shè)備4022。具體地,其他輸入設(shè)備4022可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標、操作桿等中的一種或多種。
顯示單元403可用于顯示由用戶輸入的信息或提供給用戶的信息以及智能終端400的各種圖形用戶接口,這些圖形用戶接口可以由圖形、文本、圖標、視頻和其任意組合來構(gòu)成。顯示單元403可包括顯示面板4031,可選的,可以采用液晶顯示器(lcd,liquidcrystaldisplay)、有機發(fā)光二極管(oled,organiclight-emittingdiode)等形式來配置顯示面板4031。進一步的,觸敏表面4021可覆蓋顯示面板4031,當觸敏表面4021檢測到在其上或附近的觸摸操作后,傳送給處理器404以確定觸摸事件的類型,隨后處理器404根據(jù)觸摸事件的類型在顯示面板4031上提供相應(yīng)的視覺輸出。雖然在圖4中,觸敏表面4021與顯示面板4031是作為兩個獨立的部件來實現(xiàn)輸入和輸入功能,但是在某些實施例中,可以將觸敏表面4021與顯示面板4031集成而實現(xiàn)輸入和輸出功能。
處理器404是智能終端400的控制中心,利用各種接口和線路連接整個手機的各個部分,通過運行或執(zhí)行存儲在存儲器401內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器401內(nèi)的數(shù)據(jù),執(zhí)行智能終端400的各種功能和處理數(shù)據(jù),從而對智能終端400進行整體監(jiān)控??蛇x的,處理器404可包括一個或多個處理核心;優(yōu)選的,處理器404可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖牵鲜稣{(diào)制解調(diào)處理器也可以不集成到處理器404中。
智能終端400還包括給各個部件供電的電源405(比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器404邏輯相連,從而通過電源管理系統(tǒng)實現(xiàn)管理充電、放電、以及功耗管理等功能。電源405還可以包括一個或一個以上的直流或交流電源、再充電系統(tǒng)、電源故障檢測電路、電源轉(zhuǎn)換器或者逆變器、電源狀態(tài)指示器等任意組件。
盡管未示出,智能終端400還可以包括rf(radiofrequency,射頻)電路、傳感器、音頻電路、無線保真(wifi,wirelessfidelity)模塊、攝像頭、藍牙模塊等,在此不再贅述。具體在本實施例中,智能終端400還包括一個或者一個以上程序存儲于存儲器401中,且經(jīng)配置以由一個或者一個以上處理器404執(zhí)行述一個或者一個以上程序,其中包含用于執(zhí)行以下操作的指令:
獲取待搜索題目的文本信息;
對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語;
根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重;
基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
假設(shè)上述為第一種可能的實施方式,則在第一種可能的實施方式作為基礎(chǔ)而提供的第二種可能的實施方式中,上述獲取待搜索題目的文本信息,包括:
獲取待搜索題目的圖像;
對所述待搜索題目的圖像進行圖像識別,生成文本信息。
在上述第一種可能的實施方式作為基礎(chǔ)而提供的第三種可能的實施方式中,上述根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重,包括:
將字數(shù)少于或等于預(yù)設(shè)字數(shù)的分詞詞語刪除。
在上述第一種可能的實施方式作為基礎(chǔ)而提供的第四種可能的實施方式中,在上述根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重之后,還包括:
基于待搜索題目的文本信息,獲取待搜索題目所屬的學科;
根據(jù)所述學科設(shè)置預(yù)設(shè)字詞或符號對應(yīng)的學科權(quán)重;
此時,所述基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果,包括:
基于所述分詞詞語的字數(shù)權(quán)重和學科權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果。
在上述第一種可能的實施方式或者上述第二種可能的實施方式或者上述第三種可能的實施方式或者上述第四種可能的實施方式作為基礎(chǔ)而提供的第五種可能的實施方式中,上述基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果,包括:
基于所述分詞詞語的字數(shù)權(quán)重,計算所述分詞詞語與題庫中的題目匹配的相似度;
將匹配結(jié)果按所述相似度從高到低進行排序;
基于排序后的匹配結(jié)果推送搜索結(jié)果。
需要說明的是,上述智能終端具體可以是智能手機、平板電腦、pc、pda、筆記本或其它能夠智能終端,此處不作限定。
上述智能終端中可以如上述方法實施例中的智能終端,可以用于實現(xiàn)上述方法實施例中的全部技術(shù)方案,其各個功能模塊的功能可以根據(jù)上述方法實施例中的方法具體實現(xiàn),其具體實現(xiàn)過程可參照上述實施例中的相關(guān)描述,此處不再贅述。
由上可見,本發(fā)明實施例通過獲取待搜索題目的文本信息,對所述文本信息進行分詞處理,并獲取經(jīng)分詞處理后的全部分詞詞語,根據(jù)各個分詞詞語的字數(shù),設(shè)置每個分詞詞語對應(yīng)的字數(shù)權(quán)重,基于所述分詞詞語的字數(shù)權(quán)重,將分詞詞語與題庫中的題目進行匹配,并基于匹配結(jié)果推送搜索結(jié)果,由于生僻字一般為單字,因此,按分詞詞語的字數(shù)對應(yīng)的第一預(yù)設(shè)權(quán)重設(shè)置每個分詞詞語的權(quán)重,降低了生僻字在匹配過程中的影響,從而可提高題目搜索的準確率。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,僅以上述各功能單元、模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能單元、模塊完成,即將所述裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能單元或模塊,以完成以上描述的全部或者部分功能。實施例中的各功能單元、模塊可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中,上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。另外,各功能單元、模塊的具體名稱也只是為了便于相互區(qū)分,并不用于限制本申請的保護范圍。上述系統(tǒng)中單元、模塊的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述或記載的部分,可以參見其它實施例的相關(guān)描述。
本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。
在本發(fā)明所提供的實施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的系統(tǒng)實施例僅僅是示意性的,例如,所述模塊或單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通訊連接可以是通過一些接口,裝置或單元的間接耦合或通訊連接,可以是電性,機械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明實施例各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。