簡歷搜索方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種簡歷搜索方法,包括:接收用于從簡歷數(shù)據(jù)庫中進行簡歷搜索的關(guān)鍵詞和所述關(guān)鍵詞的相關(guān)詞集;據(jù)所述相關(guān)詞集中的相關(guān)詞的數(shù)量選擇權(quán)重計算方式,并基于所選擇的權(quán)重計算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷搜索時每一個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值;將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述每一個相關(guān)詞的權(quán)重值提交給搜索引擎,以從所述簡歷數(shù)據(jù)庫中搜索出簡歷。相應(yīng)地,本發(fā)明還公開了一種簡歷搜索裝置。采用本發(fā)明實施例,平衡關(guān)鍵詞和相關(guān)詞在簡歷搜索過程中所占的權(quán)重,提高簡歷搜索的效率。
【專利說明】
簡歷搜索方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及計算機信息檢索領(lǐng)域,尤其設(shè)及一種簡歷捜索方法和裝置。
【背景技術(shù)】
[0002] 通常在對簡歷進行捜索匹配過程中,一般是通過關(guān)鍵詞+相關(guān)詞檢進行檢索的,但 是發(fā)明人在實施過程中發(fā)現(xiàn)該方案存在W下問題:在進行簡歷捜索時捜索引擎會將關(guān)鍵詞 和相關(guān)詞取相同的權(quán)重值進行捜索,那么命中的頻次決定了捜索出來的簡歷的排序,則捜 索結(jié)果極有可能偏向某個頻次較高的相關(guān)詞,另一方面,當(dāng)相關(guān)詞的數(shù)量大大多于關(guān)鍵詞 時,則在檢索過程中關(guān)鍵詞可能會被相關(guān)詞淹沒,難W突出關(guān)鍵詞相對于相關(guān)詞在捜索出 簡歷過程中作為主要作檢索關(guān)鍵詞的作用。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明實施例提出一種簡歷捜索方法,平衡關(guān)鍵詞和相關(guān)詞在簡歷捜索過程中所 占的權(quán)重,提高簡歷捜索的效率。
[0004] 本發(fā)明實施例提出一種簡歷捜索方法,包括:
[0005] 接收用于從簡歷數(shù)據(jù)庫中進行簡歷捜索的關(guān)鍵詞和相關(guān)詞集;其中,所述相關(guān)詞 集記載有多個相關(guān)詞,W及每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度;
[0006] 根據(jù)所述相關(guān)詞集中的相關(guān)詞的數(shù)量選擇權(quán)重計算方式,并基于所選擇的權(quán)重計 算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷捜索時每一個 相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值;
[0007] 將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述每一個相關(guān)詞的 權(quán)重值提交給捜索引擎,W從所述簡歷數(shù)據(jù)庫中捜索出簡歷。
[0008] 進一步地,當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量處于上限詞量和下限詞量之間時, 選擇第一方式作為權(quán)重計算方式,則基于所選擇的權(quán)重計算方式,根據(jù)所述每一個相關(guān)詞 與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷捜索時每一個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵 詞所占的權(quán)重值,具體為:
[0009] 根據(jù)第一權(quán)重公式
計算出所述相關(guān)詞集中第i個相關(guān)詞在進行簡歷捜索 時所占的權(quán)重值Wi;其中,rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的最大 值;
[0010]根據(jù)第二權(quán)重公式Wa = HI X SiimW,計算出所述關(guān)鍵詞在進行簡歷捜索時所占的權(quán) 重值Wa;其中,A為所述關(guān)鍵詞,m為第一權(quán)重系數(shù),sumW為所述相關(guān)詞集中所有相關(guān)詞的權(quán) 重值的總和。
[0011]進一步地,當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量不處于所述上限詞量和所述下限詞 量之間時,選擇第二方式作為權(quán)重計算方式,則基于所選擇的權(quán)重計算方式,根據(jù)所述每一 個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷捜索時每一個相關(guān)詞所占的權(quán)重值及 所述關(guān)鍵詞所占的權(quán)重值,曰化^ ?
[0012] 根據(jù)基準分值公J 計算出所述相關(guān)詞集中第i個相關(guān)詞的基準 分值Si;其中,ri為所述相關(guān)詞集中的第i個相關(guān)詞的相關(guān)度;rmin為在所述相關(guān)詞集中所記 載的所有相關(guān)詞的相關(guān)度的最小值;rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān) 度的最大值;
[0013] 對所述所有相關(guān)詞的基準分值進行求和,獲得基準分值總值sum;
[0014] 根據(jù)第S權(quán)重公式WA=5+logi.5(sum+l),計算出所述關(guān)鍵詞在進行簡歷捜索時所 占的權(quán)重值Wa ;其中,A為所述關(guān)鍵詞;
[0015] 判斷所述第i個相關(guān)詞的基準分值是否大于WA/n;若是,則根據(jù)第四權(quán)重公式
,計算出所述第i個相關(guān)詞在進行簡歷捜索時所占的權(quán)重值Wi;若否,貝U 根據(jù)第五權(quán)重公式
,計算出所述第i個相關(guān)詞在進行簡歷捜索時所占的權(quán) 重值Wi;其中,n為第二權(quán)重系數(shù);k為所述相關(guān)詞集中的相關(guān)詞的數(shù)量。
[0016] 再進一步地,在所述判斷所述第i個相關(guān)詞的基準分值是否大于WaA之前,還包 括:
[0017] 根據(jù)均值公J
計算基準分值均值冢:;其中,r為所述所有相關(guān)詞 的相關(guān)度的平均值;
[0018] 對于所述相關(guān)詞集中的第i個相關(guān)詞,判斷所述第i個相關(guān)詞的基準分值Si是否大 于所述基準分值均值S :
[0019] 若是,通過更新公式= IOx (、S;-引,更新所述第i個相關(guān)詞的基準分值Si。
[0020] 更進一步地,所述將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述 每一個相關(guān)詞所占的權(quán)重值提交給捜索引擎,W從所述簡歷數(shù)據(jù)庫中捜索出簡歷,具體為:
[0021] 根據(jù)捜索引擎的權(quán)重關(guān)聯(lián)格式,將所述關(guān)鍵詞所占的權(quán)重值和所述關(guān)鍵詞相關(guān)聯(lián) 作為第一組合,W及將所述每一個相關(guān)詞所占的權(quán)重值與其對應(yīng)的相關(guān)詞相關(guān)聯(lián)作為第二 組合;
[0022] 將所述第一組合和所述第二組合提交給捜索引擎,W供所述捜索引擎從所述簡歷 數(shù)據(jù)庫中捜索出簡歷,并根據(jù)所述捜索引擎內(nèi)置的排序算法顯示捜索出的簡歷;其中,所述 簡歷中包含的所述關(guān)鍵詞和所述每一個相關(guān)詞W高亮形式顯示。
[0023] 相應(yīng)地,本發(fā)明實施例還提供一種簡歷捜索裝置,包括:
[0024] 接收模塊,用于接收用于從簡歷數(shù)據(jù)庫中進行簡歷捜索的關(guān)鍵詞和相關(guān)詞集;其 中,所述相關(guān)詞集記載有多個相關(guān)詞,W及每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度;
[0025] 權(quán)重計算模塊,用于根據(jù)所述相關(guān)詞集中的相關(guān)詞的數(shù)量選擇權(quán)重計算方式,并 基于所選擇的權(quán)重計算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進 行簡歷捜索時每一個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值;
[0026] 捜索模塊,用于將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述每 一個相關(guān)詞的權(quán)重值提交給捜索引擎,W從所述簡歷數(shù)據(jù)庫中捜索出簡歷。
[0027] 進一步地,所述權(quán)重計算模塊包括:
[0028] 第一計算單元,用于當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量處于上限詞量和下限詞量 之間時,選擇第一方式作為權(quán)重計算方式,根據(jù)第一權(quán)重公式
。計算出所述相關(guān)詞 集中第i個相關(guān)詞在進行簡歷捜索時所占的權(quán)重值Wi;其中,rmax為在所述相關(guān)詞集中所記 載的所有相關(guān)詞的相關(guān)度的最大值;
[0029] 第二計算單元,用于根據(jù)第二權(quán)重公式Wa=HI X sumW,計算出所述關(guān)鍵詞在進行簡 歷捜索時所占的權(quán)重值Wa;其中,A為所述關(guān)鍵詞,m為第一權(quán)重系數(shù),sumW為所述相關(guān)詞集 中所有相關(guān)詞的權(quán)重值的總和。
[0030] 進一步地,所述權(quán)重計算模塊還包括:
[0031] 基準分值計算單元,用于當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量不處于所述上限詞量 和所述下限詞量之間時,選擇第二方式作為權(quán)重計算方式,根據(jù)基準分值公式
計算出所述相關(guān)詞集中第i個相關(guān)詞的基準分值Si;其中,ri為所述相關(guān) 詞集中的第i個相關(guān)詞的相關(guān)度;rmin為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的 最小值;rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的最大值;
[0032] 求和計算單元,用于對所述所有相關(guān)詞的基準分值進行求和,獲得基準分值總值 sum;
[0033] 第S計算單元,用于根據(jù)第S權(quán)重公式WA = 5+logi.日(sum+1),計算出所述關(guān)鍵詞 在進行簡歷捜索時所占的權(quán)重值Wa;其中,A為所述關(guān)鍵詞;
[0034] 第四計算單元,用于判斷所述第i個相關(guān)詞的基準分值是否大于WaA;若是,則根 據(jù)第四權(quán)重公式
,計算出所述第i個相關(guān)詞在進行簡歷捜索時所占的 權(quán)重值Wi;若否,則根據(jù)第五權(quán)重公式
計算出所述第i個相關(guān)詞在進行簡 歷捜索時所占的權(quán)重值Wi;其中,n為第二權(quán)重系數(shù);k為所述相關(guān)詞集中的相關(guān)詞的數(shù)量。
[0035] 再進一步地,所述權(quán)重計算模塊還包括:
[0036] 均值計算單元,用于在所述判斷所述第i個相關(guān)詞的基準分值是否大于WaA之前, 根據(jù)均值公支
計算基準分值均值容;其中,F(xiàn)為所述所有相關(guān)詞的相關(guān)度 的平均值;
[0037] 判斷單元,用于對于所述相關(guān)詞集中的第i個相關(guān)詞,判斷所述第i個相關(guān)詞的基 準分值Si是否大于所述基準分值均值玄:
[0038] 更新單元,用于當(dāng)判斷所述第i個相關(guān)詞的基準分值Si是大于所述平均分值亥時, 通過更新公式S二10x(& -幻,運新所述第i個相關(guān)詞的基準分值Si。
[0039] 更進一步地,所述捜索模塊具體包括:
[0040] 權(quán)重相聯(lián)單元,用于根據(jù)捜索引擎的權(quán)重關(guān)聯(lián)格式,將所述關(guān)鍵詞所占的權(quán)重值 和所述關(guān)鍵詞相關(guān)聯(lián)作為第一組合,W及將所述每一個相關(guān)詞所占的權(quán)重值與其對應(yīng)的相 關(guān)詞相關(guān)聯(lián)作為第二組合;
[0041] 捜索顯示單元,用于將所述第一組合和所述第二組合提交給捜索引擎,W供所述 捜索引擎從所述簡歷數(shù)據(jù)庫中捜索出簡歷,并根據(jù)所述捜索引擎內(nèi)置的排序算法顯示捜索 出的簡歷;其中,所述簡歷中包含的所述關(guān)鍵詞和所述每一個相關(guān)詞W高亮形式顯示。
[0042] 實施本發(fā)明實施例,具有如下有益效果:
[0043] 本發(fā)明實施例提供的簡歷捜索方法和裝置,能根據(jù)相關(guān)詞的數(shù)量選取不同的權(quán)重 計算算法,來進行計算關(guān)鍵詞和相關(guān)詞在捜索過程所占的權(quán)重,充分考慮相關(guān)詞的數(shù)量對 關(guān)鍵詞在檢索過程的影響,平衡關(guān)鍵詞和相關(guān)詞在簡歷捜索過程中所占的權(quán)重,避免在權(quán) 重計算過程中出現(xiàn)當(dāng)相關(guān)詞過多時導(dǎo)致關(guān)鍵詞權(quán)重過大或過小,當(dāng)相關(guān)詞過少時關(guān)鍵詞的 權(quán)重過大或過小的權(quán)重失衡情況,使得簡歷檢索的過程更為合理,減少再次進行簡歷捜索 的發(fā)生,提高簡歷捜索的效率。
【附圖說明】
[0044] 圖1是本發(fā)明提供的簡歷捜索方法的一個實施例的流程示意圖;
[0045] 圖2是本發(fā)明提供的簡歷捜索裝置的一個實施例的結(jié)構(gòu)示意圖;
[0046] 圖3是本發(fā)明提供的簡歷捜索裝置的權(quán)重計算模塊的一個實施例的結(jié)構(gòu)示意圖
[0047] 圖4是本發(fā)明提供的簡歷捜索裝置的捜索模塊的一個實施例的結(jié)構(gòu)示意圖。
【具體實施方式】
[0048] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0049] 參見圖1,是本發(fā)明提供的簡歷捜索方法的一個實施例的流程示意圖,該方法包括 W下步驟:
[0050] SI,接收用于從簡歷數(shù)據(jù)庫中進行簡歷捜索的關(guān)鍵詞和相關(guān)詞集;其中,所述相關(guān) 詞集記載有多個相關(guān)詞,W及每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度;
[0051] S2,根據(jù)所述相關(guān)詞集中的相關(guān)詞的數(shù)量選擇權(quán)重計算方式,并基于所選擇的權(quán) 重計算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷捜索時每 一個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值;
[0052] S3,將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述每一個相關(guān)詞 的權(quán)重值提交給捜索引擎,W從所述簡歷數(shù)據(jù)庫中捜索出簡歷。
[0053] 進一步地,上述步驟S2中,當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量處于上限詞量和下 限詞量之間時,選擇第一方式作為權(quán)重計算方式,則基于所選擇的權(quán)重計算方式,根據(jù)所述 每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷捜索時每一個相關(guān)詞所占的權(quán)重 值及所述關(guān)鍵詞所占的權(quán)重心曰心的實施過程為:
[0054] 根據(jù)第一權(quán)重公^5 計算出所述相關(guān)詞集中第i個相關(guān)詞在進行簡歷捜索 時所占的權(quán)重值Wi;其中,rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的最大 值;
[0055] 根據(jù)第二權(quán)重公式Wa = HI X sumW,計算出所述關(guān)鍵詞在進行簡歷捜索時所占的權(quán) 重值Wa;其中,A為所述關(guān)鍵詞,m為第一權(quán)重系數(shù),sumW為所述相關(guān)詞集中所有相關(guān)詞的權(quán) 重值的總和。
[0056] 需要說明的是,采用上述權(quán)重計算算法,進行計算關(guān)鍵詞和相關(guān)詞的權(quán)重值,計算 過程簡單,能快速計算出關(guān)鍵詞和相關(guān)詞的權(quán)重值,但本權(quán)重計算算法僅適合相關(guān)詞的數(shù) 量適當(dāng)時,才能夠即能快速計算出權(quán)重值,并能確保關(guān)鍵詞所占的權(quán)重值處于恰當(dāng)?shù)膮^(qū)間 內(nèi)。而當(dāng)相關(guān)詞的數(shù)量過多或過小時,即不在上述上限詞量和下限詞量的范圍之內(nèi),采用第 二權(quán)重計算算法進行計算,具體為步驟S4的實施過程。
[0057] 進一步地,上述步驟S2中,當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量不處于所述上限詞 量和所述下限詞量之間時,選擇第二方式作為權(quán)重計算方式,則基于所選擇的權(quán)重計算方 式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷捜索時每一個相關(guān) 詞所占的權(quán)重值及所述關(guān)鎮(zhèn)詞所占的巧雷值.具體的實施過程為:
[0化引根據(jù)基準分值公;
計算出所述相關(guān)詞集中第i個相關(guān)詞的基準 分值Si;其中,ri為所述相關(guān)詞集中的第i個相關(guān)詞的相關(guān)度;rmin為在所述相關(guān)詞集中所記 載的所有相關(guān)詞的相關(guān)度的最小值;rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān) 度的最大值;
[0059] 對所述所有相關(guān)詞的基準分值進行求和,獲得基準分值總值sum;
[0060] 根據(jù)第^權(quán)重公式胖4=5 + 1〇邑1.5(311111+1),計算出所述關(guān)鍵詞在進行簡歷捜索時所 占的權(quán)重值Wa ;其中,A為所述關(guān)鍵詞;
[0061] 判斷所述第i個相關(guān)詞的基準分值是否大于WA/n;若是,則根據(jù)第四權(quán)重公式
,計算出所述第i個相關(guān)詞在進行簡歷捜索時所占的權(quán)重值Wi;若否,貝U 根據(jù)第五權(quán)重公式
計算出所述第i個相關(guān)詞在進行簡歷捜索時所占的權(quán) 重值Wi;其中,n為第二權(quán)重系數(shù);k為所述相關(guān)詞集中的相關(guān)詞的數(shù)量。
[0062] 需要說明的是,計算相關(guān)詞集中每個相關(guān)詞的基準分值的目的是將相關(guān)詞的相關(guān) 度基于同一個基準,W-個分值的形式,表示該相關(guān)詞與關(guān)鍵詞的相關(guān)程度,該基準值優(yōu)選 為rmax-rmin+1;第一權(quán)重公式采用對數(shù)形式的公式,在基準分值總值增長過快時,關(guān)鍵詞的 權(quán)重值仍保持緩和增長,因而,可W在相關(guān)詞相對較多的情況下,避免關(guān)鍵詞所占權(quán)重過大 運種情況的出現(xiàn);在進行相關(guān)詞的權(quán)重計算時,分別采用第二權(quán)重公式和第=權(quán)重公式進 行計算,是考慮到當(dāng)相關(guān)詞的基準分值過大和過小運兩種情況出現(xiàn)時,避免計算出該相關(guān) 詞的權(quán)重值大于關(guān)鍵詞的權(quán)重值,或者是大大小于關(guān)鍵詞的權(quán)重值,也就是說在檢索簡歷 過程中,能避免相關(guān)詞過多把關(guān)鍵詞淹沒、W及出現(xiàn)關(guān)鍵詞過于突出的情況;對于第二權(quán)重 系數(shù)的設(shè)置,可由實際情況來決定,一般取值為2或4 .
[0063] 再進一步地,上述步驟S2的具體實施過程還包括W下步驟:
[0064] 在所述判斷所述第i個相關(guān)詞的基準分值是否大于WA/n之前,根據(jù)均值公式 十算基準分值均值夏;其中,F(xiàn)為所述所有相關(guān)詞的相關(guān)度的平均值;
[0065]
對于所述相關(guān)詞集中的第i個相關(guān)詞,判斷所述第i個相關(guān)詞的基準分值Si是否大 于所述基準分值均值玄;
[0066] 若是,通過更新公;更新所述第i個相關(guān)詞的基準分值Si。
[0067] 需要說明的是,將該相關(guān)詞集中的相關(guān)詞的相關(guān)度均值基于同一個基準,且該基 準與上述基準相同,目的是W-個分值的形式,表示該相關(guān)詞集與關(guān)鍵詞的平均相關(guān)程度; 當(dāng)一個相關(guān)詞與關(guān)鍵詞的相關(guān)程度(即基準分值)大于該相關(guān)詞集與關(guān)鍵詞的平均相關(guān)程 度(平均分值)時,可將該相關(guān)詞與關(guān)鍵詞的相關(guān)程度,與該相關(guān)詞集與關(guān)鍵詞的平均相關(guān) 程度運兩個相關(guān)程度的差異值放大10倍,作為該相關(guān)詞與關(guān)鍵詞的相關(guān)程度的基準分值; 反之,則保持該相關(guān)詞與關(guān)鍵詞的相關(guān)程度的原基準分值不變,運種方式更能確切地表達 該相關(guān)詞與關(guān)鍵詞的相關(guān)程度,使得相關(guān)詞與關(guān)鍵詞之間的關(guān)系更為合理。
[0068] 更進一步地,上述步驟S3的具體實施過程為:
[0069] 根據(jù)捜索引擎的權(quán)重關(guān)聯(lián)格式,將所述關(guān)鍵詞所占的權(quán)重值和所述關(guān)鍵詞相關(guān)聯(lián) 作為第一組合,W及將所述每一個相關(guān)詞所占的權(quán)重值與其對應(yīng)的相關(guān)詞相關(guān)聯(lián)作為第二 組合;
[0070] 將所述第一組合和所述第二組合提交給捜索引擎,W供所述捜索引擎從所述簡歷 數(shù)據(jù)庫中捜索出簡歷,并根據(jù)所述捜索引擎內(nèi)置的排序算法顯示捜索出的簡歷;其中,所述 簡歷中包含的所述關(guān)鍵詞和所述每一個相關(guān)詞W高亮形式顯示。
[0071] 需要說明的是,一般采用的捜索引擎為SOlr捜索引擎,則上述權(quán)重關(guān)聯(lián)格式,可依 據(jù)如下格式進行關(guān)聯(lián):關(guān)鍵詞~關(guān)鍵詞權(quán)重、相關(guān)詞r相關(guān)詞1權(quán)重、相關(guān)詞相關(guān)詞2權(quán) 重……
[0072] 實施本發(fā)明實施例的簡歷捜索方法,能根據(jù)相關(guān)詞的數(shù)量選取不同的權(quán)重計算算 法,來進行計算關(guān)鍵詞和相關(guān)詞在捜索過程所占的權(quán)重,充分考慮相關(guān)詞的數(shù)量對關(guān)鍵詞 在檢索過程的影響,平衡關(guān)鍵詞和相關(guān)詞在簡歷捜索過程中所占的權(quán)重,避免在權(quán)重計算 過程中出現(xiàn)當(dāng)相關(guān)詞過多時導(dǎo)致關(guān)鍵詞權(quán)重過大或過小,當(dāng)相關(guān)詞過少時關(guān)鍵詞的權(quán)重過 大或過小的權(quán)重失衡情況,使簡歷檢索的過程更為合理,減少再次進行簡歷捜索的發(fā)生,提 高簡歷捜索的效率。
[0073] 參見圖2,是本發(fā)明提供的簡歷捜索裝置的一個實施例的結(jié)構(gòu)示意圖,該簡歷捜索 裝置能實施上述簡歷捜索方法的全部流程,其具體結(jié)構(gòu)如下:
[0074] 接收模塊10,用于接收用于從簡歷數(shù)據(jù)庫中進行簡歷捜索的關(guān)鍵詞和相關(guān)詞集; 其中,所述相關(guān)詞集記載有多個相關(guān)詞,W及每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度;
[0075] 權(quán)重計算模塊20,用于根據(jù)所述相關(guān)詞集中的相關(guān)詞的數(shù)量選擇權(quán)重計算方式, 并基于所選擇的權(quán)重計算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在 進行簡歷捜索時每一個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值;
[0076] 捜索模塊30,用于將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述 每一個相關(guān)詞的權(quán)重值提交給捜索引擎,W從所述簡歷數(shù)據(jù)庫中捜索出簡歷。
[0077] 進一步地,參見圖3,是本發(fā)明提供的簡歷捜索裝置的權(quán)重計算模塊的一個實施例 的結(jié)構(gòu)示意圖;該權(quán)重計算模塊20包括:
[0078] 第一計算單元21,用于當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)胃h限詞量和下限詞 量之間時,選擇第一方式作為權(quán)重計算方式,根據(jù)第一權(quán)重公式
,計算出所述相關(guān) 詞集中第i個相關(guān)詞在進行簡歷捜索時所占的權(quán)重值Wi;其中,rmax為在所述相關(guān)詞集中的 所有相關(guān)詞的相關(guān)度的最大值;
[0079] 第二計算單元22,用于根據(jù)第二權(quán)重公式WA=mXsumW,計算出所述關(guān)鍵詞在進行 簡歷捜索時所占的權(quán)重值Wa;其中,A為所述關(guān)鍵詞,m為第一權(quán)重系數(shù),sumW為所述相關(guān)詞 集中所有相關(guān)詞的權(quán)重值的總和。
[0080] 進一步地,如圖3所示,上述權(quán)重計算模塊20還包括:
[0081] 基準分值計算單元23,用于當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量不處于所述上限詞 量和所述下限詞量之間時,選擇第二方式作為權(quán)重計算方式,根據(jù)基準分值公式
計算出所述相關(guān)詞集中第i個相關(guān)詞的基準分值Si;其中,ri為所述相關(guān) 詞集中的第i個相關(guān)詞的相關(guān)度;rmin為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的 最小值;rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的最大值;
[0082] 求和計算單元24,用于對所述所有相關(guān)詞的基準分值進行求和,獲得所述相關(guān)詞 集的基準分值總值S皿;
[0083] 第^計算單元25,用于根據(jù)第^權(quán)重公式胖4=5+1〇邑1.5(3皿+1),計算出所述關(guān)鍵 詞在進行簡歷捜索時所占的權(quán)重值Wa;其中,A為所述關(guān)鍵詞;
[0084] 第四計算單元26,用于判斷所述第i個相關(guān)詞的基準分值是否大于WaA;若是,貝U 根據(jù)第四權(quán)重公式
,計算出所述第i個相關(guān)詞在進行簡歷捜索時所占的 權(quán)重值Wi;若否,則根據(jù)第五權(quán)重公式
計算出所述第i個相關(guān)詞詞在進行 簡歷捜索時所占的權(quán)重值Wi;其中,n為第二權(quán)重系數(shù);k為所述相關(guān)詞集中的相關(guān)詞的數(shù) 量。
[0085] 再進一步地,如圖3所示,上述權(quán)重計算模塊20還包括:
[0086] 均值計算單元27,用于在所述判斷所述第i個相關(guān)詞的基準分值是否大于WaA之 前,根據(jù)平均分值公式
計算基準分值均值玄;其中,F(xiàn)為所述相關(guān)詞集中的 所有相關(guān)詞的相關(guān)度的平均值;
[0087] 判斷單元28,用于對于所述相關(guān)詞集中的第i個相關(guān)詞,判斷所述第i個相關(guān)詞的 基準分值Si是否大于所述基準分值均值S;
[0088] 更新單元29,用于當(dāng)判斷所述第i個相關(guān)詞的基準分值Si是大于所述基準分值均 值玄時,通過更新公式.S二10X侶,-,更新所述第i個相關(guān)詞的基準分值Si。
[0089] 更進一步地,參見圖4,是本發(fā)明提供的簡歷捜索裝置的捜索模塊的一個實施例的 結(jié)構(gòu)示意圖;該捜索模塊30具體包括:
[0090] 權(quán)重相聯(lián)單元31,用于根據(jù)捜索引擎的權(quán)重關(guān)聯(lián)格式,將所述關(guān)鍵詞所占的權(quán)重 值和所述關(guān)鍵詞相關(guān)聯(lián)作為第一組合,W及將所述每一個相關(guān)詞所占的權(quán)重值與其對應(yīng)的 相關(guān)詞相關(guān)聯(lián)作為第二組合;
[0091] 捜索顯示單元32,用于將所述第一組合和所述第二組合提交給捜索引擎,W供所 述捜索引擎從所述簡歷數(shù)據(jù)庫中捜索出簡歷,并根據(jù)所述捜索引擎內(nèi)置的排序算法顯示捜 索出的簡歷;其中,所述簡歷中包含的所述關(guān)鍵詞和所述每一個相關(guān)詞W高亮形式顯示。
[0092] 本發(fā)明實施例提供的簡歷捜索裝置,能根據(jù)相關(guān)詞的數(shù)量選取不同的權(quán)重計算算 法,來進行計算關(guān)鍵詞和相關(guān)詞在捜索過程所占的權(quán)重,充分考慮相關(guān)詞的數(shù)量對關(guān)鍵詞 在檢索過程的影響,平衡關(guān)鍵詞和相關(guān)詞在簡歷捜索過程中所占的權(quán)重,避免在權(quán)重計算 過程中出現(xiàn)當(dāng)相關(guān)詞過多時導(dǎo)致關(guān)鍵詞權(quán)重過大或過小,當(dāng)相關(guān)詞過少時導(dǎo)致關(guān)鍵詞的權(quán) 重過大或過小的權(quán)重失衡情況,使簡歷檢索的過程更為合理,減少再次進行簡歷捜索的發(fā) 生,提高簡歷捜索的效率。
[0093] 本領(lǐng)域普通技術(shù)人員可W理解實現(xiàn)上述實施例方法中的全部或部分流程,是可W 通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì) 中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁 碟、光盤、只讀存儲記憶體(Read-Only Memoir ,ROM)或隨機存儲記憶體(Random Access Memory ,RAM)等。
[0094] W上所述是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員 來說,在不脫離本發(fā)明原理的前提下,還可W做出若干改進和潤飾,運些改進和潤飾也視為 本發(fā)明的保護范圍。
【主權(quán)項】
1. 一種簡歷搜索方法,其特征在于,包括: 接收用于從簡歷數(shù)據(jù)庫中進行簡歷搜索的關(guān)鍵詞和相關(guān)詞集;其中,所述相關(guān)詞集記 載有多個相關(guān)詞,以及每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度; 根據(jù)所述相關(guān)詞集中的相關(guān)詞的數(shù)量選擇權(quán)重計算方式,并基于所選擇的權(quán)重計算方 式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷搜索時每一個相關(guān) 詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值; 將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述每一個相關(guān)詞的權(quán)重 值提交給搜索引擎,以從所述簡歷數(shù)據(jù)庫中搜索出簡歷。2. 如權(quán)利要求1所述的簡歷搜索方法,其特征在于,當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量 處于上限詞量和下限詞量之間時,選擇第一方式作為權(quán)重計算方式,則基于所選擇的權(quán)重 計算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡歷搜索時每一 個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值,具體為: 根據(jù)第一權(quán)重公另1計算出所述相關(guān)詞集中第i個相關(guān)詞在進行簡歷搜索時所 占的權(quán)重值W1;其中,rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的最大值; 根據(jù)第二權(quán)重公式WA = mX sumW,計算出所述關(guān)鍵詞在進行簡歷搜索時所占的權(quán)重值 Wa;其中,A為所述關(guān)鍵詞,m為第一權(quán)重系數(shù),sumW為所述相關(guān)詞集中所有相關(guān)詞的權(quán)重值 的總和。3. 如權(quán)利要求1或2所述簡歷搜索方法,其特征在于,當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù) 量不處于所述上限詞量和所述下限詞量之間時,選擇第二方式作為權(quán)重計算方式,則基于 所選擇的權(quán)重計算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡 歷搜索時每一個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值,具體為: 根據(jù)基準分值公¥計算出所述相關(guān)詞集中第i個相關(guān)詞的基準分值 Si;其中,ri為所述相關(guān)詞集中的第i個相關(guān)詞的相關(guān)度;run為在所述相關(guān)詞集中所記載的 所有相關(guān)詞的相關(guān)度的最小值;rmax為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的 最大值; 對所述所有相關(guān)詞的基準分值進行求和,獲得基準分值總值sum; 根據(jù)第三權(quán)重公式Wa= 5+logi.5(sum+1),計算出所述關(guān)鍵詞在進行簡歷搜索時所占的 權(quán)重值Wa ;其中,A為所述關(guān)鍵詞; 判斷所述第i個相關(guān)詞的基準分值是否大于WA/n若是,則根據(jù)第四權(quán)重公式4十算出所述第i個相關(guān)詞在進行簡歷搜索時所占的權(quán)重值W1;若否,則 根據(jù)第五權(quán)重公;E,計算出所述第i個相關(guān)詞在進行簡歷搜索時所占的權(quán) 重值W1;其中,η為第二權(quán)重系數(shù);k為所述相關(guān)詞集中的相關(guān)詞的數(shù)量。4. 如權(quán)利要求3所述的簡歷搜索方法,其特征在于,在所述判斷所述第i個相關(guān)詞的基 準分值是否大于WA/n之前,還包括: 根據(jù)均值公式汁算基準分值均值歹;其中,F(xiàn)為所述所有相關(guān)詞的相關(guān) 度的平均值;對于所述相關(guān)詞集中的第i個相關(guān)詞,判斷所述第i個相關(guān)詞的基準分值Si是否大于所 述基準分值均值5; 若是,通過更新公式5: = 1 Ox(S; -I),更新所述第i個相關(guān)詞的基準分值5. 如權(quán)利要求1所述的簡歷搜索的方法,其特征在于,所述將所述關(guān)鍵詞、所述關(guān)鍵詞 所占的權(quán)重值、每一個相關(guān)詞和所述每一個相關(guān)詞所占的權(quán)重值提交給搜索引擎,以從所 述簡歷數(shù)據(jù)庫中搜索出簡歷,具體為: 根據(jù)搜索引擎的權(quán)重關(guān)聯(lián)格式,將所述關(guān)鍵詞所占的權(quán)重值和所述關(guān)鍵詞相關(guān)聯(lián)作為 第一組合,以及將所述每一個相關(guān)詞所占的權(quán)重值與其對應(yīng)的相關(guān)詞相關(guān)聯(lián)作為第二組 合; 將所述第一組合和所述第二組合提交給搜索引擎,以供所述搜索引擎從所述簡歷數(shù)據(jù) 庫中搜索出簡歷,并根據(jù)所述搜索引擎內(nèi)置的排序算法顯示搜索出的簡歷;其中,所述簡歷 中包含的所述關(guān)鍵詞和所述每一個相關(guān)詞以高亮形式顯示。6. -種簡歷搜索裝置,其特征在于,包括: 接收模塊,用于接收用于從簡歷數(shù)據(jù)庫中進行簡歷搜索的關(guān)鍵詞和相關(guān)詞集;其中,所 述相關(guān)詞集記載有多個相關(guān)詞,以及每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度; 權(quán)重計算模塊,用于根據(jù)所述相關(guān)詞集中的相關(guān)詞的數(shù)量選擇權(quán)重計算方式,并基于 所選擇的權(quán)重計算方式,根據(jù)所述每一個相關(guān)詞與所述關(guān)鍵詞的相關(guān)度,計算出在進行簡 歷搜索時每一個相關(guān)詞所占的權(quán)重值及所述關(guān)鍵詞所占的權(quán)重值; 搜索模塊,用于將所述關(guān)鍵詞、所述關(guān)鍵詞所占的權(quán)重值、每一個相關(guān)詞和所述每一個 相關(guān)詞的權(quán)重值提交給搜索引擎,以從所述簡歷數(shù)據(jù)庫中搜索出簡歷。7. 如權(quán)利要求6所述的簡歷搜索裝置,其特征在于,所述權(quán)重計算模塊包括: 第一計算單元,用于當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量處于上限詞量和下限詞量之間 時,選擇第一方式作為權(quán)重計算方式,根據(jù)第一權(quán)重公式Μ ,計算出所述相關(guān)詞集中 ^raax 第i個相關(guān)詞在進行簡歷搜索時所占的權(quán)重值w1;其中,rmax為在所述相關(guān)詞集中所記載的 所有相關(guān)詞的相關(guān)度的最大值; 第二計算單元,用于根據(jù)第二權(quán)重公式WA=mX sumW,計算出所述關(guān)鍵詞在進行簡歷搜 索時所占的權(quán)重值Wa;其中,A為所述關(guān)鍵詞,m為第一權(quán)重系數(shù),sumW為所述相關(guān)詞集中所 有相關(guān)詞的權(quán)重值的總和。8. 如權(quán)利要求6或7所述簡歷搜索裝置,其特征在于,所述權(quán)重計算模塊還包括: 基準分值計算單元,用于當(dāng)所述相關(guān)詞集中的相關(guān)詞的數(shù)量不處于所述上限詞量和所 述下限詞量之間時,選擇第二方式作為權(quán)重計算方式,根據(jù)基準分值公式 計算出所述相關(guān)詞集中第i個相關(guān)詞的基準分值Si;其中,ri為所述相關(guān)詞集中的弟i個相天 詞的相關(guān)度;r*為在所述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的最小值;為在所 述相關(guān)詞集中所記載的所有相關(guān)詞的相關(guān)度的最大值; 求和計算單元,用于對所述所有相關(guān)詞的基準分值進行求和,獲得基準分值總值sum; 第三計算單元,用于根據(jù)第三權(quán)重公式評4=5+1<^1.5(811111+1),計算出所述關(guān)鍵詞在進行 簡歷搜索時所占的權(quán)重值Wa;其中,A為所述關(guān)鍵詞; 第四計算單元,用于判斷所述第i個相關(guān)詞的基準分值是否大于WA/n若是,則根據(jù)第四 權(quán)重公式計算出所述第i個相關(guān)詞在進行簡歷搜索時所占的權(quán)重值 Wi;若否,則根據(jù)第五權(quán)重公另計算出所述第i個相關(guān)詞在進行簡歷搜索 時所占的權(quán)重值W1;其中,η為第二權(quán)重系數(shù);k為所述相關(guān)詞集中的相關(guān)詞的數(shù)量。9. 如權(quán)利要求8所述的簡歷搜索裝置,其特征在于,所述權(quán)重計算模塊還包括: 均值計算單元,用于在所述判斷所述第i個相關(guān)詞的基準分值是否大于WA/n之前,根據(jù) 均值公3,計算基準分值均值f;其中^為所述所有相關(guān)詞的相關(guān)度的平均 值;判斷單元,用于對于所述相關(guān)詞集中的第i個相關(guān)詞,判斷所述第i個相關(guān)詞的基準分 值31是否大于所述基準分值均值歹; 更新單元,用于當(dāng)判斷所述第i個相關(guān)詞的基準分值Si是大于所述平均分值f時,通過 更新公式5; = l:〇x供-?,更新所述第i個相關(guān)詞的基準分值Su10. 如權(quán)利要求6所述的簡歷搜索的裝置,其特征在于,所述搜索模塊具體包括: 權(quán)重相聯(lián)單元,用于根據(jù)搜索引擎的權(quán)重關(guān)聯(lián)格式,將所述關(guān)鍵詞所占的權(quán)重值和所 述關(guān)鍵詞相關(guān)聯(lián)作為第一組合,以及將所述每一個相關(guān)詞所占的權(quán)重值與其對應(yīng)的相關(guān)詞 相關(guān)聯(lián)作為第二組合; 搜索顯示單元,用于將所述第一組合和所述第二組合提交給搜索引擎,以供所述搜索 引擎從所述簡歷數(shù)據(jù)庫中搜索出簡歷,并根據(jù)所述搜索引擎內(nèi)置的排序算法顯示搜索出的 簡歷;其中,所述簡歷中包含的所述關(guān)鍵詞和所述每一個相關(guān)詞以高亮形式顯示。
【文檔編號】G06F17/30GK105956195SQ201610436857
【公開日】2016年9月21日
【申請日】2016年6月17日
【發(fā)明人】李賢
【申請人】廣州視源電子科技股份有限公司