值回歸模型。具體而言,為了利用如圖1所示的方法所建立的價值回歸模型來預(yù)測待測的搜索詞的價值數(shù)據(jù),首先需要提取待測搜索詞的特征數(shù)據(jù)并且將其輸入價值回歸模型。通過圖1所示的模型訓(xùn)練已經(jīng)獲得了該價值回歸模型的參數(shù),現(xiàn)在將待測搜索詞的特征數(shù)據(jù)輸入該模型。搜索詞的特征數(shù)據(jù)例如可以包括但不限于搜索詞的長度、搜索詞的類別、搜索詞分詞后的結(jié)果等。
[0055]舉例而言,比如在價值回歸模型中,存在3個聚類的標(biāo)注數(shù)據(jù):聚類I中的搜索詞例如為“筆記本電腦”、“mac air”、“thinkpad”等,商業(yè)價值標(biāo)注為I (高等商業(yè)價值);聚類2中的搜索詞為“劉德華”、“張學(xué)友”、“劉德華的專輯”等,商業(yè)價值標(biāo)注為O (低商業(yè)價值);聚類3中的搜索詞為“5寸手機(jī)有多大”,“android手機(jī)是否流暢”等,商業(yè)價值標(biāo)注為0.5(中商業(yè)價值)。例如,首先,將待測搜索詞“東芝筆記本”的特征數(shù)據(jù)輸入價值回歸模型。
[0056]在步驟S220處,基于價值回歸模型,獲取所述待測搜索詞的價值數(shù)據(jù)。
[0057]承接上述例子,例如將待測搜索詞“東芝筆記本”的特征數(shù)據(jù)輸入價值回歸模型,則訓(xùn)練的模型對“東芝筆記本”將給出的價值數(shù)據(jù)例如是0.8 (是大于0.5小于等于I的一個數(shù))。再例如,基于價值回歸模型,獲取到待測搜索詞“李連杰”的價值數(shù)據(jù)例如是0.1 (小于0.5大于O的一個數(shù))。
[0058]本發(fā)明還提供了一種確定搜索詞的價值的裝置。如圖3所示,圖3是根據(jù)本發(fā)明一實施例的確定搜索詞的價值的裝置300的結(jié)構(gòu)框圖。
[0059]裝置300可以包括輸入模塊310以及獲取模塊320。其中,輸入模塊310可以用于將待測搜索詞輸入價值回歸模型。獲取模塊330可以用于基于價值回歸模型,獲取所述待測搜索詞的價值數(shù)據(jù)。
[0060]根據(jù)本發(fā)明的實施例,價值回歸模型可以是通過如下模塊獲取的:
[0061 ] 聚類模塊(未示出),其可以用于將已有搜索詞基于點擊關(guān)系數(shù)據(jù)和/或展現(xiàn)關(guān)系數(shù)據(jù)而進(jìn)行聚類,以獲得聚類后的搜索詞集合;
[0062]分類模塊(未示出),其可以用于將搜索詞集合分類為不同價值的搜索詞集合;
[0063]模型獲取模塊(未示出),其可以用于利用不同價值的搜索詞集合進(jìn)行模型訓(xùn)練以獲取價值回歸模型。
[0064]根據(jù)本發(fā)明的實施例,上述不同價值的搜索詞集合可以包括高價值的搜索詞集合、中價值的搜索詞集合以及低價值的搜索詞集合,其中高價值的搜索詞集合中搜索詞的價值數(shù)據(jù)大于中價值的搜索詞集合中搜索詞的價值數(shù)據(jù);以及中價值的搜索詞集合中搜索詞的價值數(shù)據(jù)大于低價值的搜索詞集合中搜索詞的價值數(shù)據(jù)。
[0065]其中,高價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為1、中價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為0.5以及低價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為O。
[0066]根據(jù)本發(fā)明的實施例,其中,聚類模塊可以進(jìn)一步包括關(guān)系數(shù)據(jù)獲取子模塊、計算子模塊以及獲取子模塊。
[0067]其中,關(guān)系數(shù)據(jù)獲取子模塊,可以用于獲取不同搜索詞的共同點擊次數(shù)并基于所述共同點擊次數(shù)計算點擊關(guān)系數(shù)據(jù)和/或不同搜索詞的共同展現(xiàn)次數(shù)基于所述共同展現(xiàn)次數(shù)計算展現(xiàn)關(guān)系數(shù)據(jù);
[0068]計算子模塊,可以用于基于所述點擊關(guān)系數(shù)據(jù)、展現(xiàn)關(guān)系數(shù)據(jù)、共同展現(xiàn)次數(shù)和共同點擊次數(shù)中的至少一個,計算已有搜索詞之間的聚類距離;
[0069]獲取子模塊,可以用于基于所述聚類距離將已有搜索詞進(jìn)行聚類,以獲得聚類后的搜索詞集合。
[0070]其中,共同點擊次數(shù)、共同展現(xiàn)次數(shù)、點擊關(guān)系數(shù)據(jù)、展現(xiàn)關(guān)系數(shù)據(jù)分別表示兩個搜索詞之間的共同點擊次數(shù)、共同展現(xiàn)次數(shù)、點擊關(guān)系數(shù)據(jù)、展現(xiàn)關(guān)系數(shù)據(jù)。
[0071]根據(jù)本發(fā)明的實施例,模型獲取模塊可以進(jìn)一步被配置成:
[0072]將高價值的搜索詞集合中的每個搜索詞作為一份2樣本、中價值的搜索詞集合中的每個搜索詞作為一份I樣本并且低價值的搜索詞集合中的每個搜索詞作為一份O樣本利用所述邏輯回歸算法進(jìn)行訓(xùn)練以形成所述價值回歸模型。
[0073]由于本實施例的裝置所實現(xiàn)的功能基本相應(yīng)于前述圖1和圖2所示的方法實施例,故本實施例的描述中未詳盡之處,可以參見前述實施例中的相關(guān)說明,在此不做贅述。
[0074]在此提供的算法和顯示不與任何特定計算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
[0075]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細(xì)節(jié)的情況下實踐。在一些實例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0076]類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權(quán)利要求書由此明確地并入該【具體實施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
[0077]本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中。可以把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0078]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實施例的任意之一都可以以任意的組合方式來使用。
[0079]本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的確定搜索詞的價值設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機(jī)程序和計算機(jī)程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機(jī)可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0080]應(yīng)該注意的是上述實施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機(jī)來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一