亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

數(shù)據(jù)處理方法和裝置制造方法

文檔序號:6546281閱讀:145來源:國知局
數(shù)據(jù)處理方法和裝置制造方法
【專利摘要】本發(fā)明提出一種數(shù)據(jù)處理方法和裝置,該數(shù)據(jù)處理方法包括移動終端對搜索結(jié)果進行展現(xiàn);獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。該方法能夠降低輸入數(shù)據(jù)量,并提高模型預(yù)估準確率。
【專利說明】數(shù)據(jù)處理方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理【技術(shù)領(lǐng)域】,尤其涉及一種數(shù)據(jù)處理方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的快速發(fā)展,用戶可以通過互聯(lián)網(wǎng)展現(xiàn)的頁面獲取更多的信息。對于互聯(lián)網(wǎng)廣告投放商來說,分析用戶對互聯(lián)網(wǎng)上廣告的點擊行為,對自身的廣告投放具有重要意義。用戶在互聯(lián)網(wǎng)上的點擊行為可以記錄在展現(xiàn)點擊日志中,展現(xiàn)點擊日志是不可缺少的訓練數(shù)據(jù),廣泛應(yīng)用在廣告的點擊率(Click Through Rate, CTR)預(yù)估模型中。
[0003]相關(guān)技術(shù)中,直接應(yīng)用搜索引擎中的展現(xiàn)點擊日志作為廣告點擊率預(yù)估模型的輸入數(shù)據(jù),默認頁面上加載的廣告都展現(xiàn)給了用戶,用戶點擊即為正例,否則為負例。
[0004]但是,相對于個人電腦(Personal Computer,PC),移動終端的屏幕較小,展現(xiàn)的內(nèi)容有限,導致頁面上加載的廣告不能全部展現(xiàn)給用戶。因此,直接采用展現(xiàn)點擊日志不僅導致CTR模型的輸入數(shù)據(jù)量較大,且并不能真實反映用戶的瀏覽點擊行為,存在大量非真實的數(shù)據(jù),影響CTR模型預(yù)估的準確率。

【發(fā)明內(nèi)容】

[0005]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0006]為此,本發(fā)明的一個目的在于提出一種數(shù)據(jù)處理方法,該方法可以降低CTR模型的輸入數(shù)據(jù)量,且提高模型的預(yù)估準確率。
[0007]本發(fā)明的另一個目的在于提出一種數(shù)據(jù)處理裝置。
[0008]為達到上述目的,本發(fā)明第一方面實施例提出的數(shù)據(jù)處理方法,包括:對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的;獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0009]本發(fā)明第一方面實施例提出的數(shù)據(jù)處理方法,通過將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,然后根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0010]為達到上述目的,本發(fā)明第二方面實施例提出的數(shù)據(jù)處理方法,包括:獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容;在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0011]本發(fā)明第二方面實施例提出的數(shù)據(jù)處理方法,通過根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0012]為達到上述目的,本發(fā)明第三方面實施例提出的數(shù)據(jù)處理裝置,包括:展現(xiàn)模塊,用于對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的;獲取模塊,用于獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;發(fā)送模塊,用于將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0013]本發(fā)明第三方面實施例提出的數(shù)據(jù)處理裝置,通過將所述移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,然后根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0014]為達到上述目的,本發(fā)明第四方面實施例提出的數(shù)據(jù)處理裝置,包括:獲取模塊,用于獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;確定模塊,用于使所述服務(wù)器根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容;去除模塊,用于在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0015]本發(fā)明第四方面實施例提出的數(shù)據(jù)處理裝置,通過根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0016]為達到上述目的,本發(fā)明第五方面實施例提出的移動終端,包括:殼體、處理器、存儲器、電路板和電源電路,其中,所述電路板安置在所述殼體圍成的空間內(nèi)部,所述處理器和所述存儲器設(shè)置在所述電路板上;所述電源電路,用于為所述移動終端的各個電路或器件供電;所述存儲器用于存儲可執(zhí)行程序代碼;所述處理器通過讀取所述存儲器中存儲的可執(zhí)行程序代碼來運行與所述可執(zhí)行程序代碼對應(yīng)的程序,以用于:對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的;獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。本發(fā)明第五方面實施例提出的移動終端,通過將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,然后根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0017]為達到上述目的,本發(fā)明第六方面實施例提出的數(shù)據(jù)處理裝置,包括:殼體、處理器、存儲器、電路板和電源電路,其中,所述電路板安置在所述殼體圍成的空間內(nèi)部,所述處理器和所述存儲器設(shè)置在所述電路板上;所述電源電路,用于為所述裝置的各個電路或器件供電;所述存儲器用于存儲可執(zhí)行程序代碼;所述處理器通過讀取所述存儲器中存儲的可執(zhí)行程序代碼來運行與所述可執(zhí)行程序代碼對應(yīng)的程序,以用于:獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容;在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。本發(fā)明第六方面實施例提出的數(shù)據(jù)處理裝置,通過根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0018]本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
【專利附圖】

【附圖說明】
[0019]本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:
[0020]圖1是本發(fā)明一實施例提出的數(shù)據(jù)處理方法的流程示意圖;
[0021]圖2是本發(fā)明另一實施例提出的數(shù)據(jù)處理方法的流程示意圖;
[0022]圖3是本發(fā)明另一實施例提出的數(shù)據(jù)處理方法的流程示意圖;
[0023]圖4是本發(fā)明另一實施例提出的數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;
[0024]圖5是本發(fā)明另一實施例提出的數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0025]下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0026]圖1為本發(fā)明一實施例提出的數(shù)據(jù)處理方法的流程示意圖,該方法包括:
[0027]Sll:移動終端對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的。[0028]類似相關(guān)技術(shù)中,當用戶通過移動終端在瀏覽器中輸入搜索詞后,會得到與該搜索詞對應(yīng)的搜索結(jié)果。
[0029]搜索結(jié)果可以包括一條或至少兩條的內(nèi)容,當搜索結(jié)果包含的內(nèi)容較多時,由于移動終端屏幕尺寸的限制,通常不能一次全部展現(xiàn)給用戶,需要用戶不斷滑屏獲取更多的信息,每次滑屏后可以在上次展現(xiàn)基礎(chǔ)上繼續(xù)展現(xiàn)上次未展現(xiàn)的內(nèi)容。
[0030]另外,本發(fā)明實施例中的滑屏不限于通過觸摸屏幕實現(xiàn)的滑屏,也包括傳統(tǒng)的采用按鍵方式使得展現(xiàn)內(nèi)容不斷變化的方式。
[0031]S12:移動終端獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容。
[0032]在本實施例中,可以在移動終端搜索時,網(wǎng)頁中植入JS(JavaScript)代碼,監(jiān)控用戶的滑屏操作,以便獲取初始展現(xiàn)后的展現(xiàn)內(nèi)容的信息以及每次滑屏后的展現(xiàn)內(nèi)容的信
肩、O
[0033]S13:移動終端將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0034]其中,可以根據(jù)上述的JS代碼將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,例如在用戶每次滑屏后,將相應(yīng)滑屏后的展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器。服務(wù)器接收到該展現(xiàn)內(nèi)容的信息后可以進行記錄,例如記錄在滑屏日志中。后續(xù)流程中,例如進行CTR建模時可以從服務(wù)器中獲取該展現(xiàn)內(nèi)容的信息,并根據(jù)該展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信肩、O
[0035]進一步的,該展現(xiàn)內(nèi)容的信息可以具體為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息,例如,移動終端屏幕上從上至下展現(xiàn)了三條展現(xiàn)內(nèi)容,可以只將第三條展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器。
[0036]進一步的,該最后一條展現(xiàn)內(nèi)容的信息可以具體包括:最后一條展現(xiàn)內(nèi)容的編號,以及,最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度。由于搜索結(jié)果是由服務(wù)器提供的,因此,服務(wù)器會記錄搜索結(jié)果中每條內(nèi)容的信息。其中,服務(wù)器可以將每條內(nèi)容按照從上到下的展現(xiàn)順序進行編號,例如,服務(wù)器得到多條搜索結(jié)果后,根據(jù)預(yù)定算法可以確定各條搜索結(jié)果的從上到下的排列順序,之后服務(wù)器可以按照從上到下的順序?qū)Ω鳁l搜索結(jié)果進行從小到大的編號。這樣,當服務(wù)器接收到屏幕上最后一條展現(xiàn)內(nèi)容的編號(如3)時,就可以確定出之前編號(如1、2)的展現(xiàn)內(nèi)容是已經(jīng)被用戶瀏覽的。另外,服務(wù)器中還會記錄每條搜索結(jié)果的整體高度,而在移動終端中最后一條搜索結(jié)果可能是不能全部展現(xiàn)的,例如只展現(xiàn)全部高度的一部分,服務(wù)器可以根據(jù)該展現(xiàn)高度與整體高度確定最后一條是否屬于被用戶瀏覽到的內(nèi)容。
[0037]移動終端發(fā)送的屏幕上展現(xiàn)內(nèi)容的信息可以記錄在服務(wù)器中,以便后續(xù)流程中采用,例如,在CTR建模時可以根據(jù)該信息確定沒有被用戶瀏覽到的內(nèi)容,進而在展現(xiàn)點擊日志中去除該沒有被用戶瀏覽到的內(nèi)容的信息,避免CTR模型中輸入不準確的數(shù)據(jù)。
[0038]本實施例通過將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,使得服務(wù)器中記錄有該展現(xiàn)內(nèi)容的信息,進而在后續(xù)流程中可以根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0039]圖2為本發(fā)明另一實施例提出的數(shù)據(jù)處理方法的流程示意圖,該方法包括:
[0040]S21:獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容。
[0041]所述展現(xiàn)內(nèi)容的信息可以為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息。
[0042]進一步的,所述最后一條展現(xiàn)內(nèi)容的信息,包括:最后一條展現(xiàn)內(nèi)容的編號,以及最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度。
[0043]S22:根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容。
[0044]例如,將在所述最后一條展現(xiàn)內(nèi)容的編號之前的展現(xiàn)內(nèi)容確定為已經(jīng)被用戶瀏覽到的內(nèi)容;以及,
[0045]根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容。
[0046]進一步的,可以在所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度與所述最后一條展現(xiàn)內(nèi)容的整體高度之間的比值大于預(yù)設(shè)的閾值時,確定所述最后一條展現(xiàn)內(nèi)容為被用戶瀏覽到的內(nèi)容。
[0047]進一步的,該預(yù)設(shè)的閾值可以具體為1/4。
[0048]S23:在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0049]其中,相關(guān)技術(shù)中,展現(xiàn)點擊日志中會記錄每條搜索結(jié)果的信息,不論該條搜索結(jié)果是否被用戶瀏覽到。例如,用戶輸入一搜索詞后,服務(wù)器加載與該搜索詞對應(yīng)的所有搜索結(jié)果,假設(shè)所有的搜索結(jié)果的數(shù)目是8條,那么相關(guān)技術(shù)中展現(xiàn)點擊日志中會包含這8條搜索結(jié)果的信息,當用戶點擊其中的某條搜索結(jié)果時就是正例,否則為負例。但是,這8條搜索結(jié)果中可能會存在根本沒出現(xiàn)在屏幕上的結(jié)果,,相應(yīng)的,用戶不可能瀏覽到,造成數(shù)據(jù)不準確。
[0050]而本實施例中,對于用戶沒有瀏覽到的內(nèi)容,在展現(xiàn)點擊日志中去除該用戶沒有瀏覽到的內(nèi)容的信息,避免采用不準確的數(shù)據(jù)進行預(yù)測。
[0051]其中,本實施例的執(zhí)行主體可以是數(shù)據(jù)處理裝置,通過該裝置可以得到處理后的展現(xiàn)點擊日志,該處理后的展現(xiàn)點擊日志可以用在CTR建模等場合。
[0052]本實施例通過根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0053]圖3為本發(fā)明另一實施例提出的數(shù)據(jù)處理方法的流程示意圖,本實施例中,以移動終端為手機,搜索結(jié)果是廣告為例。參見圖3,本實施例包括:
[0054]S301:手機接收用戶輸入的搜索詞。[0055]S302:手機將搜索詞發(fā)送給服務(wù)器。
[0056]S303:服務(wù)器采用預(yù)設(shè)算法對搜索詞進行搜索,得到多條廣告。以及,服務(wù)器對從上至下展現(xiàn)的廣告依次進行編號,并記錄每條廣告的整體高度。
[0057]S304:服務(wù)器將多條廣告發(fā)送給手機。
[0058]S305:手機對多條廣告進行初始展現(xiàn)。
[0059]S306:手機將初始展現(xiàn)后屏幕最后一條廣告的編號和展現(xiàn)高度發(fā)送給服務(wù)器。
[0060]S307:服務(wù)器將接收的信息,即編號和展現(xiàn)高度記錄在滑屏日志中。
[0061 ] S308:手機在用戶每次滑屏后,獲取每次滑屏后最后一條廣告的編號和展現(xiàn)高度。
[0062]S309:在每次滑屏后,將每次滑屏后最后一條廣告的編號和展現(xiàn)高度發(fā)送給服務(wù)器。
[0063]S310:服務(wù)器將接收的信息,即每次滑屏后最后一條廣告的編號和展現(xiàn)高度,記錄在滑屏日志中。
[0064]其中,滑屏日志中記錄每次狀態(tài)(初始及每次滑屏后)后展現(xiàn)內(nèi)容的信息(如,最后一條廣告的編號和展現(xiàn)高度)。
[0065]S311:數(shù)據(jù)處理裝置從服務(wù)器中獲取滑屏日志。
[0066]其中,數(shù)據(jù)處理裝置可以是離線的后期處理人員使用的裝置,該裝置用于對展現(xiàn)點擊日志進行處理。該裝置可以位于服務(wù)器中或者位于服務(wù)器之外。
[0067]S312:數(shù)據(jù)處理裝置根據(jù)滑屏日志中記錄的所有狀態(tài)時的信息,確定出用戶所有滑屏后都沒有被用戶瀏覽到的廣告。
[0068]例如,服務(wù)器得到的所有搜索結(jié)果共有10條廣告,用戶滑屏了兩次,初始時記錄的最后一條廣告的信息是:(num3,hi),第一次滑屏后記錄的最后一條廣告的信息是(num5, h2),第二次滑屏后記錄的最后一條廣告的信息是(num9, h3),由于最后一次滑屏的最后展現(xiàn)的廣告的編號時9,那么可以確定編號1-8的廣告是被瀏覽到的,編號10的廣告是沒有被用戶瀏覽到的,對于編號9的廣告,可以根據(jù)展現(xiàn)高度和整體高度確定,例如,假設(shè)編號9的廣告的整體高度是H,當h3/H的比值大于預(yù)設(shè)閾值時,可以表明編號9的廣告是被用戶瀏覽到的,否則為沒有被用戶瀏覽到的。
[0069]S313:數(shù)據(jù)處理裝置在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的廣告的信息。
[0070]以上述例子進行說明,相關(guān)技術(shù)中,展現(xiàn)點擊日志中會記錄編號I?10的廣告的信息,而本實施例中,假設(shè)編號9的廣告也是沒有被用戶瀏覽到的,那么本申請的展現(xiàn)點擊日志中會記錄編號I?8的廣告的信息,不再包含后面兩個廣告的信息。
[0071]這樣對于CTR模型來講,其對于展現(xiàn)在頁面上方的廣告,如編號1-8的廣告,米用的就是原始的展現(xiàn)點擊日志,對于展現(xiàn)在頁面下方的廣告,如編號9-10的廣告,采用的是過濾后的展現(xiàn)點擊日志。CTR模型對輸入模塊的分開處理,可以表明采用錯誤的數(shù)據(jù),保證預(yù)測準確性。
[0072]本實施例通過手機獲知展現(xiàn)內(nèi)容的信息,服務(wù)器記錄該展現(xiàn)內(nèi)容的信息,數(shù)據(jù)處理裝置根據(jù)該信息在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0073]圖4為本發(fā)明另一實施例提出的數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖,該裝置40包括展現(xiàn)模塊41、獲取模塊42和發(fā)送模塊43。
[0074]展現(xiàn)模塊41用于對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的;
[0075]類似相關(guān)技術(shù)中,當用戶通過移動終端在瀏覽器中輸入搜索詞后,會得到與該搜索詞對應(yīng)的搜索結(jié)果。
[0076]搜索結(jié)果可以包括一條或至少兩條的內(nèi)容,當搜索結(jié)果包含的內(nèi)容較多時,由于移動終端屏幕尺寸的限制,通常不能一次全部展現(xiàn)給用戶,需要用戶不斷滑屏獲取更多的信息,每次滑屏后可以在上次展現(xiàn)基礎(chǔ)上繼續(xù)展現(xiàn)上次未展現(xiàn)的內(nèi)容。
[0077]另外,本發(fā)明實施例中的滑屏不限于通過觸摸屏幕實現(xiàn)的滑屏,也包括傳統(tǒng)的采用按鍵方式使得展現(xiàn)內(nèi)容不斷變化的方式。
[0078]獲取模塊42用于獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;
[0079]在本實施例中,可以在移動終端搜索時,網(wǎng)頁中植入JS(JavaScript)代碼,監(jiān)控用戶的滑屏操作,以便獲取初始展現(xiàn)后的展現(xiàn)內(nèi)容的信息以及每次滑屏后的展現(xiàn)內(nèi)容的信
肩、O
[0080]發(fā)送模塊43用于將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0081]其中,可以根據(jù)上述的JS代碼將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,例如在用戶每次滑屏后,將相應(yīng)滑屏后的展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器。服務(wù)器接收到該展現(xiàn)內(nèi)容的信息后可以進行記錄,例如記錄在滑屏日志中。后續(xù)流程中,例如進行CTR建模時可以從服務(wù)器中獲取該展現(xiàn)內(nèi)容的信息,并根據(jù)該展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信肩、O
[0082]進一步的,展現(xiàn)內(nèi)容的信息可以具體為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息,例如,移動終端屏幕上從上至下展現(xiàn)了三條展現(xiàn)內(nèi)容,可以只將第三條展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器。
[0083]進一步的,該最后一條展現(xiàn)內(nèi)容的信息可以具體包括:最后一條展現(xiàn)內(nèi)容的編號,以及,最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度。
[0084]由于搜索結(jié)果是由服務(wù)器提供的,因此,服務(wù)器會記錄搜索結(jié)果中每條內(nèi)容的信息。其中,服務(wù)器可以將每條內(nèi)容按照從上到下的展現(xiàn)順序進行編號,例如,服務(wù)器得到多條搜索結(jié)果后,根據(jù)預(yù)定算法可以確定各條搜索結(jié)果的從上到下的排列順序,之后服務(wù)器可以按照從上到下的順序?qū)Ω鳁l搜索結(jié)果進行從小到大的編號。這樣,當服務(wù)器接收到屏幕上最后一條展現(xiàn)內(nèi)容的編號(如3)時,就可以確定出之前編號(如1、2)的展現(xiàn)內(nèi)容是已經(jīng)被用戶瀏覽的。另外,服務(wù)器中還會記錄每條搜索結(jié)果的整體高度,而在移動終端中最后一條搜索結(jié)果可能是不能全部展現(xiàn)的,例如只展現(xiàn)全部高度的一部分,服務(wù)器可以根據(jù)該展現(xiàn)高度與整體高度確定最后一條是否屬于被用戶瀏覽到的內(nèi)容。
[0085]移動終端發(fā)送的屏幕上展現(xiàn)內(nèi)容的信息可以記錄在服務(wù)器中,以便后續(xù)流程中采用,例如,在CTR建模時可以根據(jù)該信息確定沒有被用戶瀏覽到的內(nèi)容,進而在展現(xiàn)點擊日志中去除該沒有被用戶瀏覽到的內(nèi)容的信息,避免CTR模型中輸入不準確的數(shù)據(jù)。
[0086]本實施例通過將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,使得服務(wù)器中記錄有該展現(xiàn)內(nèi)容的信息,進而在后續(xù)流程中可以根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0087]圖5為本發(fā)明另一個實施例提供的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖,該裝置50包括獲取模塊51、確定模塊52和去除模塊53。
[0088]獲取模塊51用于獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容;
[0089]所述展現(xiàn)內(nèi)容的信息可以為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息。
[0090]進一步的,所述最后一條展現(xiàn)內(nèi)容的信息,包括:最后一條展現(xiàn)內(nèi)容的編號,以及最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度。
[0091]確定模塊52用于根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容;
[0092]例如,在所述最后一條展現(xiàn)內(nèi)容的編號之前的展現(xiàn)內(nèi)容確定為已經(jīng)被用戶瀏覽到的內(nèi)容;以及,
[0093]根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容。
[0094]進一步的,可以在所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度與所述最后一條展現(xiàn)內(nèi)容的整體高度之間的比值大于預(yù)設(shè)的閾值時,確定所述最后一條展現(xiàn)內(nèi)容為被用戶瀏覽到的內(nèi)容。
[0095]進一步的,該預(yù)設(shè)的閾值可以具體為1/4。
[0096]去除模塊53用于在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0097]其中,相關(guān)技術(shù)中,展現(xiàn)點擊日志中會記錄每條搜索結(jié)果的信息,不論該條搜索結(jié)果是否被用戶瀏覽到。例如,用戶輸入一搜索詞后,服務(wù)器加載與該搜索詞對應(yīng)的所有搜索結(jié)果,假設(shè)所有的搜索結(jié)果的數(shù)目是8條,那么相關(guān)技術(shù)中展現(xiàn)點擊日志中會包含這8條搜索結(jié)果的信息,當用戶點擊其中的某條搜索結(jié)果時就是正例,否則為負例。但是,這8條搜索結(jié)果中可能會存在根本沒出現(xiàn)在屏幕上的結(jié)果,相應(yīng)的,用戶不可能瀏覽到,造成數(shù)據(jù)不準確。
[0098]而本實施例中,對于用戶沒有瀏覽到的內(nèi)容,在展現(xiàn)點擊日志中去除該用戶沒有瀏覽到的內(nèi)容的信息,避免采用不準確的數(shù)據(jù)進行預(yù)測。
[0099]本實施例通過接收移動終端發(fā)送的所述移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的;根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容;在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0100]本發(fā)明實施例還提供了一種移動終端,該移動終端包括殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內(nèi)部,處理器和存儲器設(shè)置在電路板上;電源電路,用于為移動終端的各個電路或器件供電;存儲器用于存儲可執(zhí)行程序代碼;處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼對應(yīng)的程序,以用于執(zhí)行以下步驟:S11’:移動終端對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的。
[0101]類似相關(guān)技術(shù)中,當用戶通過移動終端在瀏覽器中輸入搜索詞后,會得到與該搜索詞對應(yīng)的搜索結(jié)果。
[0102]搜索結(jié)果可以包括一條或至少兩條的內(nèi)容,當搜索結(jié)果包含的內(nèi)容較多時,由于移動終端屏幕尺寸的限制,通常不能一次全部展現(xiàn)給用戶,需要用戶不斷滑屏獲取更多的信息,每次滑屏后可以在上次展現(xiàn)基礎(chǔ)上繼續(xù)展現(xiàn)上次未展現(xiàn)的內(nèi)容。
[0103]另外,本發(fā)明實施例中的滑屏不限于通過觸摸屏幕實現(xiàn)的滑屏,也包括傳統(tǒng)的采用按鍵方式使得展現(xiàn)內(nèi)容不斷變化的方式。
[0104]S12’:移動終端獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容。
[0105]在本實施例中,可以在移動終端搜索時,網(wǎng)頁中植入JS(JavaScript)代碼,監(jiān)控用戶的滑屏操作,以便獲取初始展現(xiàn)后的展現(xiàn)內(nèi)容的信息以及每次滑屏后的展現(xiàn)內(nèi)容的信
肩、O
[0106]S13’:移動終端將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0107]其中,可以根據(jù)上述的JS代碼將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,例如在用戶每次滑屏后,將相應(yīng)滑屏后的展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器。服務(wù)器接收到該展現(xiàn)內(nèi)容的信息后可以進行記錄,例如記錄在滑屏日志中。后續(xù)流程中,例如進行CTR建模時可以從服務(wù)器中獲取該展現(xiàn)內(nèi)容的信息,并根據(jù)該展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信肩、O
[0108]進一步的,該展現(xiàn)內(nèi)容的信息可以具體為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息,例如,移動終端屏幕上從上至下展現(xiàn)了三條展現(xiàn)內(nèi)容,可以只將第三條展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器。
[0109]進一步的,該最后一條展現(xiàn)內(nèi)容的信息可以具體包括:最后一條展現(xiàn)內(nèi)容的編號,以及,最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度。由于搜索結(jié)果是由服務(wù)器提供的,因此,服務(wù)器會記錄搜索結(jié)果中每條內(nèi)容的信息。其中,服務(wù)器可以將每條內(nèi)容按照從上到下的展現(xiàn)順序進行編號,例如,服務(wù)器得到多條搜索結(jié)果后,根據(jù)預(yù)定算法可以確定各條搜索結(jié)果的從上到下的排列順序,之后服務(wù)器可以按照從上到下的順序?qū)Ω鳁l搜索結(jié)果進行從小到大的編號。這樣,當服務(wù)器接收到屏幕上最后一條展現(xiàn)內(nèi)容的編號(如3)時,就可以確定出之前編號(如1、2)的展現(xiàn)內(nèi)容是已經(jīng)被用戶瀏覽的。另外,服務(wù)器中還會記錄每條搜索結(jié)果的整體高度,而在移動終端中最后一條搜索結(jié)果可能是不能全部展現(xiàn)的,例如只展現(xiàn)全部高度的一部分,服務(wù)器可以根據(jù)該展現(xiàn)高度與整體高度確定最后一條是否屬于被用戶瀏覽到的內(nèi)容。
[0110]移動終端發(fā)送的屏幕上展現(xiàn)內(nèi)容的信息可以記錄在服務(wù)器中,以便后續(xù)流程中采用,例如,在CTR建模時可以根據(jù)該信息確定沒有被用戶瀏覽到的內(nèi)容,進而在展現(xiàn)點擊日志中去除該沒有被用戶瀏覽到的內(nèi)容的信息,避免CTR模型中輸入不準確的數(shù)據(jù)。
[0111]本實施例通過將移動終端屏幕上展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,使得服務(wù)器中記錄有該展現(xiàn)內(nèi)容的信息,進而在后續(xù)流程中可以根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0112]本發(fā)明實施例還提供了一種數(shù)據(jù)處理裝置,該裝置包括殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內(nèi)部,處理器和存儲器設(shè)置在電路板上;電源電路,用于為裝置的各個電路或器件供電;存儲器用于存儲可執(zhí)行程序代碼;處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼對應(yīng)的程序,以用于執(zhí)行以下步驟:
[0113]S21’:獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容。
[0114]所述展現(xiàn)內(nèi)容的信息可以為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息。
[0115]進一步的,所述最后一條展現(xiàn)內(nèi)容的信息,包括:最后一條展現(xiàn)內(nèi)容的編號,以及最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度。
[0116]S22’:根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容。
[0117]例如,將在所述最后一條展現(xiàn)內(nèi)容的編號之前的展現(xiàn)內(nèi)容確定為已經(jīng)被用戶瀏覽到的內(nèi)容;以及,
[0118]根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容。
[0119]進一步的,可以在所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度與所述最后一條展現(xiàn)內(nèi)容的整體高度之間的比值大于預(yù)設(shè)的閾值時,確定所述最后一條展現(xiàn)內(nèi)容為被用戶瀏覽到的內(nèi)容。
[0120]進一步的,該預(yù)設(shè)的閾值可以具體為1/4。
[0121]S23’:在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
[0122]其中,相關(guān)技術(shù)中,展現(xiàn)點擊日志中會記錄每條搜索結(jié)果的信息,不論該條搜索結(jié)果是否被用戶瀏覽到。例如,用戶輸入一搜索詞后,服務(wù)器加載與該搜索詞對應(yīng)的所有搜索結(jié)果,假設(shè)所有的搜索結(jié)果的數(shù)目是8條,那么相關(guān)技術(shù)中展現(xiàn)點擊日志中會包含這8條搜索結(jié)果的信息,當用戶點擊其中的某條搜索結(jié)果時就是正例,否則為負例。但是,這8條搜索結(jié)果中可能會存在根本沒出現(xiàn)在屏幕上的結(jié)果,,相應(yīng)的,用戶不可能瀏覽到,造成數(shù)據(jù)不準確。
[0123]而本實施例中,對于用戶沒有瀏覽到的內(nèi)容,在展現(xiàn)點擊日志中去除該用戶沒有瀏覽到的內(nèi)容的信息,避免采用不準確的數(shù)據(jù)進行預(yù)測。
[0124]其中,本實施例的執(zhí)行主體可以是數(shù)據(jù)處理裝置,通過該裝置可以得到處理后的展現(xiàn)點擊日志,該處理后的展現(xiàn)點擊日志可以用在CTR建模等場合。
[0125]本實施例通過根據(jù)移動終端屏幕上展現(xiàn)內(nèi)容的信息確定沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除沒有被用戶瀏覽到的內(nèi)容的信息,一方面由于去除了部分信息可以降低CTR模型的輸入數(shù)據(jù)量,另一方面由于去除了沒有被用戶瀏覽到的內(nèi)容的信息,可以避免將不準確的信息作為模型的輸入數(shù)據(jù),提高模型的預(yù)估準確率。
[0126]需要說明的是,在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。
[0127]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0128]應(yīng)當理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。
[0129]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
[0130]此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。
[0131 ] 上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0132]在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。
[0133]盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變型。
【權(quán)利要求】
1.一種數(shù)據(jù)處理方法,其特征在于,包括: 對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的; 獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容; 將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述展現(xiàn)內(nèi)容的信息為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述最后一條展現(xiàn)內(nèi)容的信息,包括: 最后一條展現(xiàn)內(nèi)容的編號,以便將編號在所述最后一條展現(xiàn)內(nèi)容的編號之前的展現(xiàn)內(nèi)容確定為已經(jīng)被用戶瀏覽到的內(nèi)容;以及, 最后一條展現(xiàn)內(nèi) 容的展現(xiàn)高度,以便根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容。
4.一種數(shù)據(jù)處理方法,其特征在于,包括: 獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容; 根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容; 在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述展現(xiàn)內(nèi)容的信息為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述最后一條展現(xiàn)內(nèi)容的信息,包括:最后一條展現(xiàn)內(nèi)容的編號,以及最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度,所述根據(jù)所述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,包括: 將在所述最后一條展現(xiàn)內(nèi)容的編號之前的展現(xiàn)內(nèi)容確定為已經(jīng)被用戶瀏覽到的內(nèi)容;以及, 根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容,包括: 當所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度與所述最后一條展現(xiàn)內(nèi)容的整體高度之間的比值大于預(yù)設(shè)的閾值時,確定所述最后一條展現(xiàn)內(nèi)容為被用戶瀏覽到的內(nèi)容。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于, 所述預(yù)設(shè)的閾值為1/4。
9.一種數(shù)據(jù)處理裝置,其特征在于,包括: 展現(xiàn)模塊,用于對搜索結(jié)果進行展現(xiàn),所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的;獲取模塊,用于獲取移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容; 發(fā)送模塊,用于將所述展現(xiàn)內(nèi)容的信息發(fā)送給服務(wù)器,以使所述服務(wù)器記錄所述展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息用于獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容,并在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述獲取模塊獲取的所述展現(xiàn)內(nèi)容的信息為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述最后一條展現(xiàn)內(nèi)容的信息,包括: 最后一條展現(xiàn)內(nèi)容的編號,以便將編號在所述最后一條展現(xiàn)內(nèi)容的編號之前的展現(xiàn)內(nèi)容確定為已經(jīng)被用戶瀏覽到的內(nèi)容;以及, 最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度,以便根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容。
12.—種數(shù)據(jù)處理裝置,其特征在于,還包括: 獲取模塊,用于獲取服務(wù)器中記錄的移動終端屏幕上展現(xiàn)內(nèi)容的信息,所述展現(xiàn)內(nèi)容的信息是所述移動終端對搜索結(jié)果進行展現(xiàn)后得到并發(fā)送給所述服務(wù)器的,所述搜索結(jié)果是根據(jù)用戶輸入的搜索詞得到的,所述展現(xiàn)內(nèi)容包括:初始屏幕展現(xiàn)內(nèi)容,以及,用戶每次滑屏后的屏幕展現(xiàn)內(nèi)容; 確定模塊,用于根據(jù)所 述展現(xiàn)內(nèi)容的信息獲取所述搜索結(jié)果中沒有被用戶瀏覽到的內(nèi)容; 去除模塊,用于在展現(xiàn)點擊日志中去除所述沒有被用戶瀏覽到的內(nèi)容的信息。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述展現(xiàn)內(nèi)容的信息為移動終端屏幕上最后一條展現(xiàn)內(nèi)容的信息。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述最后一條展現(xiàn)內(nèi)容的信息,包括:最后一條展現(xiàn)內(nèi)容的編號,以及最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度,所述確定模塊具體用于: 將在所述最后一條展現(xiàn)內(nèi)容的編號之前的展現(xiàn)內(nèi)容確定為已經(jīng)被用戶瀏覽到的內(nèi)容;以及, 根據(jù)所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度確定所述最后一條展現(xiàn)內(nèi)容是否為被用戶瀏覽到的內(nèi)容。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述確定模塊具體用于: 當所述最后一條展現(xiàn)內(nèi)容的展現(xiàn)高度與所述最后一條展現(xiàn)內(nèi)容的整體高度之間的比值大于預(yù)設(shè)的閾值時,確定所述最后一條展現(xiàn)內(nèi)容為被用戶瀏覽到的內(nèi)容。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于, 所述預(yù)設(shè)的閾值為1/4。
【文檔編號】G06F17/30GK103995852SQ201410198312
【公開日】2014年8月20日 申請日期:2014年5月12日 優(yōu)先權(quán)日:2014年5月12日
【發(fā)明者】趙蓮, 朱延峰, 路華生, 郭佳聘, 鄭清江 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1