專利名稱:一種預(yù)估網(wǎng)絡(luò)廣告效果的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,更具體地,涉及一種預(yù)估網(wǎng)絡(luò)廣告效果的方法及系統(tǒng)。
背景技術(shù):
網(wǎng)絡(luò)廣告稱為在線廣告或者互聯(lián)網(wǎng)廣告,是以計算機(jī)為核心,計算機(jī)網(wǎng)絡(luò)為媒介 的廣告行為。網(wǎng)絡(luò)廣告效果預(yù)估結(jié)果的高低,與該網(wǎng)絡(luò)廣告的直接收益有著密切的聯(lián)系?,F(xiàn) 有廣告效果預(yù)估方法是一種以經(jīng)驗(yàn)為主的預(yù)估方法,即根據(jù)廣告位在前一個預(yù)測周期內(nèi)的 實(shí)際效果數(shù)據(jù),取其平均值作為下一個預(yù)測周期的預(yù)估結(jié)果。比如在11月底,想要預(yù)估12月份的某一廣告位的曝光數(shù)。曝光數(shù)是統(tǒng)計周期內(nèi), 用戶瀏覽網(wǎng)站頁面的總次數(shù),重復(fù)訪問則重復(fù)統(tǒng)計。以經(jīng)驗(yàn)為主的預(yù)估方法是將11月份的 該廣告位每天的曝光數(shù)相加,然后求平均作為12月份該廣告位曝光的預(yù)估效果。實(shí)際上就 是利用廣告位近期的效果估算下一個周期的效果。然而,影響廣告投放效果的因素有很多,在不同周期內(nèi)影響因素是不一樣的,僅僅 根據(jù)廣告位在前一預(yù)測周期內(nèi)的實(shí)際效果數(shù)據(jù)無法對下一周期內(nèi)的效果做出準(zhǔn)確的預(yù)估。 另外,以經(jīng)驗(yàn)為主的預(yù)估方法對同一廣告位上的不同廣告,得到的是單一的預(yù)估結(jié)果,無法 根據(jù)不同的投放條件做出不同的效果預(yù)估。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提出一種預(yù)估網(wǎng)絡(luò)廣告效果的方法,可以對廣告投放效果做出高精 度預(yù)測且預(yù)估結(jié)果是多樣化的。本發(fā)明實(shí)施例還提出一種預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),可以對廣告投放效果做出高 精度預(yù)測且預(yù)估結(jié)果是多樣化的。本發(fā)明實(shí)施例的技術(shù)方案如下一種預(yù)估網(wǎng)絡(luò)廣告效果的方法,該方法包括將原始數(shù)據(jù)依據(jù)廣告效果影響因子進(jìn)行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據(jù)廣告效果影響子因子,采用回歸分析和重抽樣算法Bagging建立至少于一個 預(yù)估模型;由交叉驗(yàn)證方法從預(yù)估模型中選擇出最佳預(yù)估模型;利用最佳預(yù)估模型對下一預(yù)測周期內(nèi)的廣告效果進(jìn)行預(yù)估,得到廣告預(yù)估效果。所述交叉驗(yàn)證算法是十折交叉驗(yàn)證算法。所述廣告效果影響因子包括廣告位屬性、廣告屬性、日期因子、廣告主屬性、用戶 屬性、歷史效果數(shù)據(jù)屬性、突發(fā)事件和偶然因子。所述回歸分析方法包括保序回歸IsotonicRegression、回歸剪枝樹REPTree和局 部力口權(quán)回歸 Locally weighted learning。所述將原始數(shù)據(jù)依據(jù)廣告效果影響因子進(jìn)行分類與所述從廣告效果影響因子提取廣告效果影響子因子之間進(jìn)一步包括,對分類后的原始數(shù)據(jù)進(jìn)行預(yù)處理。所述預(yù)處理包括利用預(yù)估廣告位上一周期內(nèi)的效果數(shù)據(jù)的平均值替代缺失或錯 誤數(shù)據(jù)。所述預(yù)處理包括對數(shù)據(jù)進(jìn)行平滑處理,得到缺失或錯誤數(shù)據(jù)。所述得到廣告預(yù)估效果后進(jìn)一步包括,根據(jù)廣告預(yù)估效果安排不同廣告的投放時 間。所述得到廣告預(yù)估效果后進(jìn)一步包括,根據(jù)廣告預(yù)估效果和實(shí)際效果發(fā)現(xiàn)原始數(shù) 據(jù)的錯誤,對原始數(shù)據(jù)進(jìn)行校正。一種預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),該系統(tǒng)包括數(shù)據(jù)模塊,將原始數(shù)據(jù)依據(jù)廣告效果影響因子進(jìn)行分類。特征模塊,從廣告效果影響因子中提取廣告效果影響子因子。模型模塊,依據(jù)廣告效果影響子因子,采用回歸分析和重抽樣算法Bagging建立 至少一個預(yù)估模型,由交叉驗(yàn)證方法從預(yù)估模型中選擇出最佳預(yù)估模型,利用最佳預(yù)估模 型對下一預(yù)測周期內(nèi)的廣告效果進(jìn)行預(yù)估,得到廣告預(yù)估效果。所述模型模塊由十折交叉驗(yàn)證方法從預(yù)估模型中選擇出最佳預(yù)估模型。所述系統(tǒng)進(jìn)一步包括預(yù)處理模塊,對分類后的原始數(shù)據(jù)進(jìn)行預(yù)處理。所述預(yù)處理模塊包括替代單元,利用預(yù)估廣告位上一周期內(nèi)的效果數(shù)據(jù)的平均值 替代缺省或錯誤數(shù)據(jù)。所述預(yù)處理模塊包括平滑處理單元,對數(shù)據(jù)進(jìn)行平滑處理,得到缺失或錯誤數(shù)據(jù)。所述系統(tǒng)進(jìn)一步包括分析模塊,對預(yù)處理后的廣告效果因子進(jìn)行分析,為廣告產(chǎn) 品的設(shè)計,廣告創(chuàng)意的設(shè)計提供支持;排期模塊,根據(jù)廣告預(yù)估效果安排不同廣告的投放時間;監(jiān)控模塊,根據(jù)廣告預(yù)估效果和實(shí)際效果發(fā)現(xiàn)原始數(shù)據(jù)的錯誤,對原始數(shù)據(jù)進(jìn)行 校正。從上述技術(shù)方案中可以看出,在本發(fā)明實(shí)施例中,將原始數(shù)據(jù)依據(jù)廣告效果影響 因子進(jìn)行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據(jù)廣告效果影響子因 子,采用回歸分析和重抽樣算法Bagging建立不少于一個預(yù)估模型;由十折交叉驗(yàn)證方法 從預(yù)估模型中選擇出最佳預(yù)估模型;利用最佳預(yù)估模型對下一預(yù)測周期內(nèi)的廣告效果進(jìn)行 預(yù)估,得到廣告預(yù)估效果。由不同的廣告效果影響因子建??梢詫V告投放效果做出高精 度預(yù)測,且輸入不同的廣告效果影響因子有不同的預(yù)估結(jié)果。
圖1為本發(fā)明實(shí)施例一種預(yù)估網(wǎng)絡(luò)廣告效果的方法中模型選擇示意圖;圖2為本發(fā)明實(shí)施例中廣告效果影響因子的分類示意圖;圖3為本發(fā)明實(shí)施例一種預(yù)估網(wǎng)絡(luò)廣告效果的方法流程示意圖;圖4為本發(fā)明實(shí)施例一種預(yù)估網(wǎng)絡(luò)廣告效果的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)表達(dá)得更加清楚明白,下面結(jié)合附圖及具體實(shí)施例對本發(fā)明再作進(jìn)一步詳細(xì)的說明。在本發(fā)明實(shí)施例中,通過分析不同廣告效果影響因子與廣告效果之間的相關(guān)性, 提取出相關(guān)性大的影響因子作為預(yù)估模型的建模字段,采用回歸分析的方法建立廣告效果 預(yù)估模型,對廣告的曝光量和點(diǎn)擊量進(jìn)行有效預(yù)測。從而提高廣告效果的預(yù)估精度,并針對 不同的投放條件自動產(chǎn)生不同的預(yù)估效果。參見附圖1,廣告效果預(yù)估模型的構(gòu)建共采用了三種回歸分析方法,分別是保序回 歸(IsotonicRegression)、回歸剪枝樹(REPTree)以及局部加權(quán)回歸(Locally weighted learning) 0具體模型的訓(xùn)練采用了重抽樣算法(Bagging)的方法,即針對某一學(xué)習(xí)算法, 讓該學(xué)習(xí)算法訓(xùn)練多輪,每輪的訓(xùn)練數(shù)據(jù)由從初始的訓(xùn)練數(shù)據(jù)集中隨機(jī)采樣組成,每次采 樣固定比例的樣本,訓(xùn)練之后得到一個預(yù)估函數(shù)序列,最終的預(yù)估函數(shù)采用簡單平均方法 對示例進(jìn)行預(yù)測。同時,本發(fā)明中利用十折交叉驗(yàn)證方法對模型的參數(shù)進(jìn)行選擇,最后從所 有的模型中選擇出一個最優(yōu)的模型作為最佳預(yù)估模型。當(dāng)然也可以利用多種交叉驗(yàn)證方法 對模型的參數(shù)進(jìn)行選擇,例如,九折交叉驗(yàn)證方法,八折交叉驗(yàn)證方法等。如圖2所示,在本發(fā)明中廣告效果影響因子包括,廣告位屬性、廣告屬性、日期因 子、廣告主屬性、用戶屬性、歷史效果數(shù)據(jù)屬性、突發(fā)事件和偶然因子。每個廣告效果影響因 子又包括多個廣告效果影響子因子。廣告位屬性包括,廣告位大小、廣告位資源級別、廣告位所屬頻道及頻道的曝光數(shù) 據(jù)、廣告位分類、廣告位的輪播數(shù)、廣告位位置。廣告屬性包括,廣告播放類型、廣告輪播數(shù)、廣告的播出時間、是否彈出廣告、廣告 創(chuàng)意屬性(代言明星數(shù)、主色系、有無獎品吸引、互動、創(chuàng)意格式、清晰度、價格/促銷/獎 品、產(chǎn)品賣點(diǎn)/品牌特性、創(chuàng)意大小)。日期相關(guān)因子包括,是否工作日、是否農(nóng)歷節(jié)假日、是否陽歷節(jié)假日、是否西方節(jié) 日、季節(jié)性因子。廣告主屬性包括,廣告主所屬行業(yè)、廣告主在行業(yè)中的排名。用戶屬性包括,年齡、性別、地理、上網(wǎng)場景、時段、行為。歷史效果數(shù)據(jù)屬性包括,前η天的歷史效果數(shù)據(jù)、周同期歷史數(shù)據(jù)、月同期歷史數(shù) 據(jù)。突發(fā)事件和偶然因子包括,網(wǎng)站及頁面改版、重大社會事件(如高考、兩會等)。參見附圖3,是本發(fā)明實(shí)施例一種預(yù)估網(wǎng)絡(luò)廣告效果的方法流程示意圖,該方法具 體包括以下步驟步驟301、對所有收集到的數(shù)據(jù)按照廣告效果影響因子分類。將數(shù)據(jù)按照廣告位屬 性、廣告屬性、日期因子、廣告主屬性、用戶屬性、歷史效果數(shù)據(jù)屬性、突發(fā)事件和偶然因子 分類。 步驟302、對分類后的數(shù)據(jù)預(yù)處理。由于監(jiān)測錯誤或數(shù)據(jù)缺失等原因,首先需要對 原始數(shù)據(jù)進(jìn)行預(yù)處理,減少噪音數(shù)據(jù)對整個模型預(yù)估精度的影響。數(shù)據(jù)預(yù)處理主要包括以下兩種情況a)由于故障導(dǎo)致的數(shù)據(jù)缺失或者數(shù)據(jù)錯誤,則利用預(yù)估廣告位上一周期內(nèi)的效果 數(shù)據(jù)的平均值替代缺失或錯誤數(shù)據(jù)。b)對于未知原因的數(shù)據(jù)跳變進(jìn)行平滑處理。
平滑處理的公式如下
‘a(chǎn)vgPV-stdPV, PV < avgPV-stdPV
權(quán)利要求
1.一種預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在于,該方法包括將原始數(shù)據(jù)依據(jù)廣告效果影響因子進(jìn)行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據(jù)廣告效果影響子因子,采用回歸分析和重抽樣算法Bagging建立至少一個預(yù)估模型;由交叉驗(yàn)證方法從預(yù)估模型中選擇出最佳預(yù)估模型;利用最佳預(yù)估模型對下一預(yù)測周期內(nèi)的廣告效果進(jìn)行預(yù)估,得到廣告預(yù)估效果。
2.根據(jù)權(quán)利要求1所述預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在于,所述交叉驗(yàn)證算法是 十折交叉驗(yàn)證算法。
3.根據(jù)權(quán)利要求1所述預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在于,所述廣告效果影響因 子包括廣告位屬性、廣告屬性、日期因子、廣告主屬性、用戶屬性、歷史效果數(shù)據(jù)屬性、突發(fā) 事件和偶然因子。
4.根據(jù)權(quán)利要求1所述預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在于,所述回歸分析方法包 括保序回歸IsotonicRegression、回歸剪枝樹REPTree和局部加權(quán)回歸Locally weighted learning。
5.根據(jù)權(quán)利要求1所述預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在于,所述將原始數(shù)據(jù)依據(jù) 廣告效果影響因子進(jìn)行分類與所述從廣告效果影響因子提取廣告效果影響子因子之間進(jìn) 一步包括,對分類后的原始數(shù)據(jù)進(jìn)行預(yù)處理。
6.根據(jù)權(quán)利要求5所述預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在于,所述預(yù)處理包括利用 預(yù)估廣告位上一周期內(nèi)的效果數(shù)據(jù)的平均值替代缺失或錯誤數(shù)據(jù)。
7.根據(jù)權(quán)利要求5所述預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在于,所述預(yù)處理包括對數(shù) 據(jù)進(jìn)行平滑處理,得到缺失或錯誤數(shù)據(jù)。
8.根據(jù)權(quán)利要求1至7中任意一項(xiàng)權(quán)利要求所述預(yù)估網(wǎng)絡(luò)廣告效果的方法,其特征在 于,所述得到廣告預(yù)估效果后進(jìn)一步包括,根據(jù)廣告預(yù)估效果安排不同廣告的投放時間;根據(jù)廣告預(yù)估效果和實(shí)際效果發(fā)現(xiàn)原始數(shù)據(jù)的錯誤,對原始數(shù)據(jù)進(jìn)行校正。
9.一種預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),其特征在于,該系統(tǒng)包括數(shù)據(jù)模塊,將原始數(shù)據(jù)依據(jù)廣告效果影響因子進(jìn)行分類;特征模塊,從廣告效果影響因子中提取廣告效果影響子因子;模型模塊,依據(jù)廣告效果影響子因子,采用回歸分析和重抽樣算法Bagging建立至少 一個預(yù)估模型,由交叉驗(yàn)證方法從預(yù)估模型中選擇出最佳預(yù)估模型,利用最佳預(yù)估模型對 下一預(yù)測周期內(nèi)的廣告效果進(jìn)行預(yù)估,得到廣告預(yù)估效果。
10.根據(jù)權(quán)利要求9所述預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),其特征在于,所述模型模塊由十折 交叉驗(yàn)證方法從預(yù)估模型中選擇出最佳預(yù)估模型。
11.根據(jù)權(quán)利要求9所述預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),其特征在于,所述系統(tǒng)進(jìn)一步包括 預(yù)處理模塊,對分類后的原始數(shù)據(jù)進(jìn)行預(yù)處理。
12.根據(jù)權(quán)利要求11所述所述預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),其特征在于,所述預(yù)處理模 塊包括替代單元,利用預(yù)估廣告位上一周期內(nèi)的效果數(shù)據(jù)的平均值替代缺省或錯誤數(shù)據(jù)。
13.根據(jù)權(quán)利要求11所述所述預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),其特征在于,所述預(yù)處理模 塊包括平滑處理單元,對數(shù)據(jù)進(jìn)行平滑處理,得到缺失或錯誤數(shù)據(jù)。
14.根據(jù)權(quán)利要求10所述預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng),其特征在于,所述系統(tǒng)進(jìn)一步包 括排期模塊,根據(jù)廣告預(yù)估效果安排不同廣告的投放時間;監(jiān)控模塊,根據(jù)廣告預(yù)估效果和實(shí)際效果發(fā)現(xiàn)原始數(shù)據(jù)的錯誤,對原始數(shù)據(jù)進(jìn)行校正;分析模塊,對預(yù)處理后的廣告效果因子進(jìn)行分析,為廣告產(chǎn)品的設(shè)計,廣告創(chuàng)意的設(shè)計 提供支持。
全文摘要
一種預(yù)估網(wǎng)絡(luò)廣告效果的方法,該方法包括將原始數(shù)據(jù)依據(jù)廣告效果影響因子進(jìn)行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據(jù)廣告效果影響子因子,采用回歸分析和重抽樣算法Bagging建立不少于一個預(yù)估模型;由十折交叉驗(yàn)證方法從預(yù)估模型中選擇出最佳預(yù)估模型;利用最佳預(yù)估模型對下一預(yù)測周期內(nèi)的廣告效果進(jìn)行預(yù)估,得到廣告預(yù)估效果。本文還公開了一種預(yù)估網(wǎng)絡(luò)廣告效果的系統(tǒng)。應(yīng)用本發(fā)明實(shí)施例以后,可以對廣告投放效果做出高精度預(yù)測且預(yù)估結(jié)果是多樣化的。
文檔編號G06Q30/00GK102110265SQ20091026205
公開日2011年6月29日 申請日期2009年12月23日 優(yōu)先權(quán)日2009年12月23日
發(fā)明者劉大鵬, 葉幸春, 岳亞丁, 李多全, 李邕, 肖磊, 言艷花, 貢鳴, 賴曉平, 陳顯露, 陳永鋒, 黃華基 申請人:深圳市騰訊計算機(jī)系統(tǒng)有限公司