專利名稱:網(wǎng)站價值評估方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息網(wǎng)絡(luò)技術(shù),尤其涉及網(wǎng)站價值評估方法及裝置。
背景技術(shù):
自從互聯(lián)網(wǎng)技術(shù)發(fā)展起來,免費(fèi)和分享一直被視為與生俱來的“互聯(lián)網(wǎng)精神”,如何在提供免費(fèi)產(chǎn)品和服務(wù)的同時,維持網(wǎng)站的運(yùn)營甚至盈利,是擺在所有網(wǎng)站主面前的難題。截至到目前為止,互聯(lián)網(wǎng)廣告仍是網(wǎng)站最直接也是最有效的盈利模式之一。對互聯(lián)網(wǎng)廣告主而言,如何從成千上萬家網(wǎng)站中選出適合自己特定產(chǎn)品的網(wǎng)站進(jìn)行廣告展示,從而獲得最高的關(guān)注度并轉(zhuǎn)化為商業(yè)價值是一個需要解決的問題。傳統(tǒng)模式下對網(wǎng)站的評價一直以來都采用網(wǎng)頁級別(Page Rank,簡稱PR)方式, 該方式以流量大小評價網(wǎng)站的價值。但實際情況,有很多網(wǎng)站的流量可能并不非常大,但其內(nèi)容非常專業(yè)、高端,其面對的用戶群體也非常的專業(yè)高端,如果單純從流量角度來評價這些網(wǎng)站,無法真正體現(xiàn)其應(yīng)有的商業(yè)價值。PR方式利用網(wǎng)絡(luò)爬蟲技術(shù),抓取網(wǎng)頁,分析網(wǎng)頁內(nèi)容和網(wǎng)頁之間的鏈接關(guān)系;通過分析網(wǎng)頁之間的鏈接關(guān)系,衡量一個網(wǎng)頁的重要程度。PR方式是Google用來表示網(wǎng)頁重要性的綜合性指標(biāo),而且不會受到各種檢索的影響。I3R方式就是基于對“使用復(fù)雜的算法而得到的鏈接構(gòu)造”的分析,從而得出的各網(wǎng)頁本身的特性。I3R方式的基本原理是網(wǎng)站被許多頁面鏈接會使得其推薦度提高。簡單說即 “受歡迎的(被許多頁面鏈接的)頁面,必定是優(yōu)質(zhì)的頁面”。PR方式主要由三個反向鏈接相關(guān)指標(biāo)決定,即反向鏈接數(shù)(單純的意義上的受歡迎度指標(biāo));反向鏈接是否來自推薦度高的頁面(有根據(jù)的受歡迎指標(biāo));反向鏈接源頁面的鏈接數(shù)(被選中的幾率指標(biāo))?,F(xiàn)有ra方式只反映了頁面內(nèi)容的受歡迎程度,而廣告主所關(guān)注的是在這個網(wǎng)站上投放廣告投放效果,如點擊率和轉(zhuǎn)化率,這些指標(biāo)同用戶體驗、用戶心理、用戶喜好有很大關(guān)系,PR方式不能反映這種廣告的投放效果。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題之一是需要提供一種網(wǎng)站價值評估方法及裝置。為了解決上述技術(shù)問題,本發(fā)明提供了一種網(wǎng)站價值評估方法,該網(wǎng)站價值評估方法包括獲取步驟,獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù);建模步驟,確定影響網(wǎng)站價值的特征因素,根據(jù)所述特征因素來制定網(wǎng)站價值評估數(shù)據(jù)模型;以及參數(shù)確定步驟,利用所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)來對所述網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練,以確定所述網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),得到用于評價網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型。根據(jù)本發(fā)明另一方面的網(wǎng)站價值評估方法,所述參數(shù)確定步驟具體包括將第一網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第一網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,以及將第二網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第二網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為驗證數(shù)據(jù)集,以及基于驗證數(shù)據(jù)集來校驗所述網(wǎng)站價值評估數(shù)據(jù)確定模型是否導(dǎo)致了過擬合,若校驗結(jié)果為是,則重新確定所述第一網(wǎng)站集和所述第二網(wǎng)站集所包含的網(wǎng)站,返回所述參數(shù)確定步驟,其中,所述第一網(wǎng)站集與所述第二網(wǎng)站集不是同一集合。根據(jù)本發(fā)明另一方面的網(wǎng)站價值評估方法,在所述建模步驟中,所制定的網(wǎng)站價值評估數(shù)據(jù)模型表示為BR= f(xUi,yFi,zMi),其中,所述BR為商業(yè)級別,Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征,f表示多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法,χ、y和ζ為模型參數(shù);所述網(wǎng)站的經(jīng)營信息數(shù)據(jù)包括網(wǎng)站的年收入,將所述網(wǎng)站的年收入作為所制定的網(wǎng)站價值評估數(shù)據(jù)模型中與該網(wǎng)站對應(yīng)的BR值。根據(jù)本發(fā)明另一方面的網(wǎng)站價值評估方法,還包括評價步驟,將要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)輸入所得到的網(wǎng)站價值評估數(shù)據(jù)確定模型中以求得的BR值,作為用于評價所述要進(jìn)行商業(yè)價值評價的網(wǎng)站的網(wǎng)站商業(yè)價值的評價值。根據(jù)本發(fā)明另一方面的網(wǎng)站價值評估方法,所述評價步驟還包括將所述評價值劃分為多個區(qū)間,根據(jù)網(wǎng)站的評價值所處的區(qū)間來確定該網(wǎng)站的商業(yè)價值級別。根據(jù)本發(fā)明另一方面的網(wǎng)站價值評估方法,所述特征因素包括用戶特征、流量特征以及營銷特征,以及構(gòu)成所述用戶特征的特征因子包括用戶群體、人均瀏覽量和人均停留時間,構(gòu)成所述流量特征的特征因子包括頁面訪問量、IP量和獨立訪客量,構(gòu)成所述營銷特征的特征因子包括點擊率、轉(zhuǎn)換率和投資回報率。根據(jù)本發(fā)明另一方面的網(wǎng)站價值評估方法,所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)為設(shè)定時間段、設(shè)定地域和/或設(shè)定人群的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。根據(jù)本發(fā)明的另一方面,還提供了一種網(wǎng)站商業(yè)價值評估裝置包括獲取模塊 (61),其獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù);建模模塊(62),其確定影響網(wǎng)站價值的特征因素,根據(jù)所述特征因素來制定網(wǎng)站價值評估數(shù)據(jù)模型;以及參數(shù)確定模塊(63),其利用所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)來對所述網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練,以確定所述網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),得到用于評價網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型。根據(jù)本發(fā)明另一方面的網(wǎng)站商業(yè)價值評估裝置,所述參數(shù)確定模塊(6 包括訓(xùn)練子模塊,用于將第一網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第一網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,以及將第二網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第二網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為驗證數(shù)據(jù)集,以及驗證子模塊,用于基于驗證數(shù)據(jù)集來校驗所述網(wǎng)站價值評估數(shù)據(jù)確定模型是否導(dǎo)致了過擬合,若校驗結(jié)果為是,則重新確定所述第一網(wǎng)站集和所述第二網(wǎng)站集所包含的網(wǎng)站,返回所述參數(shù)確定模塊(63),其中,所述第一網(wǎng)站集與所述第二網(wǎng)站集不是同一集合。
根據(jù)本發(fā)明另一方面的網(wǎng)站商業(yè)價值評估裝置,所制定的網(wǎng)站價值評估數(shù)據(jù)模型表示為冊=^勸1,7付,2肌),其中,所述仍為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征,f表示多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法,χ、y和ζ為模型參數(shù);所獲取的經(jīng)營信息數(shù)據(jù)包括網(wǎng)站的年收入,將所述網(wǎng)站的年收入作為所制定的網(wǎng)站價值評估數(shù)據(jù)模型中與該網(wǎng)站對應(yīng)的BR值。根據(jù)本發(fā)明另一方面的網(wǎng)站商業(yè)價值評估裝置還包括評價模塊(64),其將要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)輸入所得到的網(wǎng)站價值評估數(shù)據(jù)確定模型中以求得BR值,作為用于評價所述要進(jìn)行商業(yè)價值評價的網(wǎng)站的網(wǎng)站商業(yè)價值的評價值。根據(jù)本發(fā)明的另一方面,還提供了一種網(wǎng)站商業(yè)價值評估方法包括通過如下步驟對網(wǎng)站商業(yè)價值進(jìn)行評估(1)對用戶瀏覽行為數(shù)據(jù)進(jìn)行收集和存儲;從公開途徑收集網(wǎng)站的經(jīng)營和財務(wù)信息;(2)確定影響網(wǎng)站價值的特征因素,對評估模型進(jìn)行制定;(3)確定模型參數(shù),建立網(wǎng)站價值評估數(shù)據(jù)模型;(4)將網(wǎng)站價值評估數(shù)據(jù)模型用于評估網(wǎng)站價值;(5)通過驗證數(shù)據(jù)集合,對模型進(jìn)行優(yōu)化,以提高系統(tǒng)在現(xiàn)實復(fù)雜情況下的魯棒性和模型精度,確認(rèn)最終模型;(6)將用戶行為參數(shù)套用入最終模型中,評價其網(wǎng)站商業(yè)價值。根據(jù)本發(fā)明另一方面的網(wǎng)站價值評估方法,所述模型參數(shù)通過如下公式計算獲得,BR = f(xUi, yFi,zMi),所述Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征。根據(jù)本發(fā)明的另一方面,還提供了一種網(wǎng)站商業(yè)價值評估系統(tǒng),包括用于對用戶瀏覽行為數(shù)據(jù)進(jìn)行收集和存儲的商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng),所述兩系統(tǒng)將數(shù)據(jù)傳輸給用于建立網(wǎng)站價值評估數(shù)據(jù)模型的數(shù)據(jù)訓(xùn)練系統(tǒng),所述數(shù)據(jù)訓(xùn)練系統(tǒng)同時還接收用于驗證數(shù)據(jù)的模型評估系統(tǒng)。根據(jù)本發(fā)明另一方面的網(wǎng)站商業(yè)價值評估系統(tǒng),所述數(shù)據(jù)訓(xùn)練系統(tǒng)包括模型庫, 所述模型庫設(shè)有用于模型選擇模塊,所述模型選擇模塊輸出所選模型,所述所選模型接收商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù),所述所選模型通過參數(shù)計算模塊,形成確認(rèn)模塊輸出,所述確認(rèn)模塊進(jìn)入校驗?zāi)K進(jìn)行優(yōu)化,所述校驗?zāi)K接收模型評估系統(tǒng)數(shù)據(jù)。根據(jù)本發(fā)明另一方面的網(wǎng)站商業(yè)價值評估系統(tǒng),所述模型評估系統(tǒng)包括商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)。與現(xiàn)有技術(shù)相比,本發(fā)明至少具有以下優(yōu)點在本發(fā)明中,根據(jù)所構(gòu)建的網(wǎng)站價值評估數(shù)據(jù)模型得到的各個網(wǎng)站的評價值處于時間、地域以及人群三維空間中,各個網(wǎng)站可以根據(jù)其自身網(wǎng)站的評價值找到跟其所要投放的智能廣告的內(nèi)容相匹配的用戶群,并且廣告主也可以通過評價值來正確決策其所要投放的廣告應(yīng)該在哪些網(wǎng)站上進(jìn)行投放,提高廣告主的廣告投放效果。本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中圖1是根據(jù)本發(fā)明第一實施例的網(wǎng)站價值評估方法的流程示意圖;圖2是根據(jù)本發(fā)明第二實施例的網(wǎng)站價值評估系統(tǒng)的結(jié)構(gòu)示意圖;圖3是根據(jù)本發(fā)明第三實施例的網(wǎng)站價值評估方法的流程示意圖;圖4是根據(jù)本發(fā)明第三實施例的構(gòu)建網(wǎng)站價值評估數(shù)據(jù)模型的流程示意圖;圖5是根據(jù)本發(fā)明第三實施例的影響評價值的特征組成結(jié)構(gòu)示例圖;圖6是根據(jù)本發(fā)明第四實施例的網(wǎng)站價值評估裝置的結(jié)構(gòu)示意圖。
具體實施例方式以下將結(jié)合附圖及實施例來詳細(xì)說明本發(fā)明的實施方式,借此對本發(fā)明如何應(yīng)用技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實現(xiàn)過程能充分理解并據(jù)以實施。需要說明的是,只要不構(gòu)成沖突,本發(fā)明中的各個實施例以及各實施例中的各個特征可以相互結(jié)合, 所形成的技術(shù)方案均在本發(fā)明的保護(hù)范圍之內(nèi)。另外,在附圖的流程圖示出的步驟可以在諸如一組計算機(jī)可執(zhí)行指令的計算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。第一實施例圖1是根據(jù)本發(fā)明第一實施例的網(wǎng)站價值評估方法的流程示意圖,下面參照圖1 詳細(xì)說明該方法的各步驟。如圖1所述的網(wǎng)站商業(yè)價值評估方法,通過如下步驟對網(wǎng)站商業(yè)價值進(jìn)行評估步驟(1),獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)以及通過公開途徑獲取設(shè)定數(shù)量網(wǎng)站的經(jīng)營信息數(shù)據(jù);步驟O),確定影響網(wǎng)站價值的特征因素,根據(jù)確定的特征因素對網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行制定;步驟(3),通過數(shù)據(jù)訓(xùn)練,確定模型參數(shù),建立網(wǎng)站價值評估數(shù)據(jù)模型;步驟,將網(wǎng)站價值評估數(shù)據(jù)模型用于評估網(wǎng)站價值;步驟(5),通過驗證數(shù)據(jù)集合,對模型進(jìn)行優(yōu)化,以提高系統(tǒng)在現(xiàn)實復(fù)雜情況下的魯棒性和模型精度,確認(rèn)最終模型;步驟(6),將用戶行為參數(shù)套用入最終模型中,評價其他網(wǎng)站的商業(yè)價值。所述制定的網(wǎng)站價值評估數(shù)據(jù)模型表示為BR= f(xUi,yFi,zMi),其中,BR為商業(yè)級別,Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征,f表示多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法,χ、y和ζ為模型參數(shù)。用戶特征包括但不限于以下特征因子用戶群體,人均瀏覽量和人均停留時間。流量特征包括但不限于以下特征因子頁面訪問量PV,IP和獨立訪客量UV0營銷特征包括但不限于以下特征因子點擊率,轉(zhuǎn)化率和R0I。
通常,網(wǎng)站的商業(yè)價值可以用下列公式表示網(wǎng)站的商業(yè)價值=f (用戶數(shù)量(頻次),單個用戶(頻次)的價值(廣告收入或購買收入),此公式是計算網(wǎng)站商業(yè)價值最直接的方法,但單個用戶的價值很難量化,則此公式在實際情況中很難實現(xiàn),因此采用BR公式來替代此公式。上述網(wǎng)站的商業(yè)價值公式中,用戶數(shù)量反映商業(yè)規(guī)模,對于任何商業(yè)模式而言,規(guī)模效益是很重要的。諸如軟件業(yè)的微軟、搜索引擎的谷歌和IM的騰訊,都是憑借規(guī)模效益, 獲得了傳統(tǒng)商業(yè)模式難以企及的收入規(guī)模。規(guī)模效益在信息服務(wù)領(lǐng)域尤為重要。對于廣告主而言,用戶數(shù)量包含了多種參數(shù),如IP,PV,UV等。針對不同廣告主的不同需求,其重要性也不同。單個用戶價值是每個用戶所能帶來的消費(fèi)量和廣告收入,而用戶消費(fèi)量和廣告接受程度同用戶的多維屬性有密切關(guān)系,如性別、年齡、職業(yè)、收入、受教育程度、家庭角色、興趣愛好、地域分布等,因此在考慮單個用戶價值時要考慮上述因素。本實施例是基于時間、地域、人群三維空間對網(wǎng)站的商業(yè)價值進(jìn)行動態(tài)的評價。網(wǎng)站的商業(yè)價值由多個維度的因素決定,它往往是一個隨時間、地域、行業(yè)的不同而不斷變化的值。為了維護(hù)價值評估算法的效率,需要在維度劃分粒度和算法的復(fù)雜性之間保持平衡。但如果過分的細(xì)分這三個維度,又會導(dǎo)致算法過于復(fù)雜,反而失去了意義。如時間粒度可以按年、月、日來進(jìn)行劃分,地域可以以國家、行政區(qū)、城市劃分,而人群則可以用人口統(tǒng)計維度、興趣愛好等來劃分。BR值可以指導(dǎo)網(wǎng)站找到跟其內(nèi)容,用戶群等相匹配的廣告,廣告主也可以通過BR 值來正確決策其廣告應(yīng)該在哪些網(wǎng)站進(jìn)行展現(xiàn)。在本實施例中的影響B(tài)R值的三大影響特征因素Ui、Fi、Mi中,網(wǎng)站可以通過不斷優(yōu)化Fi來帶動Ui和Mi的提升,而Ui和Mi的直接提升則是通過該網(wǎng)站在實際商用中的表現(xiàn)來決定。廣告主可以通過其自身產(chǎn)品處在的推廣期,綜合權(quán)衡Ui,F(xiàn)i,Mi進(jìn)行廣告投放的決策。網(wǎng)站商業(yè)價值評估體系可采用分級體系,如1-10級,將在某一BR值區(qū)間的所有網(wǎng)站分在同一級內(nèi)。為了使不同網(wǎng)站有統(tǒng)一評估標(biāo)準(zhǔn)并計算影響因子系數(shù),本實施例采用網(wǎng)站的年收入作為網(wǎng)站商業(yè)價值的參照物。首先通過網(wǎng)絡(luò)監(jiān)控或網(wǎng)站對用戶訪問進(jìn)行監(jiān)測, 得到Ui,F(xiàn)i, Mi特征中的參數(shù),然后獲取該網(wǎng)站的年收入,得到以下方程BR1 = f (A1U1. . . AnUn, B1F1. . . BnFn, C1M1. . . CnMn)BR2 = f (A1U1. · · AnUn‘ B1F1. · · BnFn, C1M1. · · CnMn)BRn = f (A1U1. · · AnUn,B1F1. · · BnFn, C1M1. · · CnMn)通過多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法即可導(dǎo)出參數(shù)A1... An,B1. . . Bn, C1. . . Cn, 由此得到BR計算公式,當(dāng)需要某一網(wǎng)站的BR值時,只需將BR的影響因素Ui,F(xiàn)i,Mi代入公式,即可得到該網(wǎng)站的BR值。第二實施例圖2示出根據(jù)本發(fā)明第二實施例的網(wǎng)站商業(yè)價值評估系統(tǒng)的結(jié)構(gòu)示意圖。下面參考圖2來說明本實施例的各部分組成。如圖2所示一種網(wǎng)站商業(yè)價值評估系統(tǒng),包括用于對用戶瀏覽行為數(shù)據(jù)進(jìn)行收集和存儲的商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng),商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)將數(shù)據(jù)傳輸給用于建立網(wǎng)站價值評估數(shù)據(jù)模型的數(shù)據(jù)訓(xùn)練系統(tǒng),數(shù)據(jù)訓(xùn)練系統(tǒng)同時還接收來自模型評估系統(tǒng)中用于驗證的數(shù)據(jù)。其中,數(shù)據(jù)訓(xùn)練系統(tǒng)包括模型庫,模型庫包括模型選擇模塊,模型選擇模塊輸出所選模型,所選模型接收存儲在商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù),所選模型通過參數(shù)計算模塊,形成確認(rèn)模型輸出,校驗?zāi)K通過接收模型評估系統(tǒng)的驗證數(shù)據(jù)對確認(rèn)的模型進(jìn)行優(yōu)化,其中模型評估系統(tǒng)也包括商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)。第三實施例圖3是根據(jù)本發(fā)明第三實施例的網(wǎng)站商業(yè)價值評估方法的流程示意圖,下面參照圖3詳細(xì)說明該方法的各步驟。步驟310,獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù),該步驟為獲取步
馬聚ο具體地,通過網(wǎng)絡(luò)數(shù)據(jù)獲取技術(shù)獲取多個網(wǎng)站中的用戶進(jìn)行網(wǎng)絡(luò)行為的所有數(shù)據(jù)、并對所獲得的數(shù)據(jù)進(jìn)行預(yù)處理以得到可體現(xiàn)用戶網(wǎng)絡(luò)行為的用戶網(wǎng)絡(luò)行為數(shù)據(jù),以及通過公開途徑獲取多個網(wǎng)站的經(jīng)營信息數(shù)據(jù)。其中,用戶的網(wǎng)絡(luò)行為可以為用戶的瀏覽行為,網(wǎng)站的經(jīng)營信息主要包括網(wǎng)站的年收入。更具體地,由于用于表征用戶網(wǎng)絡(luò)行為的主要數(shù)據(jù)來自網(wǎng)站的網(wǎng)絡(luò)服務(wù)器中的日志文件集。這些日志文件包含了訪問該網(wǎng)絡(luò)站點的關(guān)于每個訪問者超文本傳輸協(xié)議(簡稱 HTTP)事務(wù)的執(zhí)行記錄,因此可以通過利用網(wǎng)絡(luò)數(shù)據(jù)包嗅探技術(shù)或網(wǎng)絡(luò)爬蟲技術(shù)等網(wǎng)絡(luò)數(shù)據(jù)捕獲技術(shù)、從日志文件集中獲取用于表征用戶網(wǎng)絡(luò)行為的數(shù)據(jù)。但是,由于實際獲得的數(shù)據(jù)具有不完全的相關(guān)性、冗余性和概念上的模糊性、以及用于審計的海量數(shù)據(jù)中可能存在大量的無意義信息等問題,致使所獲取的數(shù)據(jù)需要進(jìn)行預(yù)處理以構(gòu)建和辨認(rèn)具有可體現(xiàn)用戶網(wǎng)絡(luò)行為的信息,例如,可以通過引入數(shù)據(jù)包過濾機(jī)制對這些數(shù)據(jù)進(jìn)行預(yù)處理。需要說明的是,本步驟310所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)為設(shè)定時間段、設(shè)定地域、 和/或設(shè)定人群的用戶網(wǎng)絡(luò)行為數(shù)據(jù),并將時間段、地域和人群這三個因素作為三維空間對網(wǎng)站的價值進(jìn)行動態(tài)的評價。具體地,將這三個因素作為一個三維空間坐標(biāo)來評價一個網(wǎng)站處于不同設(shè)定的時間段、不同設(shè)定的地域和/或不同設(shè)定的人群時的商業(yè)價值。在劃分維度粒度時,需要同時維護(hù)網(wǎng)站價值評估方法的效率,以保持維度劃分粒度和網(wǎng)站價值評估方法的復(fù)雜性之間的平衡。例如,將時間維度的粒度劃分為年、月、日,將地域維度的劃分為國家、行政區(qū)、城市, 將人群的維度劃分為人口數(shù)量以及興趣愛好,基于以上維度粒度的劃分方式來獲取用戶網(wǎng)絡(luò)行為數(shù)據(jù)。步驟320,確定影響網(wǎng)站價值的特征因素,根據(jù)所述特征因素來制定網(wǎng)站價值評估數(shù)據(jù)模型,該步驟為建模步驟。在本實施例中將用于計算商業(yè)級別(Business Rank,簡稱BR)值的公式作為所制定網(wǎng)站價值評估數(shù)據(jù)模型,將BR值作為用于評價所述要進(jìn)行商業(yè)價值評價的網(wǎng)站的網(wǎng)站商業(yè)價值的評價值。因此,將影響評價值的特征因素作為影響網(wǎng)站價值的特征因素。圖5是根據(jù)本發(fā)明第三實施例的影響評價值的特征因素組成結(jié)構(gòu)示例圖,請參考圖5,優(yōu)選地,本實施例將影響B(tài)R值的特征因素設(shè)定為客觀反映網(wǎng)站的用戶特征(簡稱Ui)、流量特征(簡稱Fi)和營銷特征(簡稱Mi)。所制定的網(wǎng)站價值評估數(shù)據(jù)模型表示為BR = f (xUi, yFi, zMi)(1)在公式(1)中,BR為商業(yè)級別,Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征,f表示多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法,χ、y和ζ為模型參數(shù)。需要說明的是,影響B(tài)R值的每一個特征由設(shè)定量的特征因子構(gòu)成,如圖5所示,優(yōu)選地,本實施例中的構(gòu)成用戶特征的特征因子為用戶群體、人均瀏覽量和人均停留時間,構(gòu)成流量特征的特征因子為頁面訪問量(簡稱PV)、IP量和獨立訪客量(簡稱UV量),構(gòu)成營銷特征的特征因子為點擊率、轉(zhuǎn)換率和投資回報率(簡稱R0I),則BR值的計算公式可如下所示BR = f (A1U1, A2U2,· · ·,AnUn, B1F1,B2F2,· · ·,BkFk, C1M1,C#2,· · ·,CjMj) (2)在公式O)中,A1... An表示特征因素為用戶特征Ui的η個特征參數(shù),相當(dāng)于公式 (1)中的模型參數(shù)χ;B1... 表示特征因素為流量特征Fi的k個特征參數(shù),相當(dāng)于公式(1)中的模型參數(shù)y ;C1... Cj表示特征因素為營銷特征Mi的j個特征參數(shù),相當(dāng)于公式(1)中的模型參數(shù)ζ ;U1... Un表示特征因素為用戶特征Ui的η個特征因子,相當(dāng)于公式(1)中的用戶特征Ui ;F1... Fk表示特征因素為流量特征Fi的k個特征因子,相當(dāng)于公式(1)中的用戶特征Fi ;M1...M^表示特征因素為營銷特征Mi的j個特征因子,相當(dāng)于公式⑴中的用戶特征Mi。在本實施例中,將影響B(tài)R值的特征因素設(shè)定為網(wǎng)站價值評估數(shù)據(jù)模型的特征因素,BR值計算公式中的特征參數(shù)對應(yīng)于網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),其中,特征參數(shù)的數(shù)量值與特征因素的數(shù)量值相等。步驟330,利用所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)來對所制定的網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練以確定網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),從而得到用于評價網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型,該步驟為參數(shù)確定步驟。具體地,基于所獲取的經(jīng)營信息數(shù)據(jù)和與模型特征因素相關(guān)的用戶網(wǎng)絡(luò)行為數(shù)據(jù)構(gòu)建訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集,然后利用訓(xùn)練數(shù)據(jù)集來訓(xùn)練出網(wǎng)站價值評估數(shù)據(jù)確定模型,亦即訓(xùn)練出該模型的模型參數(shù)以及訓(xùn)練數(shù)據(jù)集中數(shù)據(jù)之間的映射關(guān)系,由于A1...々 相當(dāng)于公式(1)中的模型參數(shù)LB1...^相當(dāng)于公式(1)中的模型參數(shù)γ,、..。相當(dāng)于公式 ⑴中的模型參數(shù)z,得到上述網(wǎng)站價值評估數(shù)據(jù)模型公式⑵中A1. . . An, B1. . . Bk, C1. . . Cj 的具體數(shù)值,即可以得到模型參數(shù)χ、模型參數(shù)y和模型參數(shù)z,從而得到最終模型即網(wǎng)站價值評估數(shù)據(jù)確定模型。然后,基于驗證數(shù)據(jù)集來校驗由訓(xùn)練數(shù)據(jù)集訓(xùn)練出的網(wǎng)站價值評估數(shù)據(jù)確定模型是否導(dǎo)致了過擬合,若校驗結(jié)果為是,則重新構(gòu)建與前一次使用的訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集數(shù)據(jù)不同的訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集數(shù)據(jù)、來對網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練,重新確定網(wǎng)站價值評估數(shù)據(jù)確定模型的模型參數(shù)。舉例而言,圖4是根據(jù)本發(fā)明第三實施例的構(gòu)建網(wǎng)站價值評估數(shù)據(jù)模型的流程示意圖,下面參照圖4詳細(xì)說明該模型的各步驟。步驟3301,基于經(jīng)營信息數(shù)據(jù)和與特征因素相關(guān)的用戶網(wǎng)絡(luò)行為數(shù)據(jù)構(gòu)建訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集。具體地,在多個網(wǎng)站中設(shè)定第一網(wǎng)站集和第二網(wǎng)站集,將第一網(wǎng)站集中網(wǎng)站的經(jīng)營信息數(shù)據(jù)和第一網(wǎng)站集的與特征因素相關(guān)的用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,以及將第二網(wǎng)站集中網(wǎng)站的經(jīng)營信息數(shù)據(jù)和第二網(wǎng)站集的與特征因素相關(guān)的用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為驗證數(shù)據(jù)集,其中,第一網(wǎng)站集與第二網(wǎng)站集不是同一集合。需要說明的是,訓(xùn)練數(shù)據(jù)集和驗證訓(xùn)練集的數(shù)據(jù)可以僅為經(jīng)營信息數(shù)據(jù)和與特征因素相關(guān)的用戶網(wǎng)絡(luò)行為數(shù)據(jù)中的一部分,訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)和驗證訓(xùn)練集的數(shù)據(jù)可以部分相同或完全不同。舉例而言,在獲取的多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)中選取N個網(wǎng)站的用戶的網(wǎng)絡(luò)行為數(shù)據(jù)以及相應(yīng)的經(jīng)營信息數(shù)據(jù),基于已設(shè)定的模型特征因素得到訓(xùn)練數(shù)據(jù)集,訓(xùn)練數(shù)據(jù)集可以表示如下,W1 = (U11,U12. . . Uln,F(xiàn)11,F(xiàn)12. . . Flk, M11,M12. . . Mlj ;BR1)W2 = (U21,U22. · · U2n,F(xiàn)21,F(xiàn)22. · · F2k, M21,M22. · · M2j ;BR2)......wN = (UN1, UN2. . . UNn, Fni, Fn2. . . FNk, Mni , Mn2. . . Mnj ;BRn)其中,表示第N個網(wǎng)站的第η個影響用戶特征的特征因子,F(xiàn)Nk表示第N個網(wǎng)站第k個影響流量特征的特征因子,Mnj表示第N個網(wǎng)站第j個影響營銷特征的特征因子,BRn 表示第N個網(wǎng)站的經(jīng)營信息數(shù)據(jù)中的年收入。然后,將獲取的多個網(wǎng)站中的M個網(wǎng)站的用戶的網(wǎng)絡(luò)行為數(shù)據(jù)以及相應(yīng)的經(jīng)營信息數(shù)據(jù),基于已設(shè)定的模型特征因素得到驗證數(shù)據(jù)集,驗證數(shù)據(jù)集可以表示如下,W1 = (U11,U12. · · Uln,F(xiàn)11,F(xiàn)12. · · Flk, M11,M12. · · Mlj ;BR1)W2 = (U21,U22. · · U2n,F(xiàn)21,F(xiàn)22. · · F2k, M21,M22. · · M2j ;BR2)......wM — (Um,Um2. . . Ulln,F(xiàn)mi , Fm2. . . FMk, Mmi , Mm2. . . Mmj- ;BRm)其中,Um表示第M個網(wǎng)站的第η個影響用戶特征的特征因子,F(xiàn)tt表示第M個網(wǎng)站第k個影響流量特征的特征因子,Mmj表示第M個網(wǎng)站第j個影響營銷特征的特征因子,BRM 表示第M個網(wǎng)站的經(jīng)營信息數(shù)據(jù)中的年收入,其中選取的N個網(wǎng)站與M個網(wǎng)站的可以部分相同。需要說明的是,以上所述,僅為本發(fā)明的簡單的例子,網(wǎng)站價值評估數(shù)據(jù)模型的特征因素還可包括其他因素,不限于以上所涉及的內(nèi)容,為了使不同的網(wǎng)站有統(tǒng)一評估標(biāo)準(zhǔn), 本實施例將公開獲得的設(shè)定數(shù)量網(wǎng)站的經(jīng)營信息數(shù)據(jù)中的年收入作為評估網(wǎng)站商業(yè)價值的評估參照。步驟3302,基于訓(xùn)練數(shù)據(jù)集來對網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練以確定所述網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù)。具體地,例如,將基于N個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)以及經(jīng)營信息數(shù)據(jù)所得的訓(xùn)練數(shù)據(jù)集代入公式⑵,即BR = f(A1U1. . . AnUn,B1F1. . . BkFpC1M1. . . CjMj)中,可得如下所示,BR1 = f (A1U11. · · AnUln, B1F11. · · BkFlk, C1M1. · · CjMlj)BR2 = f (A1U21. · · AnU2n, B1F21. · · BkF2k, C1M21. · · CjM2j)......BRn = f (A1Uni. · · AnUto' B1F21. · · BkFNk,C1Mni. · · CjMnj)然后,基于用戶網(wǎng)絡(luò)行為數(shù)據(jù)以及所述經(jīng)營信息數(shù)據(jù)中的年收入得到特征參數(shù), 亦即網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù)。更具體地,例如,將訓(xùn)練數(shù)據(jù)集中的N個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為上式中的輸入變量,即上式中的UN1. . . UNn,F(xiàn)21. . . Ffflt以及Mni. . . MNj,將訓(xùn)練數(shù)據(jù)集中的N個網(wǎng)站經(jīng)營信息數(shù)據(jù)中的年收入作為上式中的輸出變量,即上式中的BR1, BR2. . . ,然后通過多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法即可得到特征參數(shù)A1. . . An5B1. . . Bk5C1. . . Cj以及輸入變量與輸出變量的映射關(guān)系,基于所得的特征參數(shù)以及映射關(guān)系可以得到用于計算BR值的計算公式。需要說明的是,網(wǎng)站的經(jīng)營信息數(shù)據(jù)包括網(wǎng)站的年收入,將所述網(wǎng)站的年收入作為所制定的網(wǎng)站價值評估數(shù)據(jù)模型中與該網(wǎng)站對應(yīng)的BR值,本步驟中網(wǎng)站的經(jīng)營信息數(shù)據(jù)是通過公開途徑獲取的,網(wǎng)站可以為一些知名的規(guī)模較大的網(wǎng)站,這些網(wǎng)站的經(jīng)營信息數(shù)據(jù)相較于某些流量不大、內(nèi)容專業(yè)或用戶群體高端的網(wǎng)站來說較易獲得。需要說明的是,在步驟3302中基于模型的參數(shù)所確定網(wǎng)站價值評估數(shù)據(jù)確定模型,可用來評價要進(jìn)行商業(yè)價值評價的網(wǎng)站的商業(yè)價值,但是所確定網(wǎng)站價值評估數(shù)據(jù)確定模型并非最優(yōu)的網(wǎng)站價值評估數(shù)據(jù)模型,在現(xiàn)實復(fù)雜情況下其魯棒性和模型的精度都不是很高,因此可以進(jìn)一步執(zhí)行步驟3303來獲得最優(yōu)的網(wǎng)站價值評估數(shù)據(jù)確定模型。步驟3303,基于驗證數(shù)據(jù)集來校驗網(wǎng)站價值評估數(shù)據(jù)確定模型是否導(dǎo)致過擬合, 若校驗結(jié)果為是,則返回步驟3301。通常,通過訓(xùn)練數(shù)據(jù)集來構(gòu)建的特征數(shù)據(jù)關(guān)系,即所得到的BR值計算公式,存在某種程度的過適(亦稱過擬合)問題,也就是說,訓(xùn)練數(shù)據(jù)集訓(xùn)練出來的網(wǎng)站價值評估數(shù)據(jù)模型只能體現(xiàn)訓(xùn)練數(shù)據(jù)集中特征數(shù)據(jù)之間顯然的關(guān)系,卻未必能代表所有的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。驗證數(shù)據(jù)集是獨立于訓(xùn)練數(shù)據(jù)集的一組數(shù)據(jù),但驗證數(shù)據(jù)集服從與訓(xùn)練數(shù)據(jù)集同樣的概率分布。通過驗證數(shù)據(jù)集來對所得的初始網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行校驗,若該評估模型既能很好的擬合訓(xùn)練數(shù)據(jù)集也能很好的擬合驗證數(shù)據(jù)集,則過擬合現(xiàn)象就不明顯, 所得的網(wǎng)站價值評估數(shù)據(jù)確定模型可作為用于評估網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型,網(wǎng)站價值評估數(shù)據(jù)確定模型具有在現(xiàn)實復(fù)雜情況下的強(qiáng)魯棒性和高模型精度。若該網(wǎng)站價值評估數(shù)據(jù)確定模型只能擬合訓(xùn)練數(shù)據(jù)集而不能很好的擬合驗證數(shù)據(jù)集,則過擬合現(xiàn)象產(chǎn)生,所得的網(wǎng)站價值評估數(shù)據(jù)確定模型的魯棒性和模型精度較低, 則需要重新構(gòu)建訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集,則返回步驟3301進(jìn)行操作,通過反復(fù)進(jìn)行步驟 3301、步驟3302以及步驟3303的操作,以獲得最佳的用于評估網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型,若不存在過擬合,則將步驟3302中所確定網(wǎng)站價值評估數(shù)據(jù)確定模型作為用于評價網(wǎng)站的價值的網(wǎng)站價值評估數(shù)據(jù)確定模型,進(jìn)入步驟340中。需要說明的是,上述網(wǎng)絡(luò)商業(yè)價值評估模型的示例僅為一個簡單的例子,所述的內(nèi)容僅是為了便于理解本發(fā)明而采用的實施方式,并非用以限定本發(fā)明,影響評價值的特征不限于用戶特征、流量特征和營銷特征,還可以包括其它特征,而影響各個特征的各個特征因素不限于上述所提到的特征因素,還可以包括搜索引擎的出現(xiàn)率、站點速度、瀏覽速度或被鏈接率等特征因素。進(jìn)一步地,該網(wǎng)站價值評估方法還可以包括步驟340,將要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)輸入所得到的網(wǎng)站價值評估數(shù)據(jù)確定模型中,將所得到的BR值作為評價網(wǎng)站商業(yè)價值的評價值。具體地,將要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)輸入至步驟330所得的網(wǎng)站價值評估數(shù)據(jù)確定模型中,以得到該網(wǎng)站的BR值,其中,要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶的網(wǎng)絡(luò)行為數(shù)據(jù)與網(wǎng)站價值評估數(shù)據(jù)模型的特征因素相關(guān),并且用戶的網(wǎng)絡(luò)行為數(shù)據(jù)是基于網(wǎng)絡(luò)行為發(fā)生的時間、地域以及人群等因素來獲取的。在本實施例中,網(wǎng)站的商業(yè)價值是一個隨著時間、地域以及人群等因素的變化而變化的值,例如,同一個網(wǎng)站在一個星期中的不同時間段的商業(yè)價值是不同的,周一的商業(yè)價值可能是最低,而在周末的時候,尤其是在周六晚上該網(wǎng)站的商業(yè)價值可能達(dá)到最大,明顯高于其它時間段的商業(yè)價值,因此,廣告主可以選擇周六晚上在所要投放的網(wǎng)站上進(jìn)行廣告的投放。綜上所述,由于所得到的各個網(wǎng)站的評價值處于時間、地域以及人群三維空間中, 各個網(wǎng)站可以根據(jù)其自身網(wǎng)站的評價值找到跟其所要投放的智能廣告的內(nèi)容相匹配的用戶群,并且廣告主也可以通過評價值來正確決策其所要投放的廣告應(yīng)該在哪些網(wǎng)站上進(jìn)行投放,提高廣告主的廣告投放效果。另外,本實施例的步驟340中,還可以進(jìn)一步進(jìn)行以下內(nèi)容。將所述評價值劃分為多個區(qū)間,根據(jù)網(wǎng)站的評價值所處的區(qū)間來確定該網(wǎng)站的商業(yè)價值級別。具體地,基于各個網(wǎng)站的評價值對各個網(wǎng)站進(jìn)行分級以確定各網(wǎng)站的商業(yè)價值級別,例如,可以通過劃定評價值區(qū)間將網(wǎng)站進(jìn)行1-10級的分級,將處在某一評價值區(qū)間的所有網(wǎng)站分在同一級別內(nèi),本實施例可以將1級設(shè)為最低的商業(yè)價值級別,10級設(shè)為最高的商業(yè)價值級別?;谒玫降木W(wǎng)站的商業(yè)價值級別,廣告主可以根據(jù)時間、地域以及人群的不同選擇網(wǎng)站的商業(yè)價值級別中級別較高的網(wǎng)站進(jìn)行廣告投放。在本實施例的網(wǎng)站商業(yè)價值評估方法中,通過對基于網(wǎng)站的評價值對各個網(wǎng)站進(jìn)行分級,使得廣告主可以更直觀的選擇適用于投放廣告的級別較高的網(wǎng)站,提高廣告主的廣告投放效果。第四實施例圖6示出根據(jù)本發(fā)明第四實施例的網(wǎng)站商業(yè)價值評估裝置的結(jié)構(gòu)示意圖。下面參考圖6來說明本實施例的各部分組成。如圖6所示,本裝置包括獲取模塊61、建模模塊62、參數(shù)確定模塊63和評價模塊 64。其中,獲取模塊61與建模模塊62連接,建模模塊62與參數(shù)確定模塊63連接,參數(shù)確定模塊63與評價模塊64連接,下面說明各個模塊的功能。獲取模塊61,其獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)。建模模塊62,其確定影響網(wǎng)站價值的特征因素,根據(jù)特征因素來制定網(wǎng)站價值評估數(shù)據(jù)模型。進(jìn)一步地,在建模模塊62中,所制定的網(wǎng)站價值評估數(shù)據(jù)模型表示為BR = f (xUi, yFi,zMi),其中,所述Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征,f表示多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法,χ、y和ζ為模型參數(shù);所獲取的經(jīng)營信息數(shù)據(jù)包括網(wǎng)站的年收入,將所述網(wǎng)站的年收入作為所制定的網(wǎng)站價值評估數(shù)據(jù)模型中與該網(wǎng)站對應(yīng)的BR值。此外,參數(shù)確定模塊63,其利用所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)來對網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練,以確定網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),得到用于評價網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型。其中,參數(shù)確定模塊63可以包括訓(xùn)練子模塊631和驗證子模塊632。訓(xùn)練子模塊631,用于將第一網(wǎng)站集中網(wǎng)站的經(jīng)營信息數(shù)據(jù)和第一網(wǎng)站集的與特征因素相關(guān)的用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,以及將第二網(wǎng)站集中網(wǎng)站的經(jīng)營信息數(shù)據(jù)和第二網(wǎng)站集的與特征因素相關(guān)的用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為驗證數(shù)據(jù)集,以及驗證子模塊632,用于基于驗證數(shù)據(jù)集來校驗網(wǎng)站價值評估數(shù)據(jù)確定模型是否導(dǎo)致了過擬合,若校驗結(jié)果為是,則重新確定第一網(wǎng)站集和第二網(wǎng)站集所包含的網(wǎng)站,返回參數(shù)確定模塊63,其中,第一網(wǎng)站集與第二網(wǎng)站集不是同一集合。再進(jìn)一步地,該系統(tǒng)還可以包括評價模塊64,其將要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)輸入所得到的網(wǎng)站價值評估數(shù)據(jù)確定模型中以求得BR值,作為用于評價要進(jìn)行商業(yè)價值評價的網(wǎng)站的網(wǎng)站商業(yè)價值的評價值。在本發(fā)明實施例裝置,根據(jù)所構(gòu)建的網(wǎng)站價值評估數(shù)據(jù)模型得到的各個網(wǎng)站的處于不同時間、不同地域以及不同人群的評價值,各個網(wǎng)站可以根據(jù)其自身網(wǎng)站的評價值找到跟其所要投放的智能廣告的內(nèi)容相匹配的用戶群,并且廣告主也可以通過評價值來正確決策其所要投放的廣告應(yīng)該在哪些網(wǎng)站上進(jìn)行投放,提高廣告主的廣告投放效果。本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。雖然本發(fā)明所揭露的實施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實施的形式上及細(xì)節(jié)上作任何的修改與變化, 但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
權(quán)利要求
1.一種網(wǎng)站價值評估方法,其特征在于,包括獲取步驟,獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù);建模步驟,確定影響網(wǎng)站價值的特征因素,根據(jù)所述特征因素來制定網(wǎng)站價值評估數(shù)據(jù)模型;以及參數(shù)確定步驟,利用所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)來對所述網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練,以確定所述網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),得到用于評價網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述參數(shù)確定步驟具體包括將第一網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第一網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,以及將第二網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第二網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為驗證數(shù)據(jù)集,以及基于驗證數(shù)據(jù)集來校驗所述網(wǎng)站價值評估數(shù)據(jù)確定模型是否導(dǎo)致了過擬合,若校驗結(jié)果為是,則重新確定所述第一網(wǎng)站集和所述第二網(wǎng)站集所包含的網(wǎng)站,返回所述參數(shù)確定步驟,其中,所述第一網(wǎng)站集與所述第二網(wǎng)站集不是同一集合。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在所述建模步驟中,所制定的網(wǎng)站價值評估數(shù)據(jù)模型表示為BR = f(xUi,yFi,zMi),其中,所述BR為商業(yè)級別,Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征,f表示多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法,χ、y和ζ為模型參數(shù);所述網(wǎng)站的經(jīng)營信息數(shù)據(jù)包括網(wǎng)站的年收入,將所述網(wǎng)站的年收入作為所制定的網(wǎng)站價值評估數(shù)據(jù)模型中與該網(wǎng)站對應(yīng)的BR值。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括評價步驟,將要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)輸入所得到的網(wǎng)站價值評估數(shù)據(jù)確定模型中以求得的BR值,作為用于評價所述要進(jìn)行商業(yè)價值評價的網(wǎng)站的網(wǎng)站商業(yè)價值的評價值。
5.根據(jù)權(quán)利要求4所述的方法,其中特征在于,所述評價步驟還包括將所述評價值劃分為多個區(qū)間,根據(jù)網(wǎng)站的評價值所處的區(qū)間來確定該網(wǎng)站的商業(yè)價值級別。
6.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述特征因素包括用戶特征、流量特征以及營銷特征,以及構(gòu)成所述用戶特征的特征因子包括用戶群體、人均瀏覽量和人均停留時間,構(gòu)成所述流量特征的特征因子包括頁面訪問量、IP量和獨立訪客量,構(gòu)成所述營銷特征的特征因子包括點擊率、轉(zhuǎn)換率和投資回報率。
7.根據(jù)權(quán)利要求1或2所述的方法,其特征在于, 所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)為設(shè)定時間段、設(shè)定地域和/或設(shè)定人群的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。
8.—種網(wǎng)站商業(yè)價值評估裝置,其特征在于,包括獲取模塊(61),其獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù);建模模塊(62),其確定影響網(wǎng)站價值的特征因素,根據(jù)所述特征因素來制定網(wǎng)站價值評估數(shù)據(jù)模型;以及參數(shù)確定模塊(63),其利用所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)來對所述網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練,以確定所述網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),得到用于評價網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述參數(shù)確定模塊(6 包括訓(xùn)練子模塊,用于將第一網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第一網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,以及將第二網(wǎng)站集中網(wǎng)站的所述經(jīng)營信息數(shù)據(jù)和所述第二網(wǎng)站集的與所述特征因素相關(guān)的所述用戶網(wǎng)絡(luò)行為數(shù)據(jù)作為驗證數(shù)據(jù)集,以及驗證子模塊,用于基于驗證數(shù)據(jù)集來校驗所述網(wǎng)站價值評估數(shù)據(jù)確定模型是否導(dǎo)致了過擬合,若校驗結(jié)果為是,則重新確定所述第一網(wǎng)站集和所述第二網(wǎng)站集所包含的網(wǎng)站,返回所述參數(shù)確定模塊(63),其中,所述第一網(wǎng)站集與所述第二網(wǎng)站集不是同一集合。
10.根據(jù)權(quán)利要求8或9所述的裝置,其特征在于,所制定的網(wǎng)站價值評估數(shù)據(jù)模型表示為BR = f(xUi, yFi,zMi),其中,所述Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi為營銷特征,f表示多次曲線擬合算法或神經(jīng)網(wǎng)絡(luò)算法,χ、 y和ζ為模型參數(shù);所獲取的經(jīng)營信息數(shù)據(jù)包括網(wǎng)站的年收入,將所述網(wǎng)站的年收入作為所制定的網(wǎng)站價值評估數(shù)據(jù)模型中與該網(wǎng)站對應(yīng)的BR值。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,還包括評價模塊(64),其將要進(jìn)行商業(yè)價值評價的網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)輸入所得到的網(wǎng)站價值評估數(shù)據(jù)確定模型中以求得BR值,作為用于評價所述要進(jìn)行商業(yè)價值評價的網(wǎng)站的網(wǎng)站商業(yè)價值的評價值。
12.—種網(wǎng)站商業(yè)價值評估方法,其特征在于通過如下步驟對網(wǎng)站商業(yè)價值進(jìn)行評估(1)對用戶瀏覽行為數(shù)據(jù)進(jìn)行收集和存儲;從公開途徑收集網(wǎng)站的經(jīng)營和財務(wù)信息;(2)確定影響網(wǎng)站價值的特征因素,對評估模型進(jìn)行制定;(3)確定模型參數(shù),建立網(wǎng)站價值評估數(shù)據(jù)模型;(4)將網(wǎng)站價值評估數(shù)據(jù)模型用于評估網(wǎng)站價值;(5)通過驗證數(shù)據(jù)集合,對模型進(jìn)行優(yōu)化,以提高系統(tǒng)在現(xiàn)實復(fù)雜情況下的魯棒性和模型精度,確認(rèn)最終模型;(6)將用戶行為參數(shù)套用入最終模型中,評價其網(wǎng)站商業(yè)價值。
13.根據(jù)權(quán)利要求12所述的網(wǎng)站商業(yè)價值評估方法,其特征在于所述模型參數(shù)通過如下公式計算獲得,BR = f(xUi, yFi, zMi),所述Ui為網(wǎng)站的用戶特征、Fi為流量特征、Mi 為營銷特征。
14.一種網(wǎng)站商業(yè)價值評估系統(tǒng),其特征在于包括用于對用戶瀏覽行為數(shù)據(jù)進(jìn)行收集和存儲的商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng),所述兩系統(tǒng)將數(shù)據(jù)傳輸給用于建立網(wǎng)站價值評估數(shù)據(jù)模型的數(shù)據(jù)訓(xùn)練系統(tǒng),所述數(shù)據(jù)訓(xùn)練系統(tǒng)同時還接收用于驗證數(shù)據(jù)的模型評估系統(tǒng)。
15.根據(jù)權(quán)利要求14所述的網(wǎng)站商業(yè)價值評估系統(tǒng),其特征在于所述數(shù)據(jù)訓(xùn)練系統(tǒng)包括模型庫,所述模型庫設(shè)有用于模型選擇模塊,所述模型選擇模塊輸出所選模型,所述所選模型接收商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù),所述所選模型通過參數(shù)計算模塊,形成確認(rèn)模塊輸出,所述確認(rèn)模塊進(jìn)入校驗?zāi)K進(jìn)行優(yōu)化,所述校驗?zāi)K接收模型評估系統(tǒng)數(shù)據(jù)。
16.根據(jù)權(quán)利要求14所述的網(wǎng)站商業(yè)價值評估系統(tǒng),其特征在于所述模型評估系統(tǒng)包括商業(yè)智能信息收集系統(tǒng)和網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)。
全文摘要
本發(fā)明公開了一種網(wǎng)站價值評估方法及裝置,該方法包括獲取步驟,獲取多個網(wǎng)站的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù);建模步驟,確定影響網(wǎng)站價值的特征因素,根據(jù)特征因素來制定網(wǎng)站價值評估數(shù)據(jù)模型;以及參數(shù)確定步驟,利用所獲取的用戶網(wǎng)絡(luò)行為數(shù)據(jù)和經(jīng)營信息數(shù)據(jù)來對所述網(wǎng)站價值評估數(shù)據(jù)模型進(jìn)行數(shù)據(jù)訓(xùn)練,以確定網(wǎng)站價值評估數(shù)據(jù)模型的模型參數(shù),得到用于評價網(wǎng)站商業(yè)價值的網(wǎng)站價值評估數(shù)據(jù)確定模型。本發(fā)明根據(jù)所構(gòu)建的模型得到的各個網(wǎng)站的評價值,網(wǎng)站可以根據(jù)其自身網(wǎng)站的評價值找到跟其所要投放的智能廣告的內(nèi)容相匹配的用戶群,廣告主也可以通過評價值來決策其要投放的廣告所投放的網(wǎng)站,提高廣告主的廣告投放效果。
文檔編號G06Q30/00GK102567477SQ20111042134
公開日2012年7月11日 申請日期2011年12月15日 優(yōu)先權(quán)日2011年6月16日
發(fā)明者李娜, 羅峰, 黃蘇支 申請人:北京億贊普網(wǎng)絡(luò)技術(shù)有限公司