一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺和方法
【專利摘要】本發(fā)明提出了一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,采用虛擬訪客技術(shù)和像素跟蹤技術(shù),在云數(shù)據(jù)段進行海量頁面數(shù)據(jù)索引和分析,同時在實時客戶端具有較高穿透力,保證廣告在恰當?shù)臅r間和地方安全地被投放,防止了廣告被不恰當投放時所產(chǎn)生的風險,保護了廣告主品牌的安全,包括位于前臺的對在線廣告進行實時驗證的實時客戶端和位于后臺對廣告投放頁面進行索引和分類的云服務端;其中,實時客戶端包括API接口層、驗證服務器和規(guī)則數(shù)據(jù)庫,云服務端包括數(shù)據(jù)爬蟲、索引服務器和云端數(shù)據(jù)庫。
【專利說明】
一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺和方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及互聯(lián)網(wǎng)廣告技術(shù)領(lǐng)域,具體涉及一種基于中文互聯(lián)網(wǎng)或移動設(shè)備等載體程序化投放廣告的驗證平臺和方法。
【背景技術(shù)】
[0002]程序化購買,指的是通過數(shù)字平臺,自動進行互聯(lián)網(wǎng)廣告媒體購買的流程。即廣告主接入需求方平臺(DSP),通過實時競價(RTB)對投放入各大廣告交易平臺(Ad Exchange)的互聯(lián)網(wǎng)各類廣告位資源進行程序化的購買和投放。通過RTB和Ad Exchange等技術(shù),廣告主可以根據(jù)媒體類型或者受眾行為特征進行廣告位購買,實現(xiàn)了廣告購買和投放的全程自動化,達到互聯(lián)網(wǎng)廣告在效率和精準性上的突破。
[0003]但由于中文互聯(lián)網(wǎng)環(huán)境的復雜性,廣告主在程序化購買的過程當中仍然會遇到各種安全隱患,損壞廣告主的品牌安全和投放效果。比如廣告被投放到三俗內(nèi)容的頁面;旅游局的廣告出現(xiàn)在馬航事件的內(nèi)容上;廣告出現(xiàn)在一個布局奇怪;6個不同廣告并存的奇怪頁面;廣告被放在了看不見的地方,利用作弊技術(shù)欺騙點擊量。故而在程序化購買的過程中,需要第三方提供對廣告投放的監(jiān)控和評估,以保障廣告主的品牌。
[0004]現(xiàn)有技術(shù)當中,美國雙重驗證有限公司申請的專利號為201080060999.9的發(fā)明專利提供了一種實時在線廣告的驗證系統(tǒng)與方法,包括決策服務器、數(shù)據(jù)庫服務器、網(wǎng)絡(luò)服務器和查詢軟件模塊。其中查詢軟件模塊提取了存儲于網(wǎng)頁廣告中的標簽代碼得到了網(wǎng)頁信息和相關(guān)參數(shù),并傳輸?shù)經(jīng)Q策服務器,決策服務器分析廣告活動規(guī)則和所提供的參數(shù),并將其決策發(fā)送到廣告服務器,廣告服務器相應地投放廣告或者攔截廣告。該技術(shù)方案雖然能夠幫助廣告服務器決定投放哪個廣告,并允許其根據(jù)廣告活動的定義,在投放植入(例如網(wǎng)頁的網(wǎng)址)的可視性和充分認識的基礎(chǔ)上,投放適當?shù)膹V告,但是缺乏對于中文互聯(lián)網(wǎng)環(huán)境復雜性的考慮,在對投放植入的網(wǎng)頁的語義分析、圖像識別上、廣告作弊監(jiān)控、網(wǎng)站備案信息查詢上,需要進行海量數(shù)據(jù)的索引和預處理,以滿足廣告投放的準確性和品牌安全性的要求。
【發(fā)明內(nèi)容】
[0005]為解決現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明的目的是提供一種能夠適應于中文互聯(lián)網(wǎng)復雜環(huán)境,在云數(shù)據(jù)段進行海量頁面數(shù)據(jù)索引和分析,具有較高網(wǎng)頁穿透力達到保護廣告主投放效果和品牌的程序化投放廣告的驗證平臺和方法。
[0006]為了達到上述目的,本發(fā)明的具體解決方案提供一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,應用于廣告主接入的需求方平臺(DSP)之上,具有由廣告交易平臺(Ad Exchange)和其他數(shù)據(jù)來源提供的廣告投放標的網(wǎng)頁所組成的數(shù)據(jù)池,包括位于前臺的對在線廣告進行實時驗證的實時客戶端和位于后臺對廣告投放頁面進行索引和分類的云服務端;
[0007]其中,實時客戶端包括API接口層、驗證服務器和規(guī)則數(shù)據(jù)庫,所述API接口層建立廣告投放頁面與驗證服務器的連接,提取網(wǎng)頁的URL參數(shù)并發(fā)送到離線系統(tǒng),規(guī)則數(shù)據(jù)庫存儲符合廣告主意圖的廣告活動規(guī)則,驗證服務器根據(jù)離線系統(tǒng)分析得出的網(wǎng)頁負向分類和評分數(shù)據(jù)判斷目標網(wǎng)頁是否符合廣告活動規(guī)則;
[0008]云服務端包括數(shù)據(jù)爬蟲、索引服務器和云端數(shù)據(jù)庫,所述數(shù)據(jù)爬蟲提取廣告投放頁面的文本、媒體和頁面數(shù)據(jù),并以視覺化方式呈現(xiàn)網(wǎng)頁,索引服務器將提取的廣告信息和數(shù)據(jù)進行分析和分類,并建立索引和評分,云端數(shù)據(jù)庫存儲經(jīng)過索引和評分之后的網(wǎng)頁負向分類數(shù)據(jù)。
[0009]進一步的,還包括網(wǎng)站標簽,所述網(wǎng)站標簽存儲于廣告投放頁面中并由用戶的瀏覽器端執(zhí)行,所述API接口層根據(jù)網(wǎng)站標簽來識別廣告投放頁面,所述網(wǎng)站標簽的描述語言包括HTML代碼、JAVASCRIPT代碼和IFRAME代碼。
[0010]更進一步的,其特征在于所述數(shù)據(jù)爬蟲包括像素跟蹤程序和虛擬訪客程序,所述像素跟蹤程序根據(jù)網(wǎng)頁標簽提取廣告位置、數(shù)量、尺寸、廣告鏈接等數(shù)據(jù)信息,虛擬訪客程序程序,分析HTML結(jié)構(gòu)并呈現(xiàn)頁面,針對廣告位置對整個頁面進行截圖。
[0011]更進一步的,其特征在于,所述索引服務器包括語義分析模塊、圖像分析模塊、廣告鏈接分析模塊和網(wǎng)站備案分析模塊,所述索引服務器根據(jù)廣告投放頁面的備案信息、圖像分析結(jié)果、非法鏈接的數(shù)量、網(wǎng)頁結(jié)構(gòu)、廣告數(shù)量、作弊歷史判斷網(wǎng)頁的友好程度并進行評分。
[0012]優(yōu)選的,所述網(wǎng)頁負向分類的類別包括酒精、疫情、軍事沖突、自然災害、死亡、安全事故、色情、交通事故和暴力。
[0013]另一方面,本發(fā)明還提供一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的方法,所述方法實施于用戶競價廣告前或競價廣告之后,包括以下步驟:
[0014]A.用戶提供一組廣告投放頁面網(wǎng)址以進行驗證;
[0015]B.數(shù)據(jù)爬蟲抓取廣告投放頁面的廣告信息、文本、媒體和頁面數(shù)據(jù),并以視覺化方式呈現(xiàn)網(wǎng)頁;
[0016]C.建立提取頁面的索引,并對提取的廣告信息、文本、媒體和頁面數(shù)據(jù)進行分析,根據(jù)分析結(jié)果建立網(wǎng)頁的負向分類和評分;
[0017]D.將頁面索引、負向分類和評分存儲于云端數(shù)據(jù)庫;
[0018]E.根據(jù)頁面網(wǎng)址檢索到存儲于云端數(shù)據(jù)庫的廣告投放網(wǎng)頁頁面的負向分類和評分;
[0019]D.根據(jù)負向分類和評分判斷廣告投放頁面是否符合廣告活動規(guī)則。
[0020]進一步的,本方法還包括在廣告投放網(wǎng)頁上添加網(wǎng)站標簽,所述網(wǎng)站標簽的描述語言包括HTML代碼、JAVASCRIPT代碼和IFRAME代碼,用以識別廣告投放頁面。
[0021]進一步的,所述數(shù)據(jù)爬蟲包括像素跟蹤程序和虛擬訪客程序,所述像素跟蹤程序根據(jù)網(wǎng)頁標簽提取廣告位置、數(shù)量、尺寸、廣告鏈接等數(shù)據(jù)信息,虛擬訪客程序程序,分析HTML結(jié)構(gòu)并呈現(xiàn)頁面,針對廣告位置對整個頁面進行截圖。
[0022]進一步的,對提取的廣告信息、文本、媒體和頁面數(shù)據(jù)進行的分析包括,語義分析、圖像分析、廣告鏈接分析和網(wǎng)站備案分析。
[0023]進一步的,所述網(wǎng)頁負向分類的類別包括酒精、疫情、軍事沖突、自然災害、死亡、
安全事故、色情、交通事故和暴力。
[0024]本發(fā)明同現(xiàn)有技術(shù)相比,具有以下優(yōu)點和有益效果:
[0025]1、適應中文互聯(lián)網(wǎng)復雜的網(wǎng)絡(luò)環(huán)境,保證廣告在恰當?shù)臅r間和地方安全地被投放,不僅向廣告主展示了廣告的點擊率等商業(yè)效果,更防止了廣告被不恰當投放時所產(chǎn)生的風險,保護了廣告主品牌的資產(chǎn)和減少廣告投放活動的事后顧慮。
[0026]2、采用虛擬訪問者技術(shù),預先訪問過了所有廣告投放環(huán)境中的頁面,并在此收集數(shù)據(jù)的基礎(chǔ)上上做了存檔,索引,分類,同時根據(jù)廣告主品牌政策上加上學習點,為廣告主,TradingDesk以及廣告網(wǎng)絡(luò)在每一次投放之前做了一張可刪選的過濾網(wǎng)。
[0027]3、采用像素跟蹤技術(shù),滿足廣告主對廣告投放的可視化要求,采用IFRAME等網(wǎng)絡(luò)標簽,保證了較高的廣告驗證穿透性。
[0028]4、針對中文互聯(lián)網(wǎng),采用語義分析、圖像分析、廣告鏈接分析和網(wǎng)站備案分析對廣告投放頁面進行酒精、疫情、軍事沖突、自然災害、死亡、安全事故、色情、交通事故和暴力的分類和評分,分析結(jié)果存儲于云端服務器,能在用戶投放廣告是實時調(diào)用,并建立廣告投放的黑名單。
【附圖說明】
[0029]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0030]圖1是本發(fā)明一種實施例的系統(tǒng)架構(gòu)圖;
[0031 ]圖2是本發(fā)明另一種實施例的方法流程圖。
圖3是本發(fā)明另一種實施例的方法流程圖。
【具體實施方式】
[0032]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全海部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0033]本發(fā)明的具體解決方案提供一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,其作用在于對廣告投放頁面進行監(jiān)控和保護,防止在同一頁面出現(xiàn)上損害廣告主品牌形象的網(wǎng)頁內(nèi)容(圖片、文字、超鏈接、視頻等)。
[0034]如圖1所示,本發(fā)明的驗證平臺應用于廣告主接入的需求方平臺(DSP)之上,具有由廣告交易平臺(Ad Exchange)和其他數(shù)據(jù)來源提供的廣告投放標的網(wǎng)頁所組成的數(shù)據(jù)池。廣告主通過包括位于前臺的對在線廣告進行實時驗證的實時客戶端和位于后臺對廣告投放頁面進行索引和分類的云服務端。
[0035]其中,實時客戶端包括API接口層、驗證服務器和規(guī)則數(shù)據(jù)庫,所述API接口層建立廣告投放頁面與驗證服務器的連接,提取網(wǎng)頁的URL參數(shù)并發(fā)送到離線系統(tǒng),規(guī)則數(shù)據(jù)庫存儲符合廣告主意圖的廣告活動規(guī)則,驗證服務器根據(jù)離線系統(tǒng)分析得出的網(wǎng)頁負向分類和評分數(shù)據(jù)判斷目標網(wǎng)頁是否符合廣告活動規(guī)則;
[0036]云服務端包括數(shù)據(jù)爬蟲、索引服務器和云端數(shù)據(jù)庫,所述數(shù)據(jù)爬蟲提取廣告投放頁面的文本、媒體和頁面數(shù)據(jù),并以視覺化方式呈現(xiàn)網(wǎng)頁,索引服務器將提取的廣告信息和數(shù)據(jù)進行分析和分類,并建立索引和評分,云端數(shù)據(jù)庫存儲經(jīng)過索引和評分之后的網(wǎng)頁負向分類數(shù)據(jù)。
[0037]進一步的,還包括網(wǎng)站標簽,所述網(wǎng)站標簽存儲于廣告投放頁面中并由用戶的瀏覽器端執(zhí)行,所述API接口層根據(jù)網(wǎng)站標簽來識別廣告投放頁面,所述網(wǎng)站標簽的描述語言包括HTML代碼、JAVASCRIPT代碼和IFRAME代碼。
[0038]更進一步的,其特征在于所述數(shù)據(jù)爬蟲包括像素跟蹤程序和虛擬訪客程序,所述像素跟蹤程序根據(jù)網(wǎng)頁標簽提取廣告位置、數(shù)量、尺寸、廣告鏈接等數(shù)據(jù)信息,虛擬訪客程序程序,分析HTML結(jié)構(gòu)并呈現(xiàn)頁面,針對廣告位置對整個頁面進行截圖。
[0039]更進一步的,其特征在于,所述索引服務器包括語義分析模塊、圖像分析模塊、廣告鏈接分析模塊和網(wǎng)站備案分析模塊,所述索引服務器根據(jù)廣告投放頁面的備案信息、圖像分析結(jié)果、非法鏈接的數(shù)量、網(wǎng)頁結(jié)構(gòu)、廣告數(shù)量、作弊歷史判斷網(wǎng)頁的友好程度并進行評分。
[0040]優(yōu)選的,所述網(wǎng)頁負向分類的類別包括酒精、疫情、軍事沖突、自然災害、死亡、安全事故、色情、交通事故和暴力等。
[0041 ]圖2是本發(fā)明另一個實施例的方法流程圖,
[0042]如圖所示,本發(fā)明還提供一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的方法,所述方法實施于用戶競價廣告前或競價廣告之后,包括以下步驟:
[0043]A.用戶提供一組廣告投放頁面網(wǎng)址以進行驗證;
[0044]B.數(shù)據(jù)爬蟲抓取廣告投放頁面的廣告信息、文本、媒體和頁面數(shù)據(jù),并以視覺化方式呈現(xiàn)網(wǎng)頁;
[0045]C.建立提取頁面的索引,并對提取的廣告信息、文本、媒體和頁面數(shù)據(jù)進行分析,根據(jù)分析結(jié)果建立網(wǎng)頁的負向分類和評分;
[0046]D.將頁面索引、負向分類和評分存儲于云端數(shù)據(jù)庫;
[0047]E.根據(jù)頁面網(wǎng)址檢索到存儲于云端數(shù)據(jù)庫的廣告投放網(wǎng)頁頁面的負向分類和評分;
[0048]D.根據(jù)負向分類和評分判斷廣告投放頁面是否符合廣告活動規(guī)則。
[0049]進一步的,本方法還包括在廣告投放網(wǎng)頁上添加網(wǎng)站標簽,所述網(wǎng)站標簽的描述語言包括HTML代碼、JAVASCRIPT代碼和IFRAME代碼,用以識別廣告投放頁面。
[0050]進一步的,所述數(shù)據(jù)爬蟲包括像素跟蹤程序和虛擬訪客程序,所述像素跟蹤程序根據(jù)網(wǎng)頁標簽提取廣告位置、數(shù)量、尺寸、廣告鏈接等數(shù)據(jù)信息,虛擬訪客程序程序,分析HTML結(jié)構(gòu)并呈現(xiàn)頁面,針對廣告位置對整個頁面進行截圖。
[0051]進一步的,對提取的廣告信息、文本、媒體和頁面數(shù)據(jù)進行的分析包括,語義分析、圖像分析、廣告鏈接分析和網(wǎng)站備案分析。
[0052]進一步的,所述網(wǎng)頁負向分類的類別包括酒精、疫情、軍事沖突、自然災害、死亡、安全事故、色情、交通事故和暴力等。
[0053]本發(fā)明同現(xiàn)有技術(shù)相比,具有以下優(yōu)點和有益效果:
[0054]1、適應中文互聯(lián)網(wǎng)復雜的網(wǎng)絡(luò)環(huán)境,保證廣告在恰當?shù)臅r間和地方安全地被投放,不僅向廣告主展示了廣告的點擊率等商業(yè)效果,更防止了廣告被不恰當投放時所產(chǎn)生的風險,保護了廣告主品牌的資產(chǎn)和減少廣告投放活動的事后顧慮。
[0055]2、采用虛擬訪問者技術(shù),預先訪問過了所有廣告投放環(huán)境中的頁面,并在此收集數(shù)據(jù)的基礎(chǔ)上上做了存檔,索引,分類,同時根據(jù)廣告主品牌政策上加上學習點,為廣告主,TradingDesk以及廣告網(wǎng)絡(luò)在每一次投放之前做了一張可刪選的過濾網(wǎng)。
[0056]3、采用像素跟蹤技術(shù),滿足廣告主對廣告投放的可視化要求,采用IFRAME等網(wǎng)絡(luò)標簽,保證了較高的廣告驗證穿透性。
[0057]4、針對中文互聯(lián)網(wǎng),采用語義分析、圖像分析、廣告鏈接分析和網(wǎng)站備案分析對廣告投放頁面進行酒精、疫情、軍事沖突、自然災害、死亡、安全事故、色情、交通事故和暴力的分類和評分,分析結(jié)果存儲于云端服務器,能在用戶投放廣告是實時調(diào)用,并建立廣告投放的黑名單。
[0058]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1.一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,應用于廣告主接入的需求方平臺(DSP)之上,具有由廣告交易平臺(Ad Exchange)和其他數(shù)據(jù)來源提供的廣告投放標的網(wǎng)頁所組成的數(shù)據(jù)池,其特征在于,包括位于前臺的對在線廣告進行實時驗證的實時客戶端和位于后臺對廣告投放頁面進行索引和分類的云服務端; 其中,實時客戶端包括API接口層、驗證服務器和規(guī)則數(shù)據(jù)庫,所述API接口層建立廣告投放頁面與驗證服務器的連接,提取網(wǎng)頁的URL參數(shù)并發(fā)送到離線系統(tǒng),規(guī)則數(shù)據(jù)庫存儲符合廣告主意圖的廣告活動規(guī)則,驗證服務器根據(jù)離線系統(tǒng)分析得出的網(wǎng)頁負向分類和評分數(shù)據(jù)判斷目標網(wǎng)頁是否符合廣告活動規(guī)則; 云服務端包括數(shù)據(jù)爬蟲、索引服務器和云端數(shù)據(jù)庫,所述數(shù)據(jù)爬蟲提取廣告投放頁面的文本、媒體和頁面數(shù)據(jù),并以視覺化方式呈現(xiàn)網(wǎng)頁,索引服務器將提取的廣告信息和數(shù)據(jù)進行分析和分類,并建立索引和評分,云端數(shù)據(jù)庫存儲經(jīng)過索引和評分之后的網(wǎng)頁負向分類數(shù)據(jù)。2.如權(quán)利要求1所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,其特征在于,還包括網(wǎng)站標簽,所述網(wǎng)站標簽存儲于廣告投放頁面中并由用戶的瀏覽器端執(zhí)行,所述API接口層根據(jù)網(wǎng)站標簽來識別廣告投放頁面,所述網(wǎng)站標簽的描述語言包括HTML代碼、JAVASCRIPT 代碼和 IFRAME 代碼。3.如權(quán)利要求2所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,其特征在于所述數(shù)據(jù)爬蟲包括像素跟蹤程序和虛擬訪客程序,所述像素跟蹤程序根據(jù)網(wǎng)頁標簽提取廣告位置、數(shù)量、尺寸、廣告鏈接等數(shù)據(jù)信息,虛擬訪客程序程序,分析HTML結(jié)構(gòu)并呈現(xiàn)頁面,針對廣告位置對整個頁面進行截圖。4.如權(quán)利要求1所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,其特征在于,所述索引服務器包括語義分析模塊、圖像分析模塊、廣告鏈接分析模塊和網(wǎng)站備案分析模塊,所述索引服務器根據(jù)廣告投放頁面的備案信息、圖像分析結(jié)果、非法鏈接的數(shù)量、網(wǎng)頁結(jié)構(gòu)、廣告數(shù)量、作弊歷史判斷網(wǎng)頁的友好程度并進行評分。5.如權(quán)利要求1所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的驗證平臺,其特征在于,所述網(wǎng)頁負向分類的類別包括酒精、疫情、軍事沖突、自然災害、死亡、安全事故、色情、交通事故和暴力。6.—種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的方法,其特征在于,所述方法實施于用戶競價廣告前或競價廣告之后,包括以下步驟: A.用戶提供一組廣告投放頁面網(wǎng)址以進行驗證; B.數(shù)據(jù)爬蟲抓取廣告投放頁面的廣告信息、文本、媒體和頁面數(shù)據(jù),并以視覺化方式呈現(xiàn)網(wǎng)頁; C.建立提取頁面的索引,并對提取的廣告信息、文本、媒體和頁面數(shù)據(jù)進行分析,根據(jù)分析結(jié)果建立網(wǎng)頁的負向分類和評分; D.將頁面索引、負向分類和評分存儲于云端數(shù)據(jù)庫; E.根據(jù)頁面網(wǎng)址檢索到存儲于云端數(shù)據(jù)庫的廣告投放網(wǎng)頁頁面的負向分類和評分; F.根據(jù)負向分類和評分判斷廣告投放頁面是否符合廣告活動規(guī)則。7.如權(quán)利要求6所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的方法,其特征在于,在廣告投放網(wǎng)頁上添加網(wǎng)站標簽,所述網(wǎng)站標簽的描述語言包括HTML代碼、JAVASCRIPT代碼和IFRAME代碼,用以識別廣告投放頁面。8.如權(quán)利要求6所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的方法,其特征在于,所述數(shù)據(jù)爬蟲包括像素跟蹤程序和虛擬訪客程序,所述像素跟蹤程序根據(jù)網(wǎng)頁標簽提取廣告位置、數(shù)量、尺寸、廣告鏈接等數(shù)據(jù)信息,虛擬訪客程序程序,分析HTML結(jié)構(gòu)并呈現(xiàn)頁面,針對廣告位置對整個頁面進行截圖。9.如權(quán)利要求6所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的方法,其特征在于,對提取的廣告信息、文本、媒體和頁面數(shù)據(jù)進行的分析包括,語義分析、圖像分析、廣告鏈接分析和網(wǎng)站備案分析。10.如權(quán)利要求6所述的一種基于中文互聯(lián)網(wǎng)環(huán)境程序化投放廣告的方法,其特征在于,所述網(wǎng)頁負向分類的類別包括酒精、疫情、軍事沖突、自然災害、死亡、安全事故、色情、交通事故和暴力。
【文檔編號】G06Q30/02GK106022843SQ201610396905
【公開日】2016年10月12日
【申請日】2016年6月6日
【發(fā)明人】張迪, 丁曉剛, 劉濤, 劉羅軍, 尹偉
【申請人】上海荷格信息科技有限公司