一種電子商務(wù)稅源管理分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及大數(shù)據(jù)挖掘分析技術(shù)領(lǐng)域,具體涉及一種電子商務(wù)稅源管理分析方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)應(yīng)用的普及,我國(guó)電子商務(wù)快速發(fā)展,網(wǎng)上購(gòu)物作為一種經(jīng)濟(jì)、高效、低碳的購(gòu)物方式已經(jīng)逐漸成為主流消費(fèi)方式。企業(yè)紛紛通過(guò)建立門(mén)戶網(wǎng)站、自主B2C網(wǎng)站、加盟B2C/B2B平臺(tái)、微博推廣等各種方式開(kāi)展企業(yè)推廣和電子商務(wù)經(jīng)營(yíng)。網(wǎng)上交易生成了大量的稅源數(shù)據(jù),可以通過(guò)電子商務(wù)稅源管理云采集系統(tǒng)將這些結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù)采集下來(lái)。這些數(shù)據(jù),經(jīng)過(guò)ETL,與稅局組織內(nèi)數(shù)據(jù)進(jìn)行整合,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系等。并進(jìn)一步利用數(shù)據(jù)可視化技術(shù)呈現(xiàn)給稅務(wù)人員,為稅收精細(xì)化管理、精確決策提供數(shù)據(jù)分析平臺(tái),提高稅收評(píng)估能力,完善稅收管理決策模式,提高稅收,推進(jìn)信息管稅、科學(xué)征稅、依法征稅。
[0003]ETL,是英文Extract-Transform-Load的縮寫(xiě),用來(lái)描述將數(shù)據(jù)從來(lái)源端經(jīng)過(guò)萃取(extract)、轉(zhuǎn)置(transform)、加載(load)至目的端的過(guò)程。ETL —詞較常用在數(shù)據(jù)倉(cāng)庫(kù),但其對(duì)象并不限于數(shù)據(jù)倉(cāng)庫(kù)。ETL負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明要解決的技術(shù)問(wèn)題是:提供一種電子商務(wù)稅源管理分析方法,為稅收精細(xì)化管理、精確決策提供數(shù)據(jù)分析平臺(tái)。
[0005]本發(fā)明所采用的技術(shù)方案為:
一種電子商務(wù)稅源管理分析方法,所述方法通過(guò)電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個(gè)電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫(kù)中,進(jìn)行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進(jìn)行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫(kù)中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進(jìn)行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系O
[0006]對(duì)采集數(shù)據(jù)進(jìn)行清洗流程如下:
將電子商務(wù)稅源管理云采集系統(tǒng)提供的網(wǎng)店基本信息表和銷售信息表導(dǎo)入數(shù)據(jù)庫(kù);將新的網(wǎng)店基本信息與原網(wǎng)店基本信息進(jìn)行合并,更新網(wǎng)店基本信息:加入新開(kāi)網(wǎng)店,并為新網(wǎng)店生成網(wǎng)店id,修改網(wǎng)店?duì)顟B(tài)與實(shí)際狀態(tài)一致,更新網(wǎng)店所屬公司名稱;
將多個(gè)電商的網(wǎng)店基本信息進(jìn)行合并,將不同電商中網(wǎng)店屬于同一公司的銷售信息歸一化,并取得公司名稱列表,獲得互聯(lián)網(wǎng)電商信息。
[0007]對(duì)稅局組織內(nèi)數(shù)據(jù)進(jìn)行ETL的流程如下:
參照產(chǎn)生的公司名稱列表,從稅局組織內(nèi)數(shù)據(jù)中進(jìn)行查找匹配,獲取有效納稅人基本信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)出稅種認(rèn)定信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)納稅人資格信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)增值稅認(rèn)定信息;
根據(jù)上述信息關(guān)聯(lián)納稅申報(bào)信息和增值稅發(fā)票開(kāi)具信息,獲得稅務(wù)信息。
[0008]數(shù)據(jù)整合分析流程:將清洗過(guò)的互聯(lián)網(wǎng)電商信息與通過(guò)ETL獲得的稅務(wù)信息進(jìn)行關(guān)聯(lián)規(guī)則分析、數(shù)據(jù)挖掘分析以及統(tǒng)計(jì)比對(duì),獲得非正常繳稅納稅人列表,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系、電商關(guān)聯(lián)關(guān)系、電商銷售發(fā)展趨勢(shì)、稅收預(yù)警。
[0009]所述方法業(yè)務(wù)流程如下:
O電子商務(wù)稅源管理系統(tǒng)云采集系統(tǒng)采集信息;
2)所采集的電子商務(wù)網(wǎng)站的有效數(shù)據(jù)結(jié)構(gòu)化,并導(dǎo)入數(shù)據(jù)庫(kù)并初始化,對(duì)數(shù)據(jù)根據(jù)應(yīng)用需求進(jìn)行缺失值填充、去重、合并以及抽取轉(zhuǎn)換;
3)網(wǎng)點(diǎn)基本信息更新;
4)多電商基本信息及銷售信息合并,獲得網(wǎng)店所屬公司名稱列表;
5)將稅務(wù)局管理系統(tǒng)提供的組織內(nèi)數(shù)據(jù)進(jìn)行ETL抽取轉(zhuǎn)換,保存到本系統(tǒng)數(shù)據(jù)庫(kù)中,并結(jié)合網(wǎng)店所屬公司名稱列表匹配有效納稅人;
6)關(guān)聯(lián)稅種、納稅人資格和增值稅認(rèn)定情況;
7)關(guān)聯(lián)納稅申報(bào)和增值稅開(kāi)票信息;
8)對(duì)步驟4)獲得的電商基本信息、銷售信息和步驟7)獲得的稅務(wù)信息進(jìn)行數(shù)據(jù)挖掘分析、對(duì)比統(tǒng)計(jì)。
[0010]本發(fā)明的有益效果為:采用本發(fā)明方法,可以挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系等,并進(jìn)一步利用數(shù)據(jù)可視化技術(shù)呈現(xiàn)給稅務(wù)人員,為稅收精細(xì)化管理、精確決策提供數(shù)據(jù)分析平臺(tái),提高稅收評(píng)估能力,完善稅收管理決策模式,提高稅收,推進(jìn)信息管稅、科學(xué)征稅、依法征稅。
【附圖說(shuō)明】
[0011]圖1為本發(fā)明業(yè)務(wù)流程圖。
【具體實(shí)施方式】
[0012]下面參照附圖所示,通過(guò)【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)一步說(shuō)明:
一種電子商務(wù)稅源管理分析方法,所述方法通過(guò)電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個(gè)電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫(kù)中,進(jìn)行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進(jìn)行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫(kù)中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進(jìn)行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系O
[0013]對(duì)采集數(shù)據(jù)進(jìn)行清洗流程如下:
將電子商務(wù)稅源管理云采集系統(tǒng)提供的網(wǎng)店基本信息表和銷售信息表導(dǎo)入數(shù)據(jù)庫(kù);將新的網(wǎng)店基本信息與原網(wǎng)店基本信息進(jìn)行合并,更新網(wǎng)店基本信息:加入新開(kāi)網(wǎng)店,并為新網(wǎng)店生成網(wǎng)店id,修改網(wǎng)店?duì)顟B(tài)與實(shí)際狀態(tài)一致,更新網(wǎng)店所屬公司名稱; 將多個(gè)電商的網(wǎng)店基本信息進(jìn)行合并,將不同電商中網(wǎng)店屬于同一公司的銷售信息歸一化,并取得公司名稱列表,獲得互聯(lián)網(wǎng)電商信息。
[0014]對(duì)稅局組織內(nèi)數(shù)據(jù)進(jìn)行ETL的流程如下:
參照產(chǎn)生的公司名稱列表,從稅局組織內(nèi)數(shù)據(jù)中進(jìn)行查找匹配,獲取有效納稅人基本信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)出稅種認(rèn)定信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)納稅人資格信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)增值稅認(rèn)定信息;
根據(jù)上述信息關(guān)聯(lián)納稅申報(bào)信息和增值稅發(fā)票開(kāi)具信息,獲得稅務(wù)信息。
[0015]數(shù)據(jù)整合分析流程:將清洗過(guò)的互聯(lián)網(wǎng)電商信息與通過(guò)ETL獲得的稅務(wù)信息進(jìn)行關(guān)聯(lián)規(guī)則分析、數(shù)據(jù)挖掘分析以及統(tǒng)計(jì)比對(duì),獲得非正常繳稅納稅人列表,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系、電商關(guān)聯(lián)關(guān)系、電商銷售發(fā)展趨勢(shì)、稅收預(yù)警。
[0016]所述方法業(yè)務(wù)流程如下:
O電子商務(wù)稅源管理系統(tǒng)云采集系統(tǒng)采集信息;
2)所采集的電子商務(wù)網(wǎng)站的有效數(shù)據(jù)結(jié)構(gòu)化,并導(dǎo)入數(shù)據(jù)庫(kù)并初始化,對(duì)數(shù)據(jù)根據(jù)應(yīng)用需求進(jìn)行缺失值填充、去重、合并以及抽取轉(zhuǎn)換;
3)網(wǎng)點(diǎn)基本信息更新;
4)多電商基本信息及銷售信息合并,獲得網(wǎng)店所屬公司名稱列表;
5)將稅務(wù)局管理系統(tǒng)提供的組織內(nèi)數(shù)據(jù)進(jìn)行ETL抽取轉(zhuǎn)換,保存到本系統(tǒng)數(shù)據(jù)庫(kù)中,并結(jié)合網(wǎng)店所屬公司名稱列表匹配有效納稅人;
6)關(guān)聯(lián)稅種、納稅人資格和增值稅認(rèn)定情況;
7)關(guān)聯(lián)納稅申報(bào)和增值稅開(kāi)票信息;
8)對(duì)步驟4)獲得的電商基本信息、銷售信息和步驟7)獲得的稅務(wù)信息進(jìn)行數(shù)據(jù)挖掘分析、對(duì)比統(tǒng)計(jì)。
[0017]以上實(shí)施方式僅用于說(shuō)明本發(fā)明,而并非對(duì)本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由權(quán)利要求限定。
【主權(quán)項(xiàng)】
1.一種電子商務(wù)稅源管理分析方法,其特征在于:所述方法通過(guò)電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個(gè)電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫(kù)中,進(jìn)行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進(jìn)行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫(kù)中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進(jìn)行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系。
2.根據(jù)權(quán)利要求1所述的一種電子商務(wù)稅源管理分析方法,其特征在于,對(duì)采集數(shù)據(jù)進(jìn)行清洗流程如下: 將電子商務(wù)稅源管理云采集系統(tǒng)提供的網(wǎng)店基本信息表和銷售信息表導(dǎo)入數(shù)據(jù)庫(kù); 將新的網(wǎng)店基本信息與原網(wǎng)店基本信息進(jìn)行合并,更新網(wǎng)店基本信息:加入新開(kāi)網(wǎng)店,并為新網(wǎng)店生成網(wǎng)店id,修改網(wǎng)店?duì)顟B(tài)與實(shí)際狀態(tài)一致,更新網(wǎng)店所屬公司名稱; 將多個(gè)電商的網(wǎng)店基本信息進(jìn)行合并,將不同電商中網(wǎng)店屬于同一公司的銷售信息歸一化,并取得公司名稱列表,獲得互聯(lián)網(wǎng)電商信息。
3.根據(jù)權(quán)利要求2所述的一種電子商務(wù)稅源管理分析方法,其特征在于,對(duì)稅局組織內(nèi)數(shù)據(jù)進(jìn)行ETL的流程如下: 參照產(chǎn)生的公司名稱列表,從稅局組織內(nèi)數(shù)據(jù)中進(jìn)行查找匹配,獲取有效納稅人基本信息; 根據(jù)有效納稅人基本信息關(guān)聯(lián)出稅種認(rèn)定信息; 根據(jù)有效納稅人基本信息關(guān)聯(lián)納稅人資格信息; 根據(jù)有效納稅人基本信息關(guān)聯(lián)增值稅認(rèn)定信息; 根據(jù)上述信息關(guān)聯(lián)納稅申報(bào)信息和增值稅發(fā)票開(kāi)具信息,獲得稅務(wù)信息。
4.根據(jù)權(quán)利要求2或3所述的一種電子商務(wù)稅源管理分析方法,其特征在于數(shù)據(jù)整合分析流程:將清洗過(guò)的互聯(lián)網(wǎng)電商信息與通過(guò)ETL獲得的稅務(wù)信息進(jìn)行關(guān)聯(lián)規(guī)則分析、數(shù)據(jù)挖掘分析以及統(tǒng)計(jì)比對(duì),獲得非正常繳稅納稅人列表,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系、電商關(guān)聯(lián)關(guān)系、電商銷售發(fā)展趨勢(shì)、稅收預(yù)警。
5.根據(jù)權(quán)利要求4所述的一種電子商務(wù)稅源管理分析方法,其特征在于,所述方法業(yè)務(wù)流程如下: O電子商務(wù)稅源管理系統(tǒng)云采集系統(tǒng)采集信息; 2)所采集的電子商務(wù)網(wǎng)站的有效數(shù)據(jù)結(jié)構(gòu)化,并導(dǎo)入數(shù)據(jù)庫(kù)并初始化,對(duì)數(shù)據(jù)根據(jù)應(yīng)用需求進(jìn)行缺失值填充、去重、合并以及抽取轉(zhuǎn)換; 3)網(wǎng)點(diǎn)基本信息更新; 4)多電商基本信息及銷售信息合并,獲得網(wǎng)店所屬公司名稱列表; 5)將稅務(wù)局管理系統(tǒng)提供的組織內(nèi)數(shù)據(jù)進(jìn)行ETL抽取轉(zhuǎn)換,保存到本系統(tǒng)數(shù)據(jù)庫(kù)中,并結(jié)合網(wǎng)店所屬公司名稱列表匹配有效納稅人; 6)關(guān)聯(lián)稅種、納稅人資格和增值稅認(rèn)定情況; 7)關(guān)聯(lián)納稅申報(bào)和增值稅開(kāi)票信息; 8)對(duì)步驟4)獲得的電商基本信息、銷售信息和步驟7)獲得的稅務(wù)信息進(jìn)行數(shù)據(jù)挖掘分析、對(duì)比統(tǒng)計(jì)。
【專利摘要】本發(fā)明公開(kāi)了一種電子商務(wù)稅源管理分析方法,所述方法通過(guò)電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個(gè)電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫(kù)中,進(jìn)行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進(jìn)行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫(kù)中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進(jìn)行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系。采用本發(fā)明方法,可以挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系等,并進(jìn)一步利用數(shù)據(jù)可視化技術(shù)呈現(xiàn)給稅務(wù)人員,為稅收精細(xì)化管理、精確決策提供數(shù)據(jù)分析平臺(tái),提高稅收評(píng)估能力,完善稅收管理決策模式,提高稅收,推進(jìn)信息管稅、科學(xué)征稅、依法征稅。
【IPC分類】G06Q40-00, G06F17-30
【公開(kāi)號(hào)】CN104598634
【申請(qǐng)?zhí)枴緾N201510062792
【發(fā)明人】范瑩, 于治樓
【申請(qǐng)人】浪潮集團(tuán)有限公司
【公開(kāi)日】2015年5月6日
【申請(qǐng)日】2015年2月6日