本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法及裝置。
背景技術(shù):
小微企業(yè)的資金需求存在著“短、小、頻、急”的特點(diǎn),尤其是單戶授信總額500萬元以下的小微企業(yè)客戶,在商業(yè)銀行貸款中,存在評價難、流程長等諸多問題,制約了業(yè)務(wù)的發(fā)展。
現(xiàn)有信貸業(yè)務(wù)流程為:客戶申請時,由客戶遞交紙質(zhì)的申請材料,由受理人員向評價人員遞交申請材料。評價人員進(jìn)行客戶調(diào)查,并根據(jù)調(diào)查的信息進(jìn)行客戶評級??蛻粼u級時,重點(diǎn)參考客戶的財務(wù)信息。根據(jù)評級結(jié)果,測算客戶的授信限額,確定授信額度并進(jìn)行額度申報。審批人根據(jù)評價人員遞交的授信申報材料進(jìn)行人工審批,審批通過后下達(dá)額度審批批復(fù)。批復(fù)完成后,評價人員再次組織申報材料,確定單筆貸款支用金額,并進(jìn)行單筆支用審批申報。審批人對單筆支用業(yè)務(wù)人工進(jìn)行審批。審批通過后下達(dá)批復(fù)。審批通過后在線下進(jìn)行合同簽訂,并在柜臺完成放款操作。
由此可見,現(xiàn)有的信貸業(yè)務(wù)流程都是人工執(zhí)行的,整個業(yè)務(wù)處理過程比較繁瑣也比較耗時,即信貸業(yè)務(wù)處理效率較低,用戶體驗很不好。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明提供了一種數(shù)據(jù)處理方法及裝置,用以解決現(xiàn)有的信貸業(yè)務(wù)流程都是人工執(zhí)行的,整個業(yè)務(wù)處理過程比較繁瑣也比較耗時,即信貸業(yè)務(wù)處理效率較低,用戶體驗很不好的問題,其技術(shù)方案如下:
一種數(shù)據(jù)處理方法,預(yù)先建立評分卡模型,所述數(shù)據(jù)處理方法包括:
接收申請人的業(yè)務(wù)申報請求,所述業(yè)務(wù)申報請求中包含業(yè)務(wù)申報信息;
判斷是否接收到指示所述業(yè)務(wù)申報信息審核通過的審核信息;
當(dāng)接收到指示所述業(yè)務(wù)申報信息審核通過的審核信息時,通過預(yù)先建立的所述評分卡模型對所述業(yè)務(wù)申報信息進(jìn)行評分,獲得所述業(yè)務(wù)申報信息的評分值;
通過所述述業(yè)務(wù)申報信息的評分值確定所述業(yè)務(wù)申報信息的申報結(jié)果,并基于所述業(yè)務(wù)申報信息的申報結(jié)果處理所述業(yè)務(wù)申報信息。
其中,所述申報結(jié)果包括:申報通過、人工審批和申報拒絕;
則所述通過所述述業(yè)務(wù)申報信息的評分值確定所述業(yè)務(wù)申報信息的申報結(jié)果,包括:
當(dāng)所述業(yè)務(wù)申報信息的評分值大于第一預(yù)設(shè)值時,確定所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報通過;
當(dāng)所述業(yè)務(wù)申報信息的評分值大于或等于第二預(yù)設(shè)值,且小于或等于所述第一預(yù)設(shè)值時,確定所述業(yè)務(wù)申報信息的申報結(jié)果為所述人工審批;
當(dāng)所述業(yè)務(wù)申報信息的評分值小于所述第二預(yù)設(shè)值時,確定所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報拒絕。
其中,所述基于所述業(yè)務(wù)申報信息的申報結(jié)果處理所述業(yè)務(wù)申報信息,包括:
當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報通過時,基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于所述初步審核信息和所述業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見;
當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述人工審批時,基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對所述業(yè)務(wù)申報信息發(fā)起人工審批請求;
當(dāng)所述再審策略為所述再審拒絕時,將所述業(yè)務(wù)申報請求掛起,以對所述業(yè)務(wù)申報信息重評。
其中,所述基于所述業(yè)務(wù)申報信息的申報結(jié)果處理所述業(yè)務(wù)申報信息,包括:
當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報通過時,如果第一預(yù)設(shè)時間段內(nèi)接收到針對所述業(yè)務(wù)申報信息的選取指令,則基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于所述初步審核信息和所述業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見,否則,對所述業(yè)務(wù)申報信息發(fā)起人工審批請求;
當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述人工審批時,基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對業(yè)務(wù)申報信息發(fā)起人工審批請求;
當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報拒絕時,如果第二預(yù)設(shè)時間段內(nèi)接收到針對所述業(yè)務(wù)申報信息的重評指令,則對所述業(yè)務(wù)申報信息發(fā)起人工審批請求,否則拒絕所述業(yè)務(wù)申報請求。
其中,所述預(yù)先建立評分卡模型,包括:
獲取滿足預(yù)設(shè)條件的原始樣本數(shù)據(jù);
按預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述原始樣本數(shù)據(jù)進(jìn)行清洗,獲得目標(biāo)樣本數(shù)據(jù);
從所述目標(biāo)樣本數(shù)據(jù)中按預(yù)設(shè)的數(shù)據(jù)抽取規(guī)則抽取用于構(gòu)建所述評分卡模型的開發(fā)樣本集和驗證樣本集;
從目標(biāo)樣本數(shù)據(jù)中獲取業(yè)務(wù)變量,通過Logistic回歸方法按預(yù)設(shè)的選取規(guī)則從所述業(yè)務(wù)變量中選取目標(biāo)變量;
基于所述開發(fā)樣本集、所述驗證樣本集和所述目標(biāo)變量確定所述評分卡模型。
一種數(shù)據(jù)處理裝置,預(yù)先建立評分卡模型,所述數(shù)據(jù)處理裝置包括:接收模塊、判斷模塊、評分模塊、確定模塊和處理模塊;
所述接收模塊,用于接收申請人的業(yè)務(wù)申報請求,所述業(yè)務(wù)申報請求中包含業(yè)務(wù)申報信息;
所判斷模塊,用于判斷是否接收到指示所述接收模塊接收的所述業(yè)務(wù)申報請求中所述業(yè)務(wù)申報信息審核通過的審核信息;
所述評分模塊,用于當(dāng)所述判斷模塊判斷出接收到所述業(yè)務(wù)申報信息審核通過的審核信息時,通過預(yù)先建立的所述評分卡模型對所述業(yè)務(wù)申報信息進(jìn)行評分,獲得所述業(yè)務(wù)申報信息的評分值;
所述確定模塊,用于通過所述評分模塊評出的所述述業(yè)務(wù)申報信息的評分值確定所述業(yè)務(wù)申報信息的申報結(jié)果;
所述處理模塊,用于基于所述確定模塊確定出的所述業(yè)務(wù)申報信息的申報結(jié)果處理所述業(yè)務(wù)申報信息。
其中,所述申報結(jié)果包括:申報通過、人工審批和申報拒絕;
所述確定模塊,包括:所述第一確定子模塊、第二確定子模塊和第三確定子模塊;
所述第一確定子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的評分值大于第一預(yù)設(shè)值時,確定所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報通過;
所述第二確定子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的評分值大于或等于第二預(yù)設(shè)值,且小于或等于所述第一預(yù)設(shè)值時,確定所述業(yè)務(wù)申報信息的申報結(jié)果為所述人工審批;
所述第三確定子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的評分值小于所述第二預(yù)設(shè)值時,確定所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報拒絕。
其中,所述處理模塊包括:第一處理子模塊、第二處理子模塊和第三處理子模塊;
所述第一處理子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報通過時,基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于所述初步審核信息和所述業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見;
所述第二處理子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述人工審批時,基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對業(yè)務(wù)申報書發(fā)起人工審批請求;
所述第三處理子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報拒絕時,將所述業(yè)務(wù)申報請求掛起,以對所述業(yè)務(wù)申報信息重評。
其中,所述處理模塊包括:第四處理子模塊、第五處理子模塊和第六處理子模塊;
所述第四處理子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報通過時,如果第一預(yù)設(shè)時段內(nèi)接收到針對所述業(yè)務(wù)申報信息的選取指令,則基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于所述初步審核信息和所述業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見,否則,對所述業(yè)務(wù)申報信息發(fā)起人工審批請求;
所述第五處理子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述人工審批時,基于所述業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對業(yè)務(wù)申報信息發(fā)起人工審批請求;
所述第六處理子模塊,用于當(dāng)所述業(yè)務(wù)申報信息的申報結(jié)果為所述申報拒絕時,如果第二預(yù)設(shè)時段內(nèi)接收到針對所述業(yè)務(wù)申報信息的重評指令,則對所述業(yè)務(wù)申報信息發(fā)起人工審批請求,否則拒絕所述業(yè)務(wù)申報請求。
其中,所述裝置還包括:評分卡模型建立模塊;
所述評分卡模型建立模塊包括:數(shù)據(jù)選取子模塊、數(shù)據(jù)清洗子模塊、數(shù)據(jù)抽取子模塊、變量獲取子模塊和模型確定子模塊;
所述數(shù)據(jù)選取子模塊,用于獲取滿足預(yù)設(shè)條件的原始樣本數(shù)據(jù);
所述數(shù)據(jù)清洗子模塊,用于按預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述數(shù)據(jù)選取子模塊選取的所述原始樣本數(shù)據(jù)進(jìn)行清洗,獲得目標(biāo)樣本數(shù)據(jù);
所述數(shù)據(jù)抽取子模塊,用于從所述數(shù)據(jù)清洗子模塊清洗得到的所述目標(biāo)樣本數(shù)據(jù)中按預(yù)設(shè)的數(shù)據(jù)抽取原則抽取用于構(gòu)建所述評分卡模型的開發(fā)樣本集和驗證樣本集;
所述變量獲取子模塊,用于從所述數(shù)據(jù)清洗子模塊清洗得到的所述目標(biāo)樣本數(shù)據(jù)中獲取業(yè)務(wù)變量,并通過Logistic回歸方法按預(yù)設(shè)的選取規(guī)則從所述業(yè)務(wù)變量中選取目標(biāo)變量;
所述模型確定子模塊,用于基于所述數(shù)據(jù)抽取子模塊抽取的所述開發(fā)樣本集、驗證樣本集和所述變量獲取子模塊獲取的所述目標(biāo)變量確定所述評分卡模型。
上述技術(shù)方案具有如下有益效果:
本發(fā)明提供的數(shù)據(jù)處理方法及裝置,在接收申請人的業(yè)務(wù)申報請求時,首先判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息,當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,可通過預(yù)先建立的評分卡模型自動對業(yè)務(wù)申報信息進(jìn)行評分,并可通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果,從而可基于申報結(jié)果自動處理業(yè)務(wù)申報信息。由此可見,本發(fā)明提供的數(shù)據(jù)處理方法及裝置使得業(yè)務(wù)申報信息的處理不再由人工執(zhí)行,與人工處理業(yè)務(wù)申報信息的過程相比,業(yè)務(wù)申報信息的處理過程簡單,這使得業(yè)務(wù)申報信息的處理效率大大提高,用戶體驗較好。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實施例提供的數(shù)據(jù)處理方法的一流程示意圖;
圖2為本發(fā)明實施例提供的數(shù)據(jù)處理方法的另一流程示意圖;
圖3為本發(fā)明實施例提供的數(shù)據(jù)處理方法的另一流程示意圖;
圖4為本發(fā)明實施例提供的不同表現(xiàn)期內(nèi)壞客戶占比;
圖5為本發(fā)明實施例提供的建立評分卡模型的實現(xiàn)方式的流程示意圖;
圖6為基礎(chǔ)數(shù)據(jù)的表現(xiàn)期和觀察期長度示意圖;
圖7為本發(fā)明實施例提供的數(shù)據(jù)處理裝置的一結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實施例提供了一種數(shù)據(jù)處理方法,請參閱圖1,示出了該方法的一流程示意圖,該方法需預(yù)先建立評分卡模型,該數(shù)據(jù)處理方法可以包括:
步驟S101:接收申請人的業(yè)務(wù)申報請求,該業(yè)務(wù)申報請求中包含業(yè)務(wù)申報信息。
步驟S102:判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息。
當(dāng)接收到申請人的業(yè)務(wù)申報請求時,對業(yè)務(wù)申報信息進(jìn)行初步審核,如果初步審核成功,則進(jìn)入后續(xù)的評分流程,否則不執(zhí)行任何操作。
步驟S103:當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,通過預(yù)先建立的評分卡模型對業(yè)務(wù)申報信息進(jìn)行評分,獲得業(yè)務(wù)申報信息的評分值。
需要說明的是,當(dāng)接收到指示業(yè)務(wù)申報信息審核未通過的審核信息時,結(jié)束業(yè)務(wù)申報信息的處理流程。
步驟S104:通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果,并基于業(yè)務(wù)申報信息的申報結(jié)果處理業(yè)務(wù)申報信息。
本發(fā)明實施例提供的數(shù)據(jù)處理方法,在接收申請人的業(yè)務(wù)申報請求時,首先判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息,當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,可通過預(yù)先建立的評分卡模型自動對業(yè)務(wù)申報信息進(jìn)行評分,并可通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果,從而可基于申報結(jié)果自動處理業(yè)務(wù)申報信息。由此可見,本發(fā)明實施例提供的數(shù)據(jù)處理方法使得業(yè)務(wù)申報信息的處理不再由人工執(zhí)行,與人工處理業(yè)務(wù)申報信息的過程相比,業(yè)務(wù)申報信息的處理過程簡單,這使得業(yè)務(wù)申報信息的處理效率大大提高,用戶體驗較好。另外,本發(fā)明實施例簡化了業(yè)務(wù)申報處理所需的申報材料,并通過電子化、無紙化操作,提高了業(yè)務(wù)信息的傳遞效率。
請參閱圖2,示出了本發(fā)明實施例提供的數(shù)據(jù)處理方法的另一流程示意圖,該方法需預(yù)先建立評分卡模型,該數(shù)據(jù)處理方法可以包括:
步驟S201:接收申請人的業(yè)務(wù)申報請求,該業(yè)務(wù)申報請求中包含業(yè)務(wù)申報信息。
步驟S202:判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息。
當(dāng)接收到申請人的業(yè)務(wù)申報請求時,對業(yè)務(wù)申報信息進(jìn)行初步審核,如果初步審核成功,則進(jìn)入后續(xù)的評分流程,否則不執(zhí)行任何操作。
步驟S203:當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,通過預(yù)先建立的評分卡模型對業(yè)務(wù)申報信息進(jìn)行評分,獲得業(yè)務(wù)申報信息的評分值。
需要說明的是,當(dāng)接收到指示業(yè)務(wù)申報信息審核未通過的審核信息時,結(jié)束業(yè)務(wù)申報信息的處理流程。
步驟S204:通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果。
其中,申報結(jié)果包括:申報通過、人工審批和申報拒絕。
在一種可能的實現(xiàn)方式中,通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果的實現(xiàn)過程可以包括:當(dāng)業(yè)務(wù)申報信息的評分值大于第一預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為申報通過;當(dāng)業(yè)務(wù)申報信息的評分值大于或等于第二預(yù)設(shè)值,且小于或等于第一預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為人工審批;當(dāng)業(yè)務(wù)申報信息的評分值小于第二預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為申報拒絕。
步驟S205a:當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報通過時,基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于審核信息和業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見。
其中,業(yè)務(wù)申報書可以為PDF格式。
步驟S205b:當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為人工審批時,基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對業(yè)務(wù)申報書發(fā)起人工審批請求。
在對業(yè)務(wù)申報書發(fā)起人工審批請求后,相關(guān)工作人員可對業(yè)務(wù)申報信息進(jìn)行全面分析,出具審批意見,人工審批包含單簽、雙簽、會簽和會議審批四種方式。
步驟S205c:當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報拒絕時,將業(yè)務(wù)申報請求掛起,以對業(yè)務(wù)申報信息重評。
在一種可能的實現(xiàn)方法中,具有重評權(quán)限的工作人員如部門主管可對申報拒絕的業(yè)務(wù)申報信息進(jìn)行重新評分。對申報拒絕的客戶,如果具有重評權(quán)限的工作人員決定進(jìn)行重新評分,業(yè)務(wù)進(jìn)入人工審批環(huán)節(jié),并針對業(yè)務(wù)申報信息附上重評指示信息,示例性在,在針對業(yè)務(wù)申報信息附上“挽救”字樣。
對申報拒絕的業(yè)務(wù)申報信息,如果工作人員決定進(jìn)行重評,則由客戶經(jīng)理修改業(yè)務(wù)信息,業(yè)務(wù)申報人員修改業(yè)務(wù)申報信息,系統(tǒng)保留每次評分的評分指標(biāo)、評分結(jié)果以及評分人,業(yè)務(wù)附有“重評”字樣。同一筆業(yè)務(wù),只能進(jìn)行最多二次重評。進(jìn)行重評的業(yè)務(wù),不允許自動通過。
本發(fā)明實施例提供的方法還可以包括:判斷業(yè)務(wù)申報請求的掛起時長是否大于預(yù)設(shè)時長,當(dāng)業(yè)務(wù)申報請求的掛起時長大于所述預(yù)設(shè)時長時,結(jié)束業(yè)務(wù)申報信息的申報流程。
本發(fā)明實施例提供的數(shù)據(jù)處理方法,在接收申請人的業(yè)務(wù)申報請求時,首先判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息,當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,可通過預(yù)先建立的評分卡模型自動對業(yè)務(wù)申報信息進(jìn)行評分,并可通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果,從而可基于申報結(jié)果自動處理業(yè)務(wù)申報信息。由此可見,本發(fā)明實施例提供的數(shù)據(jù)處理方法使得業(yè)務(wù)申報信息的處理不再由人工執(zhí)行,與人工處理業(yè)務(wù)申報信息的過程相比,業(yè)務(wù)申報信息的處理過程簡單,這使得業(yè)務(wù)申報信息的處理效率大大提高,用戶體驗較好。另外,本發(fā)明實施例簡化了業(yè)務(wù)申報處理所需的申報材料,并通過電子化、無紙化操作,提高了業(yè)務(wù)信息的傳遞效率。
請參閱圖3,示出了為本發(fā)明實施例提供的數(shù)據(jù)處理方法的再一流程示意圖,該方法需預(yù)先建立評分卡模型,該數(shù)據(jù)處理方法可以包括:
步驟S301:接收申請人的業(yè)務(wù)申報請求,該業(yè)務(wù)申報請求中包含業(yè)務(wù)申報信息。
步驟S302:判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息。
當(dāng)接收到申請人的業(yè)務(wù)申報請求時,審核人員對業(yè)務(wù)申報信息進(jìn)行初步審核,如果初步審核成功,則進(jìn)入后續(xù)的評分流程,否則結(jié)束業(yè)務(wù)申報信息的處理流程。
步驟S303:當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,通過預(yù)先建立的評分卡模型對業(yè)務(wù)申報信息進(jìn)行評分,獲得業(yè)務(wù)申報信息的評分值。
步驟S304:通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果。
其中,申報結(jié)果包括:申報通過、人工審批和申報拒絕。
在一種可能的實現(xiàn)方式中,通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果,可以包括:當(dāng)業(yè)務(wù)申報信息的評分值大于第一預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為申報通過;當(dāng)業(yè)務(wù)申報信息的評分值大于或等于第二預(yù)設(shè)值,且小于或等于第一預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為人工審批;當(dāng)業(yè)務(wù)申報信息的評分值小于第二預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為申報拒絕。
步驟S305a:當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報通過時,判斷第一預(yù)設(shè)時間段內(nèi)是否接收到針對業(yè)務(wù)申報信息的選取指令,如果是,則執(zhí)行步驟S306aa,否則執(zhí)行步驟S306ab。
在本實施例中,具有操作權(quán)限的人員如部門主管可從申報結(jié)果為申報通過的業(yè)務(wù)信息中挑選部分業(yè)務(wù)信息,這部分業(yè)務(wù)信息可直接通過,不用進(jìn)一步進(jìn)行人工審批,而未選中的業(yè)務(wù)信息需進(jìn)一步進(jìn)行人工審批。
步驟S306aa:基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于初步審核信息和業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見。
步驟S306ab:對業(yè)務(wù)申報信息發(fā)起人工審批請求。
步驟S305b:當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為人工審批時,基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對業(yè)務(wù)申報信息發(fā)起人工審批請求。
步驟S305c:當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報拒絕時,判斷第二預(yù)設(shè)時間段內(nèi)是否接收到針對業(yè)務(wù)申報信息的重評指令,如果是,則執(zhí)行S306ca,否則執(zhí)行步驟S306cb。
步驟S306ca:對業(yè)務(wù)申報信息發(fā)起人工重評請求。
步驟S306cb:拒絕業(yè)務(wù)申報請求。
在一種可能的實現(xiàn)方法中,具有重評權(quán)限的工作人員如部門主管可從申報拒絕的業(yè)務(wù)申報信息中挑選部分業(yè)務(wù)信息進(jìn)行重評,進(jìn)入人工審批環(huán)節(jié),優(yōu)選的,可針對業(yè)務(wù)申報信息附上重評指示信息,示例性在,在針對業(yè)務(wù)申報信息附上“挽救”字樣,而對于未挑選的業(yè)務(wù)信息則直接拒絕。
對申報拒絕的業(yè)務(wù)申報信息,如果具有重評權(quán)限的工作人員決定進(jìn)行重評,則由客戶經(jīng)理修改業(yè)務(wù)信息,業(yè)務(wù)申報人員修改業(yè)務(wù)申報信息,系統(tǒng)保留每次評分的評分指標(biāo)、評分結(jié)果以及評分人,業(yè)務(wù)附有“重評”字樣。同一筆業(yè)務(wù),只能進(jìn)行最多二次重評。進(jìn)行重評的業(yè)務(wù),不允許自動通過。
本發(fā)明實施例提供的數(shù)據(jù)處理方法,在接收申請人的業(yè)務(wù)申報請求時,首先判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息,當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,可通過預(yù)先建立的評分卡模型自動對業(yè)務(wù)申報信息進(jìn)行評分,并可通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果,從而可基于申報結(jié)果自動處理業(yè)務(wù)申報信息。由此可見,本發(fā)明實施例提供的數(shù)據(jù)處理方法使得業(yè)務(wù)申報信息的處理不再由人工執(zhí)行,與人工處理業(yè)務(wù)申報信息的過程相比,業(yè)務(wù)申報信息的處理過程簡單,這使得業(yè)務(wù)申報信息的處理效率大大提高,用戶體驗較好。另外,本發(fā)明實施例簡化了業(yè)務(wù)申報處理所需的申報材料,并通過電子化、無紙化操作,提高了業(yè)務(wù)信息的傳遞效率。
需要說明的是,上述評分卡模型采用Logistic回歸方法建立。Logistic回歸方法是目前業(yè)界比較成熟的通用方法,具有科學(xué)性、合理性。模型處理兩分類因變量的數(shù)據(jù)有其獨(dú)特的優(yōu)勢,模型關(guān)于數(shù)據(jù)分布的假定較弱,在數(shù)據(jù)為非正態(tài)分布時,也有較好的表現(xiàn)。
模型的基本假設(shè)是客戶的反優(yōu)比對數(shù)是其屬性的線性回歸:
上述公式中,x是客戶的屬性向量,p(x)表示客戶在觀察期內(nèi)變?yōu)閴目蛻舻母怕剩?-p(x)表示客戶在觀察期內(nèi)變?yōu)楹每蛻舻母怕?,表示該屬性向量x對應(yīng)的反優(yōu)比,即客戶在觀察期內(nèi)變?yōu)閴目蛻舻母怕逝c客戶變?yōu)楹每蛻舻母怕实谋戎怠?/p>
模型輸入項為申請人的基本屬性信息和申請信息變量,模型基本輸出項為申請人的好壞比(可換算為違約概率),即根據(jù)申請人的基本情況,預(yù)測在未來一段時間內(nèi)發(fā)生違約的可能性,作為評分的基礎(chǔ)。建模利用Stepwise法逐步由少到多,按一定規(guī)則選擇回歸變量,最終綜合考慮建模樣本和檢驗樣本的KS值,以及變量的合理性,選擇合適的模型。實際模型中,采用屬性向量的woe作為x的元素,其中woe的定義如下:Woe=ln(每個分組中好客戶的占比/壞客戶的占比)。
需要說明的是,本發(fā)明將客戶分為好客戶和壞客戶兩類。根據(jù)微小企業(yè)客戶逾期滾動率情況,在逾期一個月的客戶中,有51.99%的客戶可以通過各種手段使其還款,恢復(fù)為正常客戶,而連續(xù)逾期兩個月的客戶中,有86.15%的客戶將繼續(xù)逾期到三個月以上,構(gòu)成實質(zhì)性違約。因此,在發(fā)明實施例中,壞客戶定義為在表現(xiàn)期內(nèi)連續(xù)逾期兩個月及以上的客戶,好客戶定義為在表現(xiàn)期內(nèi)未出現(xiàn)逾期的客戶。
模型表現(xiàn)期的確定采用了數(shù)據(jù)分析與業(yè)務(wù)經(jīng)驗相結(jié)合的方式。最終選擇的表現(xiàn)期應(yīng)能夠暴露大多數(shù)的違約客戶,同時保證樣本數(shù)量足夠、具備時效性。在本實施例中,選擇觀察期滿24個月的客戶樣本,分別統(tǒng)計開戶13、12和6個月以內(nèi)發(fā)生違約的客戶數(shù),數(shù)據(jù)顯示:約有95.87%的壞客戶在開戶13月以內(nèi)變?yōu)閴目蛻?,?7.84%的壞客戶是在12個月以內(nèi)變?yōu)閴目蛻?。因此,為確保客戶的表現(xiàn)期設(shè)置符合現(xiàn)在的業(yè)務(wù)實際情況,并能夠盡可能使客戶風(fēng)險充分表現(xiàn),表現(xiàn)期采用了滾動時間長度的方式,使得觀察樣本的表現(xiàn)期不低于12個月。
在觀察期選擇方面,如圖4所示,若選擇6個月觀察期,壞客戶的數(shù)量較少,不利于模型構(gòu)建的穩(wěn)定性要求,而選擇24個月觀察期,將難以充分體現(xiàn)壞客戶特征的時效性,同時,其壞客戶比率小于12個月觀察期客戶。若將觀察期設(shè)置為12個月,既能保證大多數(shù)的違約客戶能被識別,同時也能保證樣本的時效性,因此,將觀察期設(shè)為12個月,表現(xiàn)期設(shè)定為不低于12個月。
這樣,最終樣本中的壞客戶定義為開戶12個月內(nèi)連續(xù)逾期2個月及以上的客戶;中間客戶定義為開戶12個月內(nèi)逾期1個月的客戶;好客戶定義為開戶12個月內(nèi)未出現(xiàn)逾期的客戶。
請參閱圖5,示出了上述實施例中建立評分卡模型的實現(xiàn)過程的流程示意圖,可以包括:
步驟S501:獲取滿足預(yù)設(shè)條件的原始樣本數(shù)據(jù)。
在本實施中,構(gòu)建評分卡模型的樣本數(shù)據(jù)可取自對公業(yè)務(wù)數(shù)據(jù)和零售業(yè)務(wù)數(shù)據(jù),示例性的,獲取對公業(yè)務(wù)和零售業(yè)務(wù)數(shù)據(jù)表46張。原始樣本數(shù)據(jù)的選取應(yīng)滿足以下條件:一是原始樣本數(shù)據(jù)要滿足12個月的觀察期要求,例如,原始樣本數(shù)據(jù)的最新抽取時間為12年4月底,那么最晚客戶開戶時間為11年4月;二是原始樣本數(shù)據(jù)的違約客戶數(shù)要足夠,從而充分反映壞客戶的風(fēng)險特征;三是樣本數(shù)據(jù)要具備時效性。
示例性的,在違約客戶數(shù)據(jù)量足夠的前提下,按照12個月的觀察期和不低于12個月的表現(xiàn)期,選擇開戶時間在2010年5月至2011年4月之間全行的小企業(yè)貸款申請客戶作為原始樣本,如圖6所示。
步驟S502:按預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對原始樣本數(shù)據(jù)進(jìn)行清洗,獲得目標(biāo)樣本數(shù)據(jù)。
數(shù)據(jù)清洗過程就是根據(jù)建模數(shù)據(jù)范圍和數(shù)據(jù)清洗方案的要求,對數(shù)據(jù)進(jìn)行層層清洗,對那些不符合建模要求、缺失值較高、有誤差等的數(shù)據(jù)進(jìn)行清洗或修正,最終得到比較整齊、干凈,可以用作數(shù)據(jù)處理和模型開發(fā)的數(shù)據(jù)樣本。
數(shù)據(jù)清洗過程包含業(yè)務(wù)篩選、主要字段篩選,以及,數(shù)據(jù)合理性檢驗、修正和清理。其中:
業(yè)務(wù)篩選:刪除低風(fēng)險業(yè)務(wù)數(shù)據(jù),例如,刪除貸款產(chǎn)品為“銀行承兌匯票貼現(xiàn)”的微小企業(yè)貸款。
主要字段篩選:刪除合同開戶當(dāng)月授信余額超過預(yù)設(shè)金額的數(shù)據(jù)樣本,如果建模范圍是監(jiān)管機(jī)構(gòu)規(guī)定的“風(fēng)險暴露不超過500萬”的微小企業(yè)客戶,那么,基于建模樣本要求,刪除合同開戶當(dāng)月授信余額超過500萬的樣本。
數(shù)據(jù)合理性檢驗、修正和清理:篩選出含有非正常值的賬戶,修正那些非正常值數(shù)據(jù),此過程主要是對客戶累計發(fā)放金額進(jìn)行檢驗,一是刪除“截至2012年4月末合同累計發(fā)放金額<=0”的樣本;二是刪除“合同開戶當(dāng)月無客戶余額”的樣本。
步驟S503:從目標(biāo)樣本數(shù)據(jù)中按預(yù)設(shè)的數(shù)據(jù)抽取原則抽取用于構(gòu)建所述評分卡模型的開發(fā)樣本集和驗證樣本集。
根據(jù)業(yè)務(wù)和建模要求,建模數(shù)據(jù)分為全樣本集、開發(fā)樣本集和驗證樣本集三個樣本。全樣本集即為上述通過數(shù)據(jù)清洗過程之后獲得的目標(biāo)樣本數(shù)據(jù)。
開發(fā)樣本集和驗證樣本集從全樣本集中抽取獲得,具體的,從全樣本集中抽取樣本的規(guī)則為:首先從全樣本集抽取全部為“壞”的賬戶,然后隨機(jī)抽取“好”賬戶,如果“好”賬戶樣本數(shù)低于“壞”賬戶樣本數(shù)的10倍,則抽取全部“好”賬戶,否則,“好”賬戶的樣本抽取數(shù)量定為“壞”賬戶的10倍;“不確定”賬戶數(shù)的抽取方式和“好”賬戶類似,如果“不確定”賬戶樣本數(shù)低于“壞”賬戶樣本數(shù)的10倍,則抽取全部“不確定”賬戶,否則,“不確定”賬戶的樣本抽取數(shù)量定為“壞”賬戶的10倍。最后,將隨機(jī)抽取抽樣后的“好”、“壞”、“不確定”賬戶的60%為開發(fā)樣本,40%為驗證樣本。
步驟S504:從目標(biāo)樣本數(shù)據(jù)中獲取業(yè)務(wù)變量,通過Logistic回歸方法按預(yù)設(shè)的選取規(guī)則從業(yè)務(wù)變量中選取目標(biāo)變量。
需要說明的是,評分卡模型的變量主要來自于對公業(yè)務(wù)基礎(chǔ)數(shù)據(jù)表的原始字段,同時綜合考慮建模經(jīng)驗,變量的經(jīng)濟(jì)學(xué)含義、可獲得性和準(zhǔn)確性,將其中部分字段選擇作為建??蛇x的基本變量。
業(yè)務(wù)變量主要包括三種,分別為無需分組的變量、需要分組的離散型變量和連續(xù)類變量。本實施例將上述變量離散化,通過變量替換值WOE取代其離散取值建立模型。
無需分組的變量通常為2分類或3分類變量,可直接分析并計算其WOE值,這類變量包括是否老客戶等。需要分組的離散型變量通常有多個分組,不同方式的分組會影響到最終的變量表現(xiàn),這類變量包括注冊省份、行業(yè)門類、學(xué)歷、擔(dān)保方式等。
離散類變量分組的具體原則為,一是要確保各組之間要有風(fēng)險區(qū)分度,即違約率要有顯著區(qū)別;二是壞賬率高低與分組取值要有經(jīng)濟(jì)學(xué)或業(yè)務(wù)常識上的聯(lián)系;三是各組客戶樣本數(shù)量要滿足一定的要求以保證模型穩(wěn)定性,每個變量的各個分組的好/壞帳戶數(shù)量大于預(yù)設(shè)數(shù)量,如30;最后,分組不能太多,避免過擬合導(dǎo)致模型穩(wěn)定性差。
連續(xù)類變量,即變量值為數(shù)值的變量,主要包括貸款金額、貸款期限等。連續(xù)類變量的分組方法為:
(1)對變量進(jìn)行分段,示例性的,分為15-20段,再將相鄰分段且違約率小于預(yù)設(shè)值的分段合并,得到初分段;
(2)對初分段的邊界點(diǎn)進(jìn)行上下微調(diào),尋找區(qū)分度更高的分段邊界點(diǎn);
(3)對于樣本數(shù)過多或過少的分段,進(jìn)行合并或重新細(xì)分;
(4)每個變量的各個分段中好/壞帳戶數(shù)量大于預(yù)設(shè)數(shù)量,如30;
(5)每個變量的各個分段的賬戶個數(shù)百分比至少大于預(yù)設(shè)值,如2%(通常情況盡量保證5%)。
此外,分段后的離散類變量也要確保壞賬率高低與分組取值要有經(jīng)濟(jì)學(xué)或業(yè)務(wù)常識上的聯(lián)系。
基于上述分組方法,本次建模對備選變量進(jìn)行了單變量分組和WOE分析,將其中表現(xiàn)顯著的變量(與客戶是否發(fā)生違約有顯著相關(guān)性的變量)納入模型訓(xùn)練的候選變量。未作為訓(xùn)練候選的變量可分為兩類,其中一類變量具有區(qū)分能力,但不顯著,或存在明顯的缺陷;另一類則是通過分析發(fā)現(xiàn)明顯不適用的變量,如多數(shù)財務(wù)指標(biāo)與壞賬率的關(guān)系與業(yè)務(wù)實際情況明顯不符。
用logistic方法進(jìn)行模型訓(xùn)練,得到模型的訓(xùn)練參數(shù),即上式中的α和β?,F(xiàn)有技術(shù)中,通常將“P<0.05”作為篩選變量的標(biāo)準(zhǔn),而本發(fā)明以“P<0.25”為篩選變量的標(biāo)準(zhǔn)。之所以將“P<0.25”作為篩選變量的標(biāo)準(zhǔn),是考慮到在構(gòu)建評分卡模型的過程中,選擇一個足夠大的水平,以保證將有可能成為重要預(yù)測變量的候選變量均納入到多元分析中。本實施例將用logistic方法進(jìn)行模型訓(xùn)練,以“P<0.25”作為篩選變量的標(biāo)準(zhǔn)篩選得到的變量作為目標(biāo)變量。
步驟S505:基于開發(fā)樣本集和驗證樣本集和目標(biāo)變量確定評分卡模型。
為了提高評分卡模型的準(zhǔn)確定,本發(fā)明還提供了評分卡模型的校準(zhǔn)過程,設(shè)定評分卡模型校準(zhǔn)參數(shù)為:標(biāo)準(zhǔn)評分為200分,標(biāo)準(zhǔn)odds為10:1,PDO等于20,odds和PDO為統(tǒng)計學(xué)中的指標(biāo),用于對模型指標(biāo)的有效性進(jìn)行判斷。基于上述參數(shù),邏輯回歸結(jié)果(運(yùn)用logistic方法回歸出的結(jié)果)與最終模型評分的轉(zhuǎn)換關(guān)系為:
模型評分常數(shù)項=200-(20/ln(2))*ln(10)+(20/ln(2))*邏輯回歸結(jié)果的常數(shù)項;
變量的模型評分=(20/ln(2))*變量的評分權(quán)重;
變量分組的模型評分=變量的模型評分*分組的WOE。
與上述方法相對應(yīng),本發(fā)明實施例還提供了一種數(shù)據(jù)處理裝置,預(yù)先建立評分卡模型,請參閱圖7,示出了該數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖,可以包括:接收模塊701、判斷模塊702、評分模塊703、確定模塊704和處理模塊705。其中:
接收模塊701,用于接收申請人的業(yè)務(wù)申報請求,其中,業(yè)務(wù)申報請求中包含業(yè)務(wù)申報信息。
判斷模塊702,用于判斷是否接收到指示接收模塊701接收的業(yè)務(wù)申報請求中業(yè)務(wù)申報信息審核通過的審核信息。
評分模塊703,用于判斷模塊702判斷出接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,通過預(yù)先建立的評分卡模型對業(yè)務(wù)申報信息進(jìn)行評分,獲得業(yè)務(wù)申報信息的評分值。
確定模塊704,用于通過評分模塊703評出的業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果。
處理模塊705,用于基于確定模塊704確定出的業(yè)務(wù)申報信息的申報結(jié)果處理業(yè)務(wù)申報信息。
本發(fā)明實施例提供的數(shù)據(jù)處理裝置,在接收申請人的業(yè)務(wù)申報請求時,首先判斷是否接收到指示業(yè)務(wù)申報信息審核通過的審核信息,當(dāng)接收到指示業(yè)務(wù)申報信息審核通過的審核信息時,可通過預(yù)先建立的評分卡模型自動對業(yè)務(wù)申報信息進(jìn)行評分,并可通過業(yè)務(wù)申報信息的評分值確定業(yè)務(wù)申報信息的申報結(jié)果,從而可基于申報結(jié)果自動處理業(yè)務(wù)申報信息。由此可見,本發(fā)明實施例提供的數(shù)據(jù)處理方法使得業(yè)務(wù)申報信息的處理不再由人工執(zhí)行,與人工處理業(yè)務(wù)申報信息的過程相比,業(yè)務(wù)申報信息的處理過程簡單,這使得業(yè)務(wù)申報信息的處理效率大大提高,用戶體驗較好。另外,本發(fā)明實施例簡化了業(yè)務(wù)申報處理所需的申報材料,并通過電子化、無紙化操作,提高了業(yè)務(wù)信息的傳遞效率。
在上述實施例中,業(yè)務(wù)申報信息的申報結(jié)果包括:申報通過、人工審批和申報拒絕。
確定模塊704可以包括:第一確定子模塊、第二確定子模塊和第三確定子模塊。其中:
第一確定子模塊,用于當(dāng)業(yè)務(wù)申報信息的評分值大于第一預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為所述申報通過。
第二確定子模塊,用于當(dāng)業(yè)務(wù)申報信息的評分值大于或等于第二預(yù)設(shè)值,且小于或等于第一預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為人工審批。
第三確定子模塊,用于當(dāng)業(yè)務(wù)申報信息的評分值小于第二預(yù)設(shè)值時,確定業(yè)務(wù)申報信息的申報結(jié)果為申報拒絕。
在一種可能的實現(xiàn)方式中,上述實施例中的處理模塊705可以包括:第一處理子模塊、第二處理子模塊和第三處理子模塊。其中:
第一處理子模塊,用于當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報通過時,基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于初步審核信息和所述業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見。
第二處理子模塊,用于當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為人工審批時,基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對業(yè)務(wù)申報書發(fā)起人工審批請求。
第三處理子模塊,用于當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報拒絕時,將業(yè)務(wù)申報請求掛起,以對業(yè)務(wù)申報信息重新審核。
在另一種可能的實現(xiàn)方式中,上述實施例中的處理模塊705包括:第四處理子模塊、第五處理子模塊和第六處理子模塊。
所述第四處理子模塊,用于當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報通過時,如果第一預(yù)設(shè)時段內(nèi)接收到針對業(yè)務(wù)申報信息的選取指令,則基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并基于初步審核信息和所述業(yè)務(wù)申報信息的申報結(jié)果生成業(yè)務(wù)審批意見,否則,對業(yè)務(wù)申報信息發(fā)起人工審批請求。
所述第五處理子模塊,用于當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為人工審批時,基于業(yè)務(wù)申報信息生成業(yè)務(wù)申報書,并對業(yè)務(wù)申報信息發(fā)起人工審批請求。
所述第六處理子模塊,用于當(dāng)業(yè)務(wù)申報信息的申報結(jié)果為申報拒絕時,如果第二預(yù)設(shè)時段內(nèi)接收到針對業(yè)務(wù)申報信息的重評指令,則對業(yè)務(wù)申報信息發(fā)起人工審批請求,否則拒絕業(yè)務(wù)申報請求。
上述實施例提供的數(shù)據(jù)處理裝置還可以包括:評分卡模型建立模塊。
評分卡模型建立模塊可以包括:數(shù)據(jù)選取子模塊、數(shù)據(jù)清洗子模塊、數(shù)據(jù)抽取子模塊、變量獲取子模塊和模型確定子模塊。其中:
數(shù)據(jù)選取模塊,用于獲取滿足預(yù)設(shè)條件的原始樣本數(shù)據(jù)。
數(shù)據(jù)清洗模塊,用于按預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對原始樣本數(shù)據(jù)進(jìn)行清洗,獲得目標(biāo)樣本數(shù)據(jù)。
數(shù)據(jù)抽取模塊,用于從目標(biāo)樣本數(shù)據(jù)中按預(yù)設(shè)的數(shù)據(jù)抽取原則抽取用于構(gòu)建所述評分卡模型的開發(fā)樣本集和驗證樣本集。
變量獲取模塊,從目標(biāo)樣本數(shù)據(jù)中獲取業(yè)務(wù)變量,并通過Logistic回歸方法按預(yù)設(shè)的選取規(guī)則從業(yè)務(wù)變量中選取目標(biāo)變量。
模型確定模塊,用于基于開發(fā)樣本集、驗證樣本集和目標(biāo)變量確定評分卡模型。
本說明書中各個實施例采用遞進(jìn)的方式描述,每個實施例重點(diǎn)說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的方法、裝置和設(shè)備,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些通信接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。
所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。