本發(fā)明涉及教育考試錄取預(yù)測(cè)的技術(shù)領(lǐng)域,尤其涉及一種基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法。
背景技術(shù):
目前中考志愿填報(bào)通常會(huì)出現(xiàn):志愿填報(bào)扎堆;自身水平預(yù)判失誤;志愿填報(bào)梯度不合理等情況。中考考生如何選擇一所理想的學(xué)校,志愿填報(bào)尤為關(guān)鍵。隨著互聯(lián)網(wǎng)的普及,廣大中考考生及家長(zhǎng)迫切需要一套完整的、具有延續(xù)性的數(shù)據(jù)來(lái)作為中考志愿填報(bào)的參考依據(jù)。本發(fā)明旨在整合歷年中考投檔數(shù)據(jù),通過(guò)完整的數(shù)據(jù)分析給廣大考生及家長(zhǎng)提供有價(jià)值的志愿填報(bào)參考信息。
技術(shù)實(shí)現(xiàn)要素:
基于以上現(xiàn)有技術(shù)的不足,本發(fā)明所解決的技術(shù)問(wèn)題在于提供一種基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法能有效的通過(guò)完整的數(shù)據(jù)分析給廣大考生及家長(zhǎng)提供有價(jià)值的志愿填報(bào)參考信息。
為了解決上述技術(shù)問(wèn)題,本發(fā)明提供一種基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法,其特征在于,包括如下步驟:
A、類目管理:收集不同時(shí)間和地區(qū)的各個(gè)學(xué)校、學(xué)校劃分、招生種類、招生區(qū)域、批次設(shè)置、志愿設(shè)置內(nèi)容,并檢查數(shù)據(jù)完整性;
B、數(shù)據(jù)采集:采集年份、學(xué)校編碼、分?jǐn)?shù)線、錄取名次、錄取人數(shù)、招生區(qū)域、招生種類、招生批次、招生類型的數(shù)據(jù),并檢查數(shù)據(jù),要求數(shù)據(jù)沒(méi)有重復(fù);
C、數(shù)據(jù)預(yù)處理:對(duì)步驟B采集的數(shù)據(jù),進(jìn)行清洗、篩選、集成、變換操作;
D、系統(tǒng)建模:建立預(yù)測(cè)志愿填報(bào)及錄取結(jié)果的模型;
E、數(shù)據(jù)可視化:強(qiáng)調(diào)數(shù)據(jù)的顯示技術(shù),用以呈現(xiàn)給用戶清晰、直觀的數(shù)據(jù);進(jìn)行可視化配置和統(tǒng)計(jì)分析配置;根據(jù)統(tǒng)計(jì)配置查詢組織數(shù)據(jù),根據(jù)可視化配置呈現(xiàn)數(shù)據(jù)結(jié)果;
F、統(tǒng)計(jì)分析:將用戶選擇,年份或?qū)W校進(jìn)行統(tǒng)計(jì)分析配置,采用數(shù)據(jù)庫(kù)統(tǒng)計(jì)結(jié)合程序統(tǒng)計(jì)技術(shù),對(duì)某年全部學(xué)校錄取情況進(jìn)行統(tǒng)計(jì)分析,或者將某個(gè)學(xué)校各個(gè)年份錄取情況進(jìn)行統(tǒng)計(jì)分析;如果用戶沒(méi)有選擇,則將系統(tǒng)所能統(tǒng)計(jì)的全部數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析后顯示;
G、預(yù)測(cè)分析:根據(jù)當(dāng)年模擬考試成績(jī)或用戶的考試成績(jī),預(yù)測(cè)出符合條件的報(bào)考學(xué)校。
作為上述技術(shù)方案的優(yōu)選實(shí)施方式,本發(fā)明實(shí)施例提供的基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法進(jìn)一步包括下列技術(shù)特征的部分或全部:
作為上述技術(shù)方案的改進(jìn),在本發(fā)明的一個(gè)實(shí)施例中,所述步驟C數(shù)據(jù)預(yù)處理具體為,設(shè)定預(yù)處理規(guī)則、執(zhí)行預(yù)處理以及預(yù)處理后數(shù)據(jù)分析和評(píng)估。
作為上述技術(shù)方案的改進(jìn),在本發(fā)明的一個(gè)實(shí)施例中,所述步驟D還包括通過(guò)影響因子修正模型以及根據(jù)模型和用戶選擇產(chǎn)生相應(yīng)的變化。
作為上述技術(shù)方案的改進(jìn),在本發(fā)明的一個(gè)實(shí)施例中,所述步驟G具體為,用戶選擇所在地區(qū)、錄取批次、期望錄取學(xué)校,點(diǎn)擊查詢;系統(tǒng)根據(jù)用戶選擇和系統(tǒng)分析預(yù)測(cè)模型,對(duì)用戶的期望進(jìn)行反饋;系統(tǒng)反饋回的信息主要有期望學(xué)校的相關(guān)統(tǒng)計(jì)信息,并預(yù)測(cè)用戶被錄取的可能性;如用戶未填些期望學(xué)校,則將所有符合條件的學(xué)校一一列出,并預(yù)測(cè)用戶被錄取的可能性。
與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案具有如下有益效果:基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法能有效的通過(guò)完整的數(shù)據(jù)分析給廣大考生及家長(zhǎng)提供有價(jià)值的志愿填報(bào)參考信息。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下結(jié)合優(yōu)選實(shí)施例,詳細(xì)說(shuō)明如下。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例的附圖作簡(jiǎn)單地介紹。
圖1是本發(fā)明優(yōu)選實(shí)施例的基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法的系統(tǒng)體系結(jié)構(gòu)方案圖。
具體實(shí)施方式
下面詳細(xì)說(shuō)明本發(fā)明的具體實(shí)施方式,其作為本說(shuō)明書(shū)的一部分,通過(guò)實(shí)施例來(lái)說(shuō)明本發(fā)明的原理,本發(fā)明的其他方面、特征及其優(yōu)點(diǎn)通過(guò)該詳細(xì)說(shuō)明將會(huì)變得一目了然。
如圖1所示,為本發(fā)明優(yōu)選實(shí)施例基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法的結(jié)構(gòu)示意圖,本發(fā)明基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法,其特征在于,包括如下步驟:
A、類目管理:根據(jù)模板導(dǎo)入歷年中考投檔數(shù)據(jù)中本系統(tǒng)基礎(chǔ)數(shù)據(jù)維護(hù)需要的內(nèi)容。收集不同時(shí)間和地區(qū)的各個(gè)學(xué)校、學(xué)校劃分、招生種類、招生區(qū)域、批次設(shè)置、志愿設(shè)置內(nèi)容,導(dǎo)出基礎(chǔ)數(shù)據(jù)導(dǎo)入模板,按要求填寫(xiě)完畢相關(guān)內(nèi)容,提交維護(hù)數(shù)據(jù),提交入庫(kù)時(shí),程序需要檢查數(shù)據(jù)完整性約束;
B、數(shù)據(jù)采集:當(dāng)系統(tǒng)基礎(chǔ)數(shù)據(jù)維護(hù)完成后,下載要維護(hù)的數(shù)據(jù)采集模板,模板導(dǎo)入或單條添加采集年份、學(xué)校編碼、分?jǐn)?shù)線、錄取名次、錄取人數(shù)、招生區(qū)域、招生種類、招生批次、招生類型的數(shù)據(jù),并檢查數(shù)據(jù),提交時(shí)檢查必填項(xiàng):年份、學(xué)校編碼、招生區(qū)域、招生種類、招生批次、分?jǐn)?shù)線(分?jǐn)?shù)、等級(jí))不允許重復(fù);
C、數(shù)據(jù)預(yù)處理:對(duì)步驟B采集的數(shù)據(jù),進(jìn)行清洗、篩選、集成、變換操作;所述步驟C數(shù)據(jù)預(yù)處理具體為,設(shè)定預(yù)處理規(guī)則(比如數(shù)據(jù)轉(zhuǎn)換規(guī)則:是否將等級(jí)轉(zhuǎn)換為權(quán)值)、執(zhí)行預(yù)處理以及預(yù)處理后數(shù)據(jù)分析和評(píng)估。
D、系統(tǒng)建模:建立預(yù)測(cè)志愿填報(bào)及錄取結(jié)果的模型;基礎(chǔ)數(shù)據(jù)完備、影響因子分析正確找出。所述步驟D還包括通過(guò)影響因子修正模型以及根據(jù)模型和用戶選擇產(chǎn)生相應(yīng)的變化。
E、數(shù)據(jù)可視化:強(qiáng)調(diào)數(shù)據(jù)的顯示技術(shù),用以呈現(xiàn)給用戶清晰、直觀的數(shù)據(jù);進(jìn)行可視化配置和統(tǒng)計(jì)分析配置;根據(jù)統(tǒng)計(jì)配置查詢組織數(shù)據(jù),根據(jù)可視化配置呈現(xiàn)數(shù)據(jù)結(jié)果;數(shù)據(jù)可視化技術(shù)涉及前臺(tái)和后臺(tái)多方面的,這個(gè)業(yè)務(wù)的工作量較大。
F、統(tǒng)計(jì)分析:將用戶選擇,年份或?qū)W校進(jìn)行統(tǒng)計(jì)分析配置,采用數(shù)據(jù)庫(kù)統(tǒng)計(jì)結(jié)合程序統(tǒng)計(jì)技術(shù),對(duì)某年全部學(xué)校錄取情況進(jìn)行統(tǒng)計(jì)分析,或者將某個(gè)學(xué)校各個(gè)年份錄取情況進(jìn)行統(tǒng)計(jì)分析;如果用戶沒(méi)有選擇,則將系統(tǒng)所能統(tǒng)計(jì)的全部數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析后顯示;
G、預(yù)測(cè)分析:根據(jù)當(dāng)年模擬考試成績(jī)或用戶的考試成績(jī),預(yù)測(cè)出符合條件的報(bào)考學(xué)校。所述步驟G具體為,用戶選擇所在地區(qū)、錄取批次、期望錄取學(xué)校,點(diǎn)擊查詢;系統(tǒng)根據(jù)用戶選擇和系統(tǒng)分析預(yù)測(cè)模型,對(duì)用戶的期望進(jìn)行反饋;系統(tǒng)反饋回的信息主要有期望學(xué)校的相關(guān)統(tǒng)計(jì)信息,并預(yù)測(cè)用戶被錄取的可能性;如用戶未填些期望學(xué)校,則將所有符合條件的學(xué)校一一列出,并預(yù)測(cè)用戶被錄取的可能性。
為了實(shí)現(xiàn)本發(fā)明的預(yù)測(cè),基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)系統(tǒng)核心業(yè)務(wù)包括:數(shù)據(jù)可視化、數(shù)據(jù)統(tǒng)計(jì)報(bào)表、預(yù)測(cè)分析功能。其中,數(shù)據(jù)可視化主要實(shí)現(xiàn)個(gè)性、直觀、可視的展示數(shù)據(jù),讓用戶可以通過(guò)多個(gè)維度來(lái)觀察和審視數(shù)據(jù)。數(shù)據(jù)統(tǒng)計(jì)報(bào)表著重?cái)?shù)據(jù)格式化、面向統(tǒng)計(jì)的處理。而預(yù)測(cè)分析則根據(jù)系統(tǒng)自動(dòng)建立的預(yù)測(cè)模型,分析預(yù)測(cè),為用戶做出決策提供幫助。
為了實(shí)現(xiàn)核心業(yè)務(wù),系統(tǒng)設(shè)計(jì)了支撐模塊:數(shù)據(jù)采集模塊、類目管理模塊、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)建模學(xué)習(xí)模塊。
如圖1所示,系統(tǒng)還包含一個(gè)與外圍系統(tǒng)交互的接口,接口獲取外圍系統(tǒng)請(qǐng)求,將分析統(tǒng)計(jì)結(jié)果返回給外圍系統(tǒng),如微信應(yīng)用。
針對(duì)步驟D系統(tǒng)建模,下面對(duì)錄取預(yù)測(cè)分析模型介紹。
正態(tài)分布:
正態(tài)分布(Normal distribution)又名高斯分布(Gaussian distribution),是一個(gè)在數(shù)學(xué)、物理及工程等領(lǐng)域都非常重要的概率分布,在統(tǒng)計(jì)學(xué)的許多方面有著重大的影響力。
若隨機(jī)變量X服從一個(gè)數(shù)學(xué)期望為μ、標(biāo)準(zhǔn)方差為σ2的高斯分布,記為:
X~N(μ,σ2),
則其概率密度函數(shù)為
正態(tài)分布的期望值μ決定了其位置,其標(biāo)準(zhǔn)差σ決定了分布的幅度。因其曲線呈鐘形,因此人們又經(jīng)常稱之為鐘形曲線。我們通常所說(shuō)的標(biāo)準(zhǔn)正態(tài)分布是μ=0,σ=1的正態(tài)分布。
方差(variance):
方差在概率論和統(tǒng)計(jì)方差衡量隨機(jī)變量或一組數(shù)據(jù)是離散程度的度量。概率論中方差用來(lái)度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的偏離程度。統(tǒng)計(jì)中的方差(樣本方差)是各個(gè)數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù)。在許多實(shí)際問(wèn)題中,研究方差即偏離程度有著重要意義。
加權(quán)平均:
標(biāo)準(zhǔn)分:
標(biāo)準(zhǔn)分就是原始分與平均分的差,除以標(biāo)準(zhǔn)差的商。計(jì)算方式:
設(shè)原始成績(jī)構(gòu)成集合{x1,x2Λ,xn},平均分標(biāo)準(zhǔn)差那么對(duì)任意一個(gè)原始分xi,稱為xi的標(biāo)準(zhǔn)分。
建模與算法設(shè)計(jì)
志愿預(yù)測(cè)模型是建立在對(duì)大量歷史數(shù)據(jù)的采集、整理和分析的基礎(chǔ)上的,其中最關(guān)鍵的數(shù)據(jù)包括考生成績(jī)、錄取信息、志愿信息、招生計(jì)劃。
對(duì)考生往年成績(jī),采用一定技術(shù)對(duì)其進(jìn)行排位,可以使用原始分排位或者采用將原始分轉(zhuǎn)換為標(biāo)準(zhǔn)分后排位;排位后我們可以根據(jù)具體需要,設(shè)定相應(yīng)的維度來(lái)進(jìn)行分析統(tǒng)計(jì),比如以學(xué)校為維度,統(tǒng)計(jì)某個(gè)學(xué)校某個(gè)批次某個(gè)輪次錄取排位情況。
對(duì)錄取信息、志愿信息和招生計(jì)劃,主要用來(lái)輔助修正預(yù)測(cè)的結(jié)果。
初步設(shè)計(jì)的兩種策略有名次號(hào)比對(duì)和標(biāo)準(zhǔn)分+分?jǐn)?shù)線比對(duì)兩種,詳述如下。
名次號(hào)比對(duì)
步驟:
1、將往年成績(jī)和今年模擬成績(jī)?nèi)堪赐稒n總分排位。
2、根據(jù)高中學(xué)校往年的招生計(jì)劃和實(shí)際填報(bào)人數(shù)、實(shí)際錄取人數(shù),預(yù)測(cè)今年的招生計(jì)劃、預(yù)計(jì)填報(bào)人數(shù)、預(yù)計(jì)錄取人數(shù)。
3、循環(huán)比對(duì)今年與過(guò)去每年的排位,如果分?jǐn)?shù)排位處于學(xué)校往年排位區(qū)間,則計(jì)算排位所處的百分占比。
4、將所有比對(duì)信息呈現(xiàn)給用戶。
標(biāo)準(zhǔn)分+分?jǐn)?shù)線比對(duì)使用標(biāo)準(zhǔn)分的考量。
標(biāo)準(zhǔn)分介紹見(jiàn)上述。使用標(biāo)準(zhǔn),分主要基于以下幾點(diǎn)考慮。
標(biāo)準(zhǔn)分是一個(gè)排位信息,使用標(biāo)準(zhǔn)分不同年份之間的成績(jī)可以近似為使用同一個(gè)量度,也就是說(shuō),不同年度的成績(jī)有了可比性。
我們可以通過(guò)對(duì)標(biāo)準(zhǔn)分進(jìn)行各種運(yùn)算,進(jìn)而得到所期望的數(shù)據(jù),比如通過(guò)對(duì)往年投檔線標(biāo)準(zhǔn)分就平均數(shù)近似推測(cè)今年的投檔線。因此比較不同年份的成績(jī)也成為了可能。
步驟:
1、將成績(jī)換算成標(biāo)準(zhǔn)分。
2、根據(jù)往年控制線標(biāo)準(zhǔn)分推測(cè)今年的控制線標(biāo)準(zhǔn)分。
3、根據(jù)往年招生計(jì)劃、志愿情況,推測(cè)今年招生計(jì)劃和志愿情況。
4、對(duì)預(yù)測(cè)的控制線進(jìn)行矯正,例如,如果預(yù)計(jì)今年招生人數(shù)大幅增加,則適當(dāng)降低控制線;如果今年填報(bào)某校的人數(shù)增加很多,則適當(dāng)調(diào)高控制線。
5、將分析結(jié)果呈現(xiàn)給用戶(用戶看到的是原始數(shù)據(jù),非轉(zhuǎn)換后的標(biāo)準(zhǔn)數(shù)據(jù))。
技術(shù)方案
采用的關(guān)鍵技術(shù)ORACLE+JAVA+SSH(SSI)。
系統(tǒng)主要特點(diǎn)
主要技術(shù)特點(diǎn):可分布式服務(wù),實(shí)現(xiàn)多層技術(shù)。
業(yè)務(wù)特點(diǎn):具有很強(qiáng)的擴(kuò)展性。
本發(fā)明的基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法設(shè)計(jì)簡(jiǎn)單,設(shè)計(jì)合理,該基于大數(shù)據(jù)的考試錄取智能預(yù)測(cè)方法能有效的通過(guò)完整的數(shù)據(jù)分析給廣大考生及家長(zhǎng)提供有價(jià)值的志愿填報(bào)參考信息。
以上所述是本發(fā)明的優(yōu)選實(shí)施方式而已,當(dāng)然不能以此來(lái)限定本發(fā)明之權(quán)利范圍,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和變動(dòng),這些改進(jìn)和變動(dòng)也視為本發(fā)明的保護(hù)范圍。