用于數(shù)據(jù)挖掘的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本公開總體上涉及數(shù)據(jù)處理,更具體地,涉及用于數(shù)據(jù)挖掘的方法和裝置。
【背景技術(shù)】
[0002]隨著科學(xué)技術(shù)、尤其是網(wǎng)絡(luò)技術(shù)的發(fā)展,當(dāng)今生活中產(chǎn)生的各種數(shù)據(jù)以驚人地速度增長。人們已經(jīng)越來越多地意識到這些數(shù)據(jù)對企業(yè)的重要性,隨之而來地開展了數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)安全等方面的研究。
[0003]數(shù)據(jù)可以存在于各行各業(yè),并且具有不同的形式。例如,在用戶從提供商購買了產(chǎn)品之后,在每個(gè)產(chǎn)品的生命周期期間將會產(chǎn)生大量有用的數(shù)據(jù)。同時(shí),在更新或支持每個(gè)產(chǎn)品的生命周期期間,提供商也會產(chǎn)生大量有用的數(shù)據(jù)和信息。注意,此處的術(shù)語“產(chǎn)品”不僅指具體的物理產(chǎn)品,例如設(shè)備、裝置、系統(tǒng)等,也可以指虛擬的產(chǎn)品,例如計(jì)算機(jī)程序產(chǎn)品或應(yīng)用,還可以指所提供的服務(wù),例如計(jì)算服務(wù)、培訓(xùn)課程等。
[0004]例如,用戶可能購買了存儲產(chǎn)品,那么至少將產(chǎn)生如下數(shù)據(jù):
[0005]I)銷售或合同數(shù)據(jù)。該數(shù)據(jù)例如可以涉及所購買產(chǎn)品的型號、序列號和配置等。該數(shù)據(jù)還可以包括關(guān)于該產(chǎn)品的所購買的支持服務(wù)信息,諸如服務(wù)級別和有效期等。
[0006]2)產(chǎn)品性能和使用數(shù)據(jù)。該數(shù)據(jù)可以包含用戶在使用該產(chǎn)品期間產(chǎn)生的關(guān)于產(chǎn)品的性能和使用情況的數(shù)據(jù)。以存儲產(chǎn)品為例,該數(shù)據(jù)可以包括容量使用率、吞吐量信息,諸如每秒讀寫操作次數(shù)(1PS),或處理請求的響應(yīng)時(shí)間(Response Time),等等。
[0007]3)支持案例數(shù)據(jù)。例如,該數(shù)據(jù)可以涉及每個(gè)支持案例的癥狀、支持處理過程、支持案例的類別以及相應(yīng)的解決方案等。
[0008]4)教育服務(wù)數(shù)據(jù)。例如,該數(shù)據(jù)可以涉及用戶預(yù)定或已參加的培訓(xùn)課程,相關(guān)的產(chǎn)
ΡΠ -rf* -rf* ο
[0009]5)取決于具體產(chǎn)品,還可以存在其他數(shù)據(jù)。
[0010]另一方面,從例如存儲器提供商的角度,可以至少產(chǎn)生如下數(shù)據(jù):
[0011]I)產(chǎn)品供應(yīng)數(shù)據(jù)。該數(shù)據(jù)例如可以包括所供應(yīng)的各種產(chǎn)品的類別、型號和能力或功能等數(shù)據(jù)。
[0012]2)教育供應(yīng)數(shù)據(jù)。該數(shù)據(jù)例如可以包括關(guān)于所提供的教育培訓(xùn)課程的名稱、相關(guān)的產(chǎn)品和類別。此處的類別可以指技能類別或案例類別。
[0013]3)解決方案供應(yīng)數(shù)據(jù)。該數(shù)據(jù)例如可以包括解決方案的類別、相關(guān)產(chǎn)品和用途。
[0014]4)取決于具體產(chǎn)品,也可以存在其他數(shù)據(jù)。
[0015]這些數(shù)據(jù)通常分散在不同的系統(tǒng)中,例如分別存在于用戶的信息技術(shù)(IT)系統(tǒng)和提供商的IT系統(tǒng)中。而且,這些數(shù)據(jù)通常是孤立的,未經(jīng)良好整合、分析和利用。最后,現(xiàn)有技術(shù)中尚不存在以有意義的方式來呈現(xiàn)數(shù)據(jù)的方案。
[0016]因此,本領(lǐng)域中需要一種更為有效的挖掘數(shù)據(jù)價(jià)值的解決方案。
【發(fā)明內(nèi)容】
[0017]為了解決上述問題,本公開提出一種用于挖掘數(shù)據(jù)價(jià)值的方法和裝置。
[0018]在本公開的一個(gè)方面,提供一種用于數(shù)據(jù)挖掘的方法。該方法包括:獲取與產(chǎn)品相關(guān)的、來自至少一個(gè)數(shù)據(jù)源的數(shù)據(jù);對所述數(shù)據(jù)進(jìn)行預(yù)先處理以確定所述數(shù)據(jù)的至少一個(gè)屬性;至少部分基于所述至少一個(gè)屬性、針對與產(chǎn)品相關(guān)的特性來分析預(yù)先處理的數(shù)據(jù);以及基于與所述產(chǎn)品相關(guān)的特性關(guān)聯(lián)的預(yù)定規(guī)則,根據(jù)所述分析而生成事件,所述事件預(yù)測可能的用戶需求。
[0019]在本公開的另一方面,提供一種用于數(shù)據(jù)挖掘的裝置。該裝置包括:數(shù)據(jù)獲取模塊,配置用于獲取與產(chǎn)品相關(guān)的、來自至少一個(gè)數(shù)據(jù)源的數(shù)據(jù);數(shù)據(jù)預(yù)處理模塊,配置用于對所述數(shù)據(jù)進(jìn)行預(yù)先處理以確定所述數(shù)據(jù)的至少一個(gè)屬性;數(shù)據(jù)分析模塊,配置用于至少部分基于所述至少一個(gè)屬性、針對與所述產(chǎn)品相關(guān)的特性來分析預(yù)先處理的數(shù)據(jù),以及配置用于基于與所述產(chǎn)品相關(guān)的特性關(guān)聯(lián)的預(yù)定規(guī)則,根據(jù)所述分析而生成事件,所述事件預(yù)測可能的用戶需求。
[0020]通過下文描述將會理解,根據(jù)本公開的實(shí)施例,通過采集來自至少一個(gè)數(shù)據(jù)源的數(shù)據(jù)并對其進(jìn)行分析,根據(jù)分析而生成的相應(yīng)事件可以預(yù)測可能的用戶需求,從而挖掘出數(shù)據(jù)的價(jià)值。本公開的實(shí)施例所能實(shí)現(xiàn)的其他益處將通過下文描述而清楚。
【附圖說明】
[0021]通過參考附圖閱讀下文的詳細(xì)描述,本公開實(shí)施例的上述以及其他目的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例而非限制性的方式示出了本公開的若干實(shí)施例,其中:
[0022]圖1示出了根據(jù)本公開的一個(gè)示例實(shí)施例的示例性系統(tǒng)框圖;
[0023]圖2示出了根據(jù)本公開的一個(gè)示例實(shí)施例的用于數(shù)據(jù)挖掘的方法流程圖;
[0024]圖3示出了根據(jù)本公開的一個(gè)示例實(shí)施例的一個(gè)用例圖示;
[0025]圖4示出了根據(jù)本公開的一個(gè)示例實(shí)施例的另一用例圖示;
[0026]圖5示出了根據(jù)本公開的一個(gè)示例實(shí)施例的又一用例圖示;
[0027]圖6示出了根據(jù)本公開的一個(gè)實(shí)例實(shí)施例的再一用例圖示;以及
[0028]圖7示出了適于實(shí)現(xiàn)本公開的示例實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖。
[0029]在各個(gè)附圖中,相同或?qū)?yīng)的標(biāo)號表不相同或?qū)?yīng)的部分。
【具體實(shí)施方式】
[0030]下面將參考附圖中示出的若干示例實(shí)施例來描述本公開的原理。應(yīng)當(dāng)理解,描述這些實(shí)施例僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本公開,而并非以任何方式限制本公開的范圍。
[0031]如前所述,在生產(chǎn)生活中會產(chǎn)生大量各式各樣的數(shù)據(jù)。發(fā)明人通過仔細(xì)觀察這些數(shù)據(jù),可以找出一些共同但本質(zhì)的特征屬性:
[0032]I)時(shí)間。每種數(shù)據(jù)都是時(shí)間相關(guān)的,也即具有關(guān)聯(lián)的時(shí)間。例如,合同數(shù)據(jù)具有簽署日期、產(chǎn)品發(fā)貨日期以及服務(wù)有效/無效日期。性能和使用數(shù)據(jù)是基于時(shí)間的。支持案例數(shù)據(jù)具有案例發(fā)生時(shí)間和結(jié)束時(shí)間。培訓(xùn)課程具有開始日期和結(jié)束日期。產(chǎn)品具有發(fā)布日期、更新日期和服務(wù)結(jié)束日期。教育課程供應(yīng)具有可用日期。解決方案供應(yīng)數(shù)據(jù)具有發(fā)布或可用日期。
[0033]2)產(chǎn)品。所有數(shù)據(jù)將與一個(gè)或多個(gè)特定產(chǎn)品相關(guān),也即具有關(guān)聯(lián)的產(chǎn)品。這些數(shù)據(jù)還可以包含產(chǎn)品的型號、序列號和配置信息等。
[0034]3)用戶。所有數(shù)據(jù)會具有關(guān)聯(lián)的用戶,例如一些數(shù)據(jù)屬于某個(gè)特定用戶,而一些數(shù)據(jù)指示合適的用戶。
[0035]基于這些關(guān)聯(lián)的時(shí)間、關(guān)聯(lián)的產(chǎn)品和關(guān)聯(lián)的用戶,來自各種數(shù)據(jù)源的數(shù)據(jù)可以被連接或關(guān)聯(lián)起來進(jìn)行分析,并可視化地呈現(xiàn)給用戶,從而挖掘出數(shù)據(jù)的價(jià)值。
[0036]本公開的主要思路是:收集分散于不同數(shù)據(jù)源(例如用戶數(shù)據(jù)源或提供商數(shù)據(jù)源)的與產(chǎn)品相關(guān)的各種數(shù)據(jù)(例如,銷售數(shù)據(jù)、產(chǎn)品和性能數(shù)據(jù)、服務(wù)供應(yīng)數(shù)據(jù),等等),對這些數(shù)據(jù)進(jìn)行預(yù)先處理以基于上述至少一個(gè)公共的屬性(例如,時(shí)間、產(chǎn)品和用戶)而整合起來。針對與產(chǎn)品相關(guān)的特性,采用不同的分析方法來分析這些經(jīng)過預(yù)先處理的數(shù)據(jù),以及基于與產(chǎn)品相關(guān)的特性關(guān)聯(lián)的預(yù)定規(guī)則,根據(jù)上述分析而生成事件。事件可以預(yù)測可能的用戶需求。進(jìn)一步地,可以響應(yīng)于事件的生成而提供對應(yīng)的解決方案。更進(jìn)一步地,可以按時(shí)間軸方式可視化呈現(xiàn)經(jīng)過預(yù)先處理的數(shù)據(jù)、生成的事件和提供的解決方案中的至少一項(xiàng),以便于更直觀的理解。
[0037]下面參考圖1,其示出了根據(jù)本公開的一個(gè)示例實(shí)施例的示例性高級系統(tǒng)架構(gòu)框圖。
[0038]系統(tǒng)可以包括根據(jù)本文公開的實(shí)施例的數(shù)據(jù)挖掘平臺110以及與產(chǎn)品相關(guān)的至少一個(gè)數(shù)據(jù)源。作為示例,圖1示出了用戶數(shù)據(jù)源120和提供商數(shù)據(jù)源130。本領(lǐng)域技術(shù)人員可以理解,還可以存在更多或更少的數(shù)據(jù)源,以提供數(shù)據(jù)供數(shù)據(jù)挖掘平臺110使用。
[0039]用戶數(shù)據(jù)源120可以包括各種數(shù)據(jù),諸如支持案例數(shù)據(jù)121、銷售數(shù)據(jù)122、教育服務(wù)數(shù)據(jù)123、產(chǎn)品性能和使用數(shù)據(jù)124以及其他數(shù)據(jù)125。
[0040]提供商數(shù)據(jù)源130也可以包括各種數(shù)據(jù),諸如產(chǎn)品供應(yīng)數(shù)據(jù)131、教育供應(yīng)數(shù)據(jù)132、解決方案供應(yīng)數(shù)據(jù)133以及其他數(shù)據(jù)134。
[0041]這些數(shù)據(jù)源的數(shù)據(jù)可以基于各種事件的發(fā)生而生成。例如,在用戶數(shù)據(jù)源中,當(dāng)用戶購買了產(chǎn)品時(shí),可以生成相應(yīng)的銷售數(shù)據(jù)、教育服務(wù)數(shù)據(jù)。在用戶使用該產(chǎn)品期間,可以生成產(chǎn)品性能和使用數(shù)據(jù)、支持案例數(shù)據(jù),等等。
[0042]數(shù)據(jù)挖掘平臺110可以包括數(shù)據(jù)獲取模塊111、數(shù)據(jù)預(yù)處理模塊112、數(shù)據(jù)分析模塊113以及數(shù)據(jù)儲存庫114??蛇x地,數(shù)據(jù)挖掘平臺110還可以包括解決方案模塊115、數(shù)據(jù)可視化模塊116和數(shù)據(jù)索引模塊117。
[0043]數(shù)據(jù)獲取模塊111配置用于經(jīng)由數(shù)據(jù)連接從諸如用戶數(shù)據(jù)源120、提供商數(shù)據(jù)源130的至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)。在一些實(shí)施例中,數(shù)據(jù)獲取模塊111可以提供統(tǒng)一的應(yīng)用程序接口 API以允許各種數(shù)據(jù)源接入。在一些其他實(shí)施例中,數(shù)據(jù)獲取模塊111可以針對不同的數(shù)據(jù)源提供相應(yīng)的數(shù)據(jù)接口,以便訪問數(shù)據(jù)源中的數(shù)據(jù)。
[0044]數(shù)據(jù)連接可以基于預(yù)定安排(例如,周期性地或者響應(yīng)于數(shù)據(jù)的生成而實(shí)時(shí)地)或基于請求(例如,在數(shù)據(jù)挖掘平臺需要時(shí)),連續(xù)地或間歇地傳送各種數(shù)據(jù)。
[0045]數(shù)據(jù)預(yù)處理模塊112配置用于對數(shù)據(jù)獲取模塊