0027] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面所描述的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0028] 圖1是根據(jù)本發(fā)明實(shí)施例的生成數(shù)字人的方法的示意性流程圖。
[0029] 圖2是根據(jù)本發(fā)明另一實(shí)施例的生成數(shù)字人的方法的示意性流程圖。
[0030] 圖3是根據(jù)本發(fā)明實(shí)施例的生成數(shù)字人的系統(tǒng)的示意性框圖。
[0031] 圖4是根據(jù)本發(fā)明實(shí)施例的獲取模塊的示意性框圖。
[0032] 圖5是根據(jù)本發(fā)明另一實(shí)施例的生成數(shù)字人的系統(tǒng)的示意性框圖。
[0033] 圖6是根據(jù)本發(fā)明又一實(shí)施例的生成數(shù)字人的系統(tǒng)的示意性框圖。
[0034] 圖7是根據(jù)本發(fā)明又一實(shí)施例的生成數(shù)字人的系統(tǒng)的示意性框圖。
【具體實(shí)施方式】
[0035] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是全部實(shí)施例?;诒景l(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí) 施例,都應(yīng)屬于本發(fā)明保護(hù)的范圍。
[0036] 圖1示出了根據(jù)本發(fā)明實(shí)施例的生成數(shù)字人的方法100的示意性流程圖,該方法 100可以由生成數(shù)字人的系統(tǒng)執(zhí)行。如圖1所示,方法100包括:
[0037] S110,定義數(shù)字人模型,該數(shù)字人模型包括多個(gè)維度的用戶畫(huà)像模型;
[0038] S120,獲取特定用戶的來(lái)自多個(gè)數(shù)據(jù)源的多個(gè)維度的數(shù)據(jù);
[0039] S130,基于數(shù)字人模型所包括的多個(gè)維度的用戶畫(huà)像模型,對(duì)特定用戶的多個(gè)維 度的數(shù)據(jù)進(jìn)行處理,生成對(duì)應(yīng)于特定用戶的多個(gè)維度的用戶畫(huà)像,該特定用戶的多個(gè)維度 的用戶畫(huà)像組成了與特定用戶對(duì)應(yīng)的數(shù)字人。
[0040] 因此,本發(fā)明實(shí)施例的生成數(shù)字人的方法,通過(guò)獲取來(lái)自多個(gè)數(shù)據(jù)源的用戶的多 個(gè)維度的數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行處理,基于數(shù)字人模型,生成包含多個(gè)維度的用戶畫(huà)像的數(shù)字 人。
[0041] 應(yīng)理解,一個(gè)維度的用戶畫(huà)像是對(duì)用戶于物理世界中在該一維度特征的展現(xiàn),是 在深刻理解真實(shí)數(shù)據(jù)的基礎(chǔ)上得出的在該一維度的一個(gè)虛擬畫(huà)像。多個(gè)維度的用戶畫(huà)像組 合在一起,就可以組成一個(gè)與物理世界中的用戶對(duì)應(yīng)的數(shù)字人,該數(shù)字人可以從多個(gè)維度 刻畫(huà)物理世界中的用戶的特征。一個(gè)維度的用戶畫(huà)像是根據(jù)對(duì)應(yīng)的維度的用戶畫(huà)像模型, 通過(guò)對(duì)數(shù)據(jù)進(jìn)行挖掘后生成的。上述維度可以涉及形象、健康、行為習(xí)慣、社交模式、消費(fèi)習(xí) 慣、興趣愛(ài)好等,還可以包括與物理世界個(gè)人對(duì)應(yīng)的其它多個(gè)維度,本發(fā)明實(shí)施例并不僅限 于此。
[0042] 在S110中,系統(tǒng)定義數(shù)字人模型,該數(shù)字人模型包括多個(gè)維度的用戶畫(huà)像模型。 其中,某一維度的用戶畫(huà)像模型用于表征從相關(guān)采集數(shù)據(jù)中抽取出的用戶在該維度的特征 和知識(shí)類別。而包含多個(gè)維度用戶畫(huà)像模型的數(shù)字人模型,則基于可獲取的多個(gè)維度的數(shù) 據(jù)源,從多個(gè)不同的維度定義了一個(gè)立體的數(shù)字人。數(shù)字人模型中所包含的不同維度的用 戶畫(huà)像模型的確定,至少應(yīng)考慮如下幾個(gè)要素:可使用的數(shù)據(jù)源及能夠挖掘到的特征類型、 系統(tǒng)的基本需求和第三方客戶新定義的可更新的數(shù)字人特征需求等。
[0043] 具體而言,系統(tǒng)可以設(shè)置一個(gè)畫(huà)像模型配置庫(kù),以維護(hù)生成數(shù)字人所需要的數(shù)字 人模型中包含的多個(gè)維度的用戶畫(huà)像模型。這些用戶畫(huà)像模型可以通過(guò)系統(tǒng)預(yù)定義并周期 性地更新,進(jìn)行增加、刪除或修改。例如,平臺(tái)中維護(hù)的數(shù)字人模型可以對(duì)應(yīng)定義如下一些 用戶畫(huà)像模型:用戶形象維度畫(huà)像模型、用戶健康維度畫(huà)像模型、用戶行為習(xí)慣維度畫(huà)像模 型、用戶社交模式維度畫(huà)像模型、用戶消費(fèi)習(xí)慣維度畫(huà)像模型和用戶興趣愛(ài)好維度畫(huà)像模 型等,但本發(fā)明實(shí)施例并不僅限于此。
[0044] 應(yīng)理解,系統(tǒng)可以根據(jù)用戶的屬性,為不同屬性的用戶群體確定包括不同用戶畫(huà) 像模型的數(shù)字人模型。本發(fā)明實(shí)施例中,用戶的屬性可以用來(lái)刻畫(huà)用戶信息的類型。以用 戶職業(yè)為例,對(duì)于醫(yī)生群體和教師群體,為這兩個(gè)群體確定的用戶畫(huà)像模型,除了包含所有 用戶通用的用戶形象維度畫(huà)像模型、用戶健康維度畫(huà)像模型等用戶畫(huà)像模型,醫(yī)生群體還 可能包括與其職業(yè)為醫(yī)生這一屬性對(duì)應(yīng)的相應(yīng)維度的用戶畫(huà)像模型;教師群體還可能包括 與其職業(yè)為教師這一屬性對(duì)應(yīng)的相應(yīng)維度的用戶畫(huà)像模型,但本發(fā)明實(shí)施例并不限于此。
[0045] 可選地,作為一個(gè)實(shí)施例,系統(tǒng)還可以通過(guò)接收客戶端的定制需求,創(chuàng)建或修改 對(duì)應(yīng)的用戶畫(huà)像模型。例如,本系統(tǒng)可以包括數(shù)字人應(yīng)用程序編程接口(Application ProgrammingInterface,API),以完成系統(tǒng)與第三方客戶端的交互。當(dāng)客戶端對(duì)某一特定 維度的用戶畫(huà)像有需求,而當(dāng)前系統(tǒng)的畫(huà)像模型配置庫(kù)中沒(méi)有相對(duì)應(yīng)的用戶畫(huà)像模型時(shí), 客戶端可以通過(guò)API將定制需求反饋給系統(tǒng),以便于系統(tǒng)創(chuàng)建新的用戶畫(huà)像模型。相應(yīng)地, 方法100還可以包括:
[0046] 根據(jù)客戶端的需求,創(chuàng)建與該需求對(duì)應(yīng)的用于生成用戶畫(huà)像的用戶畫(huà)像模型。
[0047] 在S120中,獲取特定用戶的來(lái)自多個(gè)數(shù)據(jù)源的多個(gè)維度的數(shù)據(jù)。應(yīng)理解,物理世 界的個(gè)人在數(shù)字世界環(huán)境中各種數(shù)據(jù)平臺(tái)產(chǎn)生的數(shù)據(jù),經(jīng)過(guò)挖掘可以綜合刻畫(huà)對(duì)應(yīng)物理世 界個(gè)人的各維度特征。用戶的數(shù)據(jù)可以是來(lái)自多個(gè)數(shù)據(jù)源的,例如,可以來(lái)自手機(jī)業(yè)務(wù)平 臺(tái),QQ、微信、來(lái)往等實(shí)時(shí)聊天平臺(tái),微博、論壇、人人網(wǎng)等社交平臺(tái),淘寶、當(dāng)當(dāng)、京東等購(gòu)物 平臺(tái),此外,數(shù)據(jù)還可以包括其他用戶在通信時(shí)產(chǎn)生的與該用戶相關(guān)的數(shù)據(jù),本發(fā)明實(shí)施例 對(duì)此不做限定。
[0048] 從多種數(shù)據(jù)源收集的數(shù)據(jù)可以是多個(gè)維度的,例如用戶的形象維度、健康維度、行 為習(xí)慣維度、社交維度、消費(fèi)習(xí)慣維度、興趣愛(ài)好維度等,本發(fā)明實(shí)施例對(duì)此不做限定。
[0049] 系統(tǒng)可以通過(guò)終端、通信網(wǎng)元和數(shù)據(jù)收集代理中的至少一種設(shè)備,獲取多個(gè)用戶 的來(lái)自多個(gè)數(shù)據(jù)源的多個(gè)維度的數(shù)據(jù)。
[0050] 可選地,作為一個(gè)實(shí)施例,可以通過(guò)終端獲取各個(gè)用戶的數(shù)據(jù)。通過(guò)智能終端、車 載終端等終端以及終端上的各類傳感器裝置,如GPS、運(yùn)動(dòng)傳感器、光線傳感器、麥克風(fēng)、攝 像頭等,可以采集獲取用戶所處的環(huán)境信息和用戶的行為等信息。通過(guò)終端上運(yùn)行的各類 應(yīng)用軟件的運(yùn)行數(shù)據(jù)及記錄的應(yīng)用軌跡,如社交軟件、運(yùn)動(dòng)監(jiān)測(cè)軟件、健康監(jiān)控軟件等獲取 用戶在某個(gè)領(lǐng)域上的軌跡數(shù)據(jù)。此外,終端還可能記錄用戶產(chǎn)生的各類自媒體內(nèi)容,如照 片、音視頻媒體、文本日記等。終端可以周期或不定期地向生成數(shù)字人的系統(tǒng)上報(bào)用戶的相 關(guān)數(shù)據(jù),也可以由生成數(shù)字人的系統(tǒng)周期或不定期地從終端獲取用戶的相關(guān)數(shù)據(jù)。
[0051] 可選地,作為另一個(gè)實(shí)施例,可以通過(guò)通信網(wǎng)元獲取各個(gè)用戶的數(shù)據(jù)。例如, 無(wú)線網(wǎng)絡(luò)控制器(Radio Network Controller, RNC)、歸屬位置寄存器(Home Location Register,HLR)等通信網(wǎng)元上包含大量的用戶在通信時(shí)產(chǎn)生的相關(guān)數(shù)據(jù),生成數(shù)字人的系 統(tǒng)可以從該通信網(wǎng)元捕獲多個(gè)用戶的相關(guān)數(shù)據(jù)。
[0052] 可選地,作為另一個(gè)實(shí)施例,可以通過(guò)數(shù)據(jù)收集代理獲取多個(gè)用戶的數(shù)據(jù)。具體 地,數(shù)據(jù)收集代理通過(guò)網(wǎng)絡(luò)爬蟲(chóng)方式,捕獲用戶在網(wǎng)絡(luò)上的言論、上網(wǎng)痕跡等。例如捕獲用 戶在社交網(wǎng)絡(luò)、網(wǎng)購(gòu)平臺(tái)、網(wǎng)絡(luò)搜索平臺(tái)、網(wǎng)絡(luò)服務(wù)平臺(tái)等留下的記錄日志。再如,捕獲通過(guò) 各種渠道發(fā)布的與該用戶相關(guān)的信息,如該用戶社交圈內(nèi)好友的社交媒體內(nèi)容、日志中與 用戶相關(guān)的信息等。數(shù)據(jù)收集代理可以周期或不定期地向生成數(shù)字人的系統(tǒng)上報(bào)所捕獲的 內(nèi)容,也可以由生成數(shù)字人的系統(tǒng)周期或不定期地從數(shù)據(jù)收集代理獲取用戶的相關(guān)數(shù)據(jù)。
[0053] -般地,通過(guò)終端可以獲取信息較密集、范圍較集中的用戶數(shù)據(jù),通過(guò)通信網(wǎng)元、 數(shù)據(jù)收集代理可以獲取較分散的用戶數(shù)據(jù)。此外,還可以通過(guò)其它手段或方式獲取用戶的 數(shù)據(jù),本發(fā)明實(shí)施例對(duì)此不作限定。
[0054] 應(yīng)理解,系統(tǒng)可以通過(guò)自身的設(shè)備或模塊獲取數(shù)據(jù),也可以通過(guò)接口接收系統(tǒng)以 外的設(shè)備或模塊收集的數(shù)據(jù),本發(fā)明實(shí)施例對(duì)此不作限定。
[0055] 還應(yīng)理解,通過(guò)上述方法從多種數(shù)據(jù)源獲取的大量數(shù)據(jù)可以是歸屬于多個(gè)用戶 的。在該種情況下,需要確定這些數(shù)據(jù)歸屬于哪個(gè)用戶。相應(yīng)地,方法1〇〇中從多個(gè)數(shù)據(jù)源 獲取特定用戶的多個(gè)維度的數(shù)據(jù),包括:
[0056] 獲取多個(gè)用戶的來(lái)自多個(gè)數(shù)據(jù)源的多個(gè)維度的數(shù)據(jù);
[0057] 根據(jù)數(shù)據(jù)與用戶的歸屬關(guān)系,在多個(gè)用戶的來(lái)自多個(gè)數(shù)據(jù)源的多個(gè)維度的數(shù)據(jù) 中,確定歸屬于特定用戶的來(lái)自多個(gè)數(shù)據(jù)源的多個(gè)維度的數(shù)據(jù)。
[0058] 具體地,生成數(shù)字人的系統(tǒng)獲取到來(lái)自多個(gè)數(shù)據(jù)源大量數(shù)據(jù)后,根據(jù)數(shù)據(jù)與數(shù)字 人對(duì)應(yīng)的用戶的歸屬關(guān)系來(lái)確定歸屬于特定用戶的多個(gè)維度的數(shù)據(jù)。例如,可以根據(jù)數(shù)據(jù) 來(lái)源和內(nèi)容與系統(tǒng)中已經(jīng)存在的數(shù)字人對(duì)應(yīng)的用戶的信息進(jìn)行匹配。當(dāng)匹配到某一數(shù)據(jù)為 已經(jīng)存在的數(shù)字人對(duì)應(yīng)的用戶的相關(guān)數(shù)據(jù)時(shí),系統(tǒng)可以將該數(shù)據(jù)存儲(chǔ)或更新至該數(shù)字人對(duì) 應(yīng)的用戶的賬戶下,或者直接對(duì)數(shù)據(jù)進(jìn)行挖掘或分析,將得到的結(jié)果存儲(chǔ)或更新至該數(shù)字 人對(duì)應(yīng)的用戶的賬戶下。當(dāng)確定某一數(shù)據(jù)不歸屬于當(dāng)前已經(jīng)存在的數(shù)字人對(duì)應(yīng)的用戶時(shí), 則系統(tǒng)可以重新建立一個(gè)用戶賬戶,用于存儲(chǔ)該數(shù)據(jù)或由該數(shù)據(jù)挖掘出的信息。
[0059] 可選地,作為一個(gè)實(shí)施例,為了便于確定數(shù)據(jù)和數(shù)字人對(duì)應(yīng)用戶的歸屬關(guān)系,系統(tǒng) 可以記錄并維護(hù)數(shù)字人用戶ID和該用戶在物理世界中的其他身份ID之間的對(duì)應(yīng)關(guān)系。例 如,可以維護(hù)并實(shí)時(shí)更新一個(gè)表,該表用于記錄數(shù)字人用戶ID以及相對(duì)應(yīng)的物理世界個(gè)人 的手機(jī)號(hào)、微信號(hào)、QQ號(hào)、微博賬號(hào)、論壇賬號(hào)等信息。根據(jù)此表,系統(tǒng)可以很方便地辨識(shí)出 數(shù)據(jù)與用戶的歸屬關(guān)系,也可以方便對(duì)各用戶的數(shù)據(jù)的查詢。例如,根據(jù)表內(nèi)記錄的信息, 可以辨識(shí)出,微信號(hào)為"aaalll"的用戶和微博賬號(hào)為"CCC222"的用戶對(duì)應(yīng)的是同一用戶, 則從微信號(hào)"aaalll"獲取的數(shù)據(jù)和微博賬號(hào)"CCC222"獲取的數(shù)據(jù)均歸屬于該用戶。此外, 還可以根據(jù)數(shù)據(jù)的內(nèi)容確定數(shù)據(jù)與用戶的歸屬關(guān)系。例如,一條數(shù)據(jù)是一則新聞,該新聞報(bào) 道了與該用戶相關(guān)的事跡,則可以確定該新聞是歸屬于該用戶的數(shù)據(jù)。
[0060] 可選地,作為一個(gè)實(shí)施例,如圖2所示,方法100還包括:
[0061]S140,對(duì)特定用戶的來(lái)自多個(gè)數(shù)據(jù)源的多個(gè)維度的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗;
[0062]S150,提取清洗后的數(shù)據(jù)的內(nèi)容所對(duì)應(yīng)的時(shí)間和關(guān)鍵詞;
[0063]S160,將時(shí)間和關(guān)鍵詞作為標(biāo)注信息,對(duì)該清洗后的數(shù)據(jù)進(jìn)行標(biāo)注;
[0064] 其中,基于數(shù)字人模型所包括的多個(gè)維度的用戶畫(huà)像模型,對(duì)特定用戶的多個(gè)維 度的數(shù)據(jù)進(jìn)行處理,生成對(duì)應(yīng)于特定用戶的多個(gè)維度的用戶畫(huà)像,包括:
[0065] 基于數(shù)字人模型所包括的多個(gè)維度的用戶畫(huà)像模型,對(duì)標(biāo)注后的數(shù)據(jù)進(jìn)行處理, 生成對(duì)應(yīng)于特定用戶的多個(gè)維度的用戶畫(huà)像。