生成數(shù)字人的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信領(lǐng)域,尤其涉及通信領(lǐng)域中生成數(shù)字人的方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著信息通信技術(shù)(InformationCommunicationTechnology,ICT)的不斷發(fā)展, 物理世界中的人類活動越來越多的深入到數(shù)字世界中來。人們通過社交網(wǎng)絡(luò)交朋友,建立 朋友圈;通過微博發(fā)布對社會事件的個人觀點,形成自媒體,建立個人公眾形象;通過網(wǎng)絡(luò) 購物,獲得各種商品與服務(wù);通過網(wǎng)絡(luò)銀行參與管理個人資產(chǎn);通過個人手機終端隨時隨 地拍攝照片、視頻,記錄分享人生喜怒哀樂;人們通過穿戴式終端感測自身體征數(shù)據(jù),監(jiān)控 健康。移動終端和移動互聯(lián)網(wǎng)的進一步普及,用戶在各種數(shù)據(jù)平臺活動產(chǎn)生的數(shù)據(jù)呈現(xiàn)爆 炸式增長,海量的數(shù)據(jù)分散在用戶數(shù)字化生活的個個角落。
[0003] 這些用戶數(shù)據(jù)的背后,隱藏著用戶的興趣、愛好、觀點、習慣、家庭、健康等各種表 征物理世界個人特征的信息。但是,各種數(shù)據(jù)源產(chǎn)生的各個維度的用戶數(shù)據(jù)是分散的,不能 得到充分地挖掘。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例提供了一種生成數(shù)字人的方法及系統(tǒng),能夠獲取來自多個數(shù)據(jù)源的 用戶的多個維度的數(shù)據(jù),對數(shù)據(jù)進行挖掘并生成數(shù)字人。
[0005] 第一方面,提供了一種生成數(shù)字人的方法,該方法包括:定義數(shù)字人模型,該數(shù)字 人模型包括多個維度的用戶畫像模型;獲取特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù) 據(jù);基于數(shù)字人模型所包括的多個維度的用戶畫像模型,對特定用戶的來自多個數(shù)據(jù)源的 多個維度的數(shù)據(jù)進行處理,生成對應(yīng)于特定用戶的多個維度的用戶畫像,特定用戶的多個 維度的用戶畫像組成了與特定用戶對應(yīng)的數(shù)字人。
[0006] 結(jié)合第一方面,在第一方面的第一種可能的實現(xiàn)方式中,獲取特定用戶的來自多 個數(shù)據(jù)源的多個維度的數(shù)據(jù),包括:獲取多個用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù); 根據(jù)數(shù)據(jù)與用戶的歸屬關(guān)系,在多個用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)中,確定歸 屬于特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)。
[0007] 結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第二種可能的實現(xiàn)方式 中,獲取多個用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù),包括:通過終端、通信網(wǎng)元和數(shù)據(jù) 收集代理中的至少一種設(shè)備,獲取多個用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)。
[0008] 結(jié)合第一方面或第一方面的第一種至第二種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第一方面的第三種可能的實現(xiàn)方式中,多個維度的用戶畫像包括以下至少兩 種:用戶形象維度畫像、用戶健康維度畫像、用戶行為習慣維度畫像、用戶社交模式維度畫 像、用戶消費習慣維度畫像和用戶興趣愛好維度畫像。
[0009] 結(jié)合第一方面或第一方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第一方面的第四種可能的實現(xiàn)方式中,該方法還包括:對特定用戶的來自多 個數(shù)據(jù)源的多個維度的數(shù)據(jù)進行數(shù)據(jù)清洗;提取清洗后的數(shù)據(jù)的內(nèi)容所對應(yīng)的時間和關(guān) 鍵詞;將時間和關(guān)鍵詞作為標注信息,對清洗后的數(shù)據(jù)進行標注;其中,基于數(shù)字人模型所 包括的多個維度的用戶畫像模型,對特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)進行處 理,生成對應(yīng)于特定用戶的多個維度的用戶畫像,包括:基于數(shù)字人模型所包括的多個維度 的用戶畫像模型,對標注后的數(shù)據(jù)進行處理,生成對應(yīng)于特定用戶的多個維度的用戶畫像。
[0010] 結(jié)合第一方面或第一方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第一方面的第五種可能的實現(xiàn)方式中,該方法還包括:對特定用戶的來自多個 數(shù)據(jù)源的多個維度的數(shù)據(jù)進行數(shù)據(jù)清洗;提取清洗后的數(shù)據(jù)的內(nèi)容所對應(yīng)的時間、位置和 關(guān)鍵詞;將時間、位置和關(guān)鍵詞作為標注信息,對清洗后的數(shù)據(jù)進行標注;其中,基于數(shù)字 人模型所包括的多個維度的用戶畫像模型,對特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù) 據(jù)進行處理,生成對應(yīng)于特定用戶的多個維度的用戶畫像,包括:基于數(shù)字人模型所包括的 多個維度的用戶畫像模型,對標注后的數(shù)據(jù)進行處理,生成對應(yīng)于特定用戶的多個維度的 用戶畫像。
[0011] 結(jié)合第一方面的第四種可能的實現(xiàn)方式或第一方面的第五種可能的實現(xiàn)方式,在 第一方面的第六種可能的實現(xiàn)方式中,該方法還包括:存儲標注后的數(shù)據(jù)。
[0012] 結(jié)合第一方面或第一方面的第一種至第六種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第一方面的第七種可能的實現(xiàn)方式中,在基于數(shù)字人模型所包括的多個維度 的用戶畫像模型,對特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)進行處理,生成對應(yīng)于 特定用戶的多個維度的用戶畫像之后,該方法還包括:根據(jù)客戶端輸入的查詢條件,向客戶 端提供與查詢條件相應(yīng)的數(shù)字人的用戶畫像。
[0013] 結(jié)合第一方面或第一方面的第一種至第七種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第一方面的第八種可能的實現(xiàn)方式中,在定義數(shù)字人模型之前,該方法還包 括:根據(jù)客戶端的需求,創(chuàng)建與需求對應(yīng)的用于生成用戶畫像的用戶畫像模型。
[0014] 結(jié)合第一方面或第一方面的第一種至第八種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第一方面的第九種可能的實現(xiàn)方式中,基于數(shù)字人模型所包括的多個維度的 用戶畫像模型,對特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)進行處理,生成對應(yīng)于特 定用戶的多個維度的用戶畫像,包括:基于數(shù)字人模型所包括的多個維度的用戶畫像模型, 通過以下至少一種算法對特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)進行處理,生成對 應(yīng)于特定用戶的多個維度的用戶畫像:分類算法、聚類算法、回歸算法、增強學(xué)習算法、遷移 學(xué)習算法、深度學(xué)習算法和主動學(xué)習算法。
[0015] 第二方面,提供了一種生成數(shù)字人的系統(tǒng),該系統(tǒng)包括:定義模塊,用于定義數(shù)字 人模型,該數(shù)字人模型包括多個維度的用戶畫像模型;獲取模塊,用于獲取特定用戶的來自 多個數(shù)據(jù)源的多個維度的數(shù)據(jù);生成模塊,用于基于定義模塊定義的數(shù)字人模型所包括的 多個維度的用戶畫像模型,對獲取模塊獲取的特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù) 據(jù)進行處理,生成對應(yīng)于特定用戶的多個維度的用戶畫像,特定用戶的多個維度的用戶畫 像組成了與特定用戶對應(yīng)的數(shù)字人。
[0016] 結(jié)合第二方面,在第二方面的第一種可能的實現(xiàn)方式中,獲取模塊包括:獲取單 元,用于獲取多個用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù);確定單元,用于根據(jù)數(shù)據(jù)與用 戶的歸屬關(guān)系,在獲取單元獲取的多個用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)中,確定 歸屬于特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)。
[0017] 結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二方面的第二種可能的實現(xiàn)方式 中,該獲取單元具體用于:通過終端、通信網(wǎng)元和數(shù)據(jù)收集代理中的至少一種設(shè)備,獲取多 個用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)。
[0018] 結(jié)合第二方面或第二方面的第一種至第二種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第二方面的第三種可能的實現(xiàn)方式中,多個維度的用戶畫像包括以下至少兩 種:用戶形象維度畫像、用戶健康維度畫像、用戶行為習慣維度畫像、用戶社交模式維度畫 像、用戶消費習慣維度畫像和用戶興趣愛好維度畫像。
[0019] 結(jié)合第二方面或第二方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第二方面的第四種可能的實現(xiàn)方式中,該系統(tǒng)還包括:清洗模塊,用于對獲取 模塊獲取的特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)進行數(shù)據(jù)清洗;提取模塊,用于 提取清洗模塊清洗獲得的數(shù)據(jù)的內(nèi)容所對應(yīng)的時間和關(guān)鍵詞;標注模塊,用于將時間和關(guān) 鍵詞作為標注信息,對清洗模塊清洗獲得的數(shù)據(jù)進行標注;其中,生成模塊具體用于:基于 數(shù)字人模型所包括的多個維度的用戶畫像模型,對標注后的數(shù)據(jù)進行處理,生成對應(yīng)于特 定用戶的多個維度的用戶畫像。
[0020] 結(jié)合第二方面或第二方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第二方面的第五種可能的實現(xiàn)方式中,該系統(tǒng)還包括:清洗模塊,用于對獲取 模塊獲取的特定用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù)進行數(shù)據(jù)清洗;提取模塊,用于 提取清洗模塊清洗獲得的數(shù)據(jù)的內(nèi)容所對應(yīng)的時間、位置和關(guān)鍵詞;標注模塊,用于將時 間、位置和關(guān)鍵詞作為標注信息,對清洗模塊清洗獲得的數(shù)據(jù)進行標注;其中,生成模塊具 體用于:基于數(shù)字人模型所包括的多個維度的用戶畫像模型,對標注后的數(shù)據(jù)進行處理,生 成對應(yīng)于特定用戶的多個維度的用戶畫像。
[0021] 結(jié)合第二方面的第四種可能的實現(xiàn)方式或第二方面的第五種可能的實現(xiàn)方式,在 第二方面的第六種可能的實現(xiàn)方式中,該系統(tǒng)還包括:存儲模塊,用于存儲標注模塊標注后 的數(shù)據(jù)。
[0022] 結(jié)合第二方面或第二方面的第一種至第六種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第二方面的第七種可能的實現(xiàn)方式中,該系統(tǒng)還包括:查詢模塊,用于根據(jù)客 戶端輸入的查詢條件,向客戶端提供與查詢條件相應(yīng)的數(shù)字人的用戶畫像。
[0023] 結(jié)合第二方面或第二方面的第一種至第七種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第二方面的第八種可能的實現(xiàn)方式中,該系統(tǒng)還包括:創(chuàng)建模塊,用于根據(jù)客 戶端的需求,創(chuàng)建與需求對應(yīng)的用于生成用戶畫像的用戶畫像模型。
[0024] 結(jié)合第二方面或第二方面的第一種至第八種可能的實現(xiàn)方式中的任一種可能的 實現(xiàn)方式,在第二方面的第九種可能的實現(xiàn)方式中,該生成模塊具體用于:基于數(shù)字人模型 所包括的多個維度的用戶畫像模型,通過以下至少一種算法對特定用戶的來自多個數(shù)據(jù)源 的多個維度的數(shù)據(jù)進行處理,生成對應(yīng)于特定用戶的多個維度的用戶畫像:分類算法、聚類 算法、回歸算法、增強學(xué)習算法、遷移學(xué)習算法、深度學(xué)習算法和主動學(xué)習算法。
[0025] 第三方面,提供了一種生成數(shù)字人的系統(tǒng),該系統(tǒng)包括:接收模塊,用于接收多個 用戶的來自多個數(shù)據(jù)源的多個維度的數(shù)據(jù);數(shù)據(jù)預(yù)處理模塊,用于確定接收模塊接收的數(shù) 據(jù)所歸屬的用戶,并且對數(shù)據(jù)進行數(shù)據(jù)清洗和標注;數(shù)據(jù)存儲模塊,用于存儲數(shù)據(jù)預(yù)處理模 塊預(yù)處理后的數(shù)據(jù);用戶身份管理模塊,用于管理用戶在多個數(shù)據(jù)源中的賬戶,以便于確定 存儲模塊中存儲的多個用戶的數(shù)據(jù)與用戶的歸屬關(guān)系;用戶畫像模型配置庫,用于定義生 成用戶畫像的用戶畫像模型;算法庫,用于存儲并更新多個用于生成用戶畫像的算法;數(shù) 字人生成維護模塊,用于基于用戶畫像模型配置庫中的用戶畫像模型,根據(jù)算法庫中的算 法,對存儲模塊中存儲的數(shù)據(jù)進行處理,生成對應(yīng)的用戶畫像,用戶畫像組成了與用戶對應(yīng) 的數(shù)字人;數(shù)字人應(yīng)用程序編程接口API,用于與客戶端進行交互,以便于客戶端查詢數(shù)字 人生成維護模塊生成數(shù)字人的用戶畫像或接受客戶端提出的創(chuàng)建用戶畫像模型的需求。
[0026] 基于上述技術(shù)方案,本發(fā)明實施例的生成數(shù)字人的方法及系統(tǒng),通過獲取來自多 個數(shù)據(jù)源的用戶的多個維度的數(shù)據(jù),對數(shù)據(jù)進行處理,基于數(shù)字人模型,生成包含多個維度 的用戶畫像的數(shù)字人。
【附圖說明】
[