生成聚類模型以及基于該聚類模型進(jìn)行聚類的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明的各實(shí)施方式涉及消息處理,更具體地,涉及在消息處理中生成聚類模型 (clustering model)以及基于該聚類模型進(jìn)行聚類的方法和裝置。
【背景技術(shù)】
[0002] 隨著通信技術(shù)的發(fā)展,目前已經(jīng)開發(fā)出了各種通信應(yīng)用。廣大用戶可以通過(guò)即時(shí) 消息應(yīng)用(例如,微信、Sametime、QQ等)、短消息應(yīng)用、以及聊天室應(yīng)用等通信應(yīng)用來(lái)進(jìn)行 溝通。這些通信應(yīng)用可以運(yùn)行在具有通信能力的計(jì)算設(shè)備上(例如,計(jì)算機(jī)、膝上型計(jì)算 機(jī)、平板式計(jì)算機(jī)、智能終端、移動(dòng)終端等),并且用戶可以經(jīng)由這些通信應(yīng)用與一個(gè)或者多 個(gè)其他用戶進(jìn)行通信。
[0003] 不同于傳統(tǒng)的連續(xù)語(yǔ)音通信,用戶可以使用這些通信應(yīng)用在離散的時(shí)間點(diǎn)進(jìn)行通 信,并且前后相繼的兩個(gè)消息可能涉及不同的主題。例如,用戶Alan可以向用戶Teresa發(fā) 送消息"北京天氣好嗎?"Teresa在接收到來(lái)自Alan的消息之后可能并沒(méi)有馬上回答北京 的天氣狀況,而是可能先向Alan發(fā)送了幾條問(wèn)候信息,并且在詢問(wèn)"你哪天到北京?"之后, 才回答Alan "北京下雨"。
[0004] 從上述示例中可以發(fā)現(xiàn),在使用通信應(yīng)用進(jìn)行的對(duì)話中,來(lái)自兩個(gè)用戶的前后相 繼的兩個(gè)或者更多消息并不總是討論相同的主題(theme),而是可以討論多個(gè)相關(guān)或者無(wú) 關(guān)的主題(例如,天氣、交通、教育、體育等內(nèi)容)。在群聊(group chatting)中,多個(gè)用戶 可能同時(shí)會(huì)討論更多主題。當(dāng)基于現(xiàn)有技術(shù)的按照時(shí)間順序來(lái)逐個(gè)呈現(xiàn)來(lái)自各個(gè)用戶的消 息時(shí),用戶很難快速了解各個(gè)消息之間的關(guān)聯(lián)關(guān)系;尤其是當(dāng)用戶正在使用諸如移動(dòng)終端 等顯示屏幕尺寸有限的設(shè)備時(shí),將會(huì)造成頁(yè)面顯示的混亂。
[0005] 另外,目前的通信應(yīng)用可以支持用戶發(fā)送語(yǔ)音消息,例如,用戶可以按下通信應(yīng)用 中的"語(yǔ)音"按鈕錄制語(yǔ)音消息,當(dāng)抬起"語(yǔ)音"按鈕時(shí)可以將該語(yǔ)音消息發(fā)送至一個(gè)或者 多個(gè)其他用戶。該語(yǔ)音消息在接收者的用戶設(shè)備處可以顯示為特殊的圖標(biāo),而當(dāng)用戶按下 該圖標(biāo)時(shí)則可以聽到發(fā)送者錄制的語(yǔ)音。當(dāng)兩個(gè)或者更多用戶采用語(yǔ)音方式通信時(shí),在用 戶設(shè)備處的顯示屏上根本不能區(qū)分哪些語(yǔ)音消息涉及相同的主題。此時(shí)用戶需要依次收聽 每個(gè)語(yǔ)音消息,這將占用很多時(shí)間。
[0006] 因而,如何按照各個(gè)消息所討論的主題來(lái)區(qū)分來(lái)自于兩個(gè)或者更多用戶的多個(gè)消 息,成為目前的一個(gè)研究熱點(diǎn)。
【發(fā)明內(nèi)容】
[0007] 因而,期望開發(fā)出一種基于通信應(yīng)用中的對(duì)話的特征來(lái)生成可以將對(duì)話中的多個(gè) 消息進(jìn)行聚類的聚類模型的技術(shù)方案。進(jìn)一步,還期望能夠基于所生成的聚類模型來(lái)將當(dāng) 前對(duì)話中的多個(gè)消息進(jìn)行聚類的技術(shù)方案。
[0008] 在本發(fā)明的一個(gè)實(shí)施方式中,提供了一種用于生成聚類模型的方法,包括:響應(yīng)于 接收到來(lái)自歷史語(yǔ)音對(duì)話中的多個(gè)歷史消息,提取多個(gè)歷史消息中的每個(gè)歷史消息的特征 信息;獲取多個(gè)歷史消息之間的關(guān)聯(lián)關(guān)系;以及基于多個(gè)歷史消息中的每個(gè)歷史消息的特 征信息和關(guān)聯(lián)關(guān)系來(lái)生成將多個(gè)歷史消息進(jìn)行聚類的聚類模型。
[0009] 在本發(fā)明的一個(gè)實(shí)施方式中,提供了一種用于將對(duì)話中的多個(gè)當(dāng)前消息進(jìn)行聚類 的方法,包括:響應(yīng)于接收到對(duì)話中的多個(gè)當(dāng)前消息,提取多個(gè)當(dāng)前消息中的每個(gè)當(dāng)前消息 的特征信息;以及采用本發(fā)明的方法生成的聚類模型,基于多個(gè)當(dāng)前消息的每個(gè)當(dāng)前消息 的特征信息,將多個(gè)當(dāng)前消息聚類至至少一個(gè)主題分組。
[0010] 在本發(fā)明的一個(gè)實(shí)施方式中,提供了一種用于生成聚類模型的裝置,包括:提取模 塊,配置用于響應(yīng)于接收到來(lái)自歷史語(yǔ)音對(duì)話中的多個(gè)歷史消息,提取多個(gè)歷史消息中的 每個(gè)歷史消息的特征信息;獲取模塊,配置用于獲取多個(gè)歷史消息之間的關(guān)聯(lián)關(guān)系;以及 生成模塊,配置用于基于多個(gè)歷史消息中的每個(gè)歷史消息的特征信息和關(guān)聯(lián)關(guān)系來(lái)生成將 多個(gè)歷史消息進(jìn)行聚類的聚類模型。
[0011] 在本發(fā)明的一個(gè)實(shí)施方式中,提供了一種用于將對(duì)話中的多個(gè)當(dāng)前消息進(jìn)行聚類 的裝置,包括:第一提取模塊,配置用于響應(yīng)于接收到對(duì)話中的多個(gè)當(dāng)前消息,提取多個(gè)當(dāng) 前消息中的每個(gè)當(dāng)前消息的特征信息;以及聚類模塊,配置用于采用本發(fā)明的裝置生成的 聚類模型,基于多個(gè)當(dāng)前消息的每個(gè)當(dāng)前消息的特征信息,將多個(gè)當(dāng)前消息聚類至至少一 個(gè)主題分組。
[0012] 采用本發(fā)明所述的方法和裝置,可以高效并且準(zhǔn)確地生成用于將多個(gè)消息進(jìn)行聚 類的聚類模型。進(jìn)一步,采用本發(fā)明所述的其他方法和裝置,可以基于該聚類模型將當(dāng)前會(huì) 話中的多個(gè)當(dāng)前消息聚類至至少一個(gè)主題分組,可以基于各個(gè)用戶的定制信息來(lái)顯示各個(gè) 分組中的消息,還可以突出顯示分組中的無(wú)響應(yīng)消息。
【附圖說(shuō)明】
[0013] 通過(guò)結(jié)合附圖對(duì)本公開示例性實(shí)施方式進(jìn)行更詳細(xì)的描述,本公開的上述以及其 他目的、特征和優(yōu)勢(shì)將變得更加明顯,其中,在本公開示例性實(shí)施方式中,相同的參考標(biāo)號(hào) 通常代表相同部件。
[0014] 圖1示意性示出了適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)/服務(wù)器的 框圖;
[0015] 圖2示意性示出了一個(gè)示例性的云計(jì)算環(huán)境;
[0016] 圖3示意性示出了云計(jì)算環(huán)境50 (圖2)提供的一組功能抽象層;
[0017] 圖4示意性示出了根據(jù)一個(gè)技術(shù)方案的顯示對(duì)話中的多個(gè)消息的界面;
[0018] 圖5示意性示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于生成聚類模型的技術(shù)方案的 框圖,并示意性示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于基于所生成的聚類模型將當(dāng)前對(duì)話 中的多個(gè)當(dāng)前消息進(jìn)行聚類的技術(shù)方案的框圖;
[0019] 圖6A示意性示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于生成聚類模型的方法的流程 圖,以及圖6B示意性示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的基于所生成的聚類模型將當(dāng)前對(duì) 話中的多個(gè)當(dāng)前消息進(jìn)行聚類的方法的流程圖;
[0020] 圖7示意性示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的對(duì)聚類后的多個(gè)當(dāng)前消息進(jìn)行顯 示的界面的示意圖;
[0021] 圖8示意性示出了根據(jù)本發(fā)明另一實(shí)施方式的對(duì)聚類后的多個(gè)當(dāng)前消息進(jìn)行顯 示的界面的示意圖;
[0022] 圖9A示意性示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于生成聚類模型的裝置的框 圖,以及圖9B示意性示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的基于所生成的聚類模型將當(dāng)前對(duì) 話中的多個(gè)當(dāng)前消息進(jìn)行聚類的裝置的框圖。
【具體實(shí)施方式】
[0023] 下面將參照附圖更詳細(xì)地描述本公開的優(yōu)選實(shí)施方式。雖然附圖中顯示了本公開 的優(yōu)選實(shí)施方式,然而應(yīng)該理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施方 式所限制。相反,提供這些實(shí)施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的 范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0024] 首先應(yīng)當(dāng)理解,盡管本公開包括關(guān)于云計(jì)算的詳細(xì)描述,但其中記載的技術(shù)方案 的實(shí)現(xiàn)卻不限于云計(jì)算環(huán)境,而是能夠結(jié)合現(xiàn)在已知或以后開發(fā)的任何其他類型的計(jì)算環(huán) 境而實(shí)現(xiàn)。
[0025] 云計(jì)算是一種服務(wù)交付模式,用于對(duì)共享的可配置計(jì)算資源池進(jìn)行方便、按需的 網(wǎng)絡(luò)訪問(wèn)??膳渲糜?jì)算資源是能夠以最小的管理成本或與服務(wù)提供者進(jìn)行最少的交互就能 快速部署和釋放的資源,例如可以是網(wǎng)絡(luò)、網(wǎng)絡(luò)帶寬、服務(wù)器、處理、內(nèi)存、存儲(chǔ)、應(yīng)用、虛擬 機(jī)和服務(wù)。這種云模式可以包括至少五個(gè)特征、至少三個(gè)服務(wù)模型和至少四個(gè)部署模型。
[0026] 特征包括:
[0027] 按需自助式服務(wù):云的消費(fèi)者在無(wú)需與服務(wù)提供者進(jìn)行人為交互的情況下能夠單 方面自動(dòng)地按需部署諸如服務(wù)器時(shí)間和網(wǎng)絡(luò)存儲(chǔ)等的計(jì)算能力。
[0028] 廣泛的網(wǎng)絡(luò)接入:計(jì)算能力可以通過(guò)標(biāo)準(zhǔn)機(jī)制在網(wǎng)絡(luò)上獲取,這種標(biāo)準(zhǔn)機(jī)制促進(jìn) 了通過(guò)不同種類的瘦客戶機(jī)平臺(tái)或厚客戶機(jī)平臺(tái)(例如移動(dòng)電話、膝上型電腦、個(gè)人數(shù)字 助理PDA)對(duì)云的使用。
[0029] 資源池:提供者的計(jì)算資源被歸入資源池并通過(guò)多租戶(multi-tenant)模式服 務(wù)于多重消費(fèi)者,其中按需將不同的實(shí)體資源和虛擬資源動(dòng)態(tài)地分配和再分配。一般情況 下,消費(fèi)者不能控制或甚至并不知曉所提供的資源的確切位置,但可以在較高抽象程度上 指定位置(例如國(guó)家、州或數(shù)據(jù)中心),因此具有位置無(wú)關(guān)性。
[0030] 迅速?gòu)椥裕耗軌蜓杆?、有彈性地(有時(shí)是自動(dòng)地)部署計(jì)算能力,以實(shí)現(xiàn)快速擴(kuò)展, 并且能迅速釋放來(lái)快速縮小。在消費(fèi)者看來(lái),用于部署的可用計(jì)算能力往往顯得是無(wú)限的, 并能在任意時(shí)候都能獲取任意數(shù)量的計(jì)算能力。
[0031] 可測(cè)量的服務(wù):云系統(tǒng)通過(guò)利用適于服務(wù)類型(例如存儲(chǔ)、處理、帶寬和活躍用戶 賬號(hào))的某種抽象程度的計(jì)量能力,自動(dòng)地控制和優(yōu)化資源效用??梢员O(jiān)測(cè)、控制和報(bào)告資 源使用情況,為服務(wù)提供者和消費(fèi)者雙方提供透明度。
[0032] 服務(wù)模型如下:
[0033] 軟件即服務(wù)(SaaS):向消費(fèi)者提供的能力是使用提供者在云基礎(chǔ)架構(gòu)上運(yùn)行的 應(yīng)用??梢酝ㄟ^(guò)諸如網(wǎng)絡(luò)瀏覽器的瘦客戶機(jī)接口(例如基于網(wǎng)絡(luò)的電子郵件)從各種客戶 機(jī)設(shè)備訪問(wèn)應(yīng)用。除了有限的特定于用戶的應(yīng)用配置設(shè)置外,消費(fèi)者既不管理也不控制包 括網(wǎng)絡(luò)、服務(wù)器、操作系統(tǒng)、存儲(chǔ)、乃至單個(gè)應(yīng)用能力等的底層云基礎(chǔ)架構(gòu)。
[0034] 平臺(tái)即服務(wù)(PaaS):向消費(fèi)者提供的能力是在云基礎(chǔ)架構(gòu)上部署消費(fèi)者創(chuàng)建或 獲得的應(yīng)用,這些應(yīng)用利用提供者支持的程序設(shè)計(jì)語(yǔ)言和工具創(chuàng)建。消費(fèi)者既不管理也不 控制包括網(wǎng)絡(luò)、服務(wù)器、操作系統(tǒng)或存儲(chǔ)的底層云基礎(chǔ)架構(gòu),但對(duì)其部署的應(yīng)用具有控制 權(quán),對(duì)應(yīng)用托管環(huán)境配置可能也具有控制權(quán)。
[0035] 基礎(chǔ)架構(gòu)即服務(wù)(IaaS):向消費(fèi)者提供的能力是消費(fèi)者能夠在其中部署并運(yùn)行 包括操作系統(tǒng)和應(yīng)用的任意軟件的處理、存儲(chǔ)、網(wǎng)絡(luò)和其他基礎(chǔ)計(jì)算資源。消費(fèi)者既不管理 也不控制底層的云基礎(chǔ)架構(gòu),但是對(duì)操作系統(tǒng)、存儲(chǔ)和其部署的應(yīng)用具有控制權(quán),對(duì)選擇的 網(wǎng)絡(luò)組件