專利名稱:一種網(wǎng)址類型的設(shè)置方法及系統(tǒng)的制作方法
—種網(wǎng)址類型的設(shè)置方法及系統(tǒng)
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用領(lǐng)域,尤其涉及一種網(wǎng)址類型的設(shè)置方法及系統(tǒng)。
背景技術(shù):
網(wǎng)址導(dǎo)航指的是一個(gè)集合較多網(wǎng)址,并按照一定條件進(jìn)行分類的網(wǎng)址站,網(wǎng)址導(dǎo)航能夠方便用戶快速找到需要的網(wǎng)站,而且用戶不需要記住各類網(wǎng)站的網(wǎng)址,就可以直接進(jìn)到所需的網(wǎng)站。網(wǎng)址導(dǎo)航中會(huì)為各個(gè)網(wǎng)址進(jìn)行分類,例如綜合類、貼吧類、社區(qū)類、購(gòu)物類、游戲類、閱讀類、影視類、音樂(lè)類和工具類等,對(duì)于其中類別不明顯的網(wǎng)址,如綜合類的網(wǎng)址和貼吧類的網(wǎng)址等,用戶會(huì)人為地對(duì)這些網(wǎng)址進(jìn)行分類,例如,對(duì)于新浪網(wǎng),有些用戶認(rèn)為新浪網(wǎng)屬于新聞?lì)惥W(wǎng)址,有些用戶認(rèn)為新浪網(wǎng)屬于體育類網(wǎng)址;對(duì)于百度貼吧,有些用戶認(rèn)為百度貼吧中的貼子屬于貼吧類,但是百度貼吧也會(huì)分成為明星的貼吧、影視劇評(píng)論的貼吧,有些用戶認(rèn)為百度貼吧屬于社區(qū)類等。因此,每個(gè)用戶對(duì)類別不明顯的網(wǎng)址的分類 不同,如果將類別不明顯的網(wǎng)址固定的歸為一類,則對(duì)于用戶而言將不能在自己認(rèn)為的類型中找到需要的網(wǎng)址,需要查詢多種類型才能找到需要的網(wǎng)址,因此查找速度較慢,效率較低。但是目前又沒(méi)有針對(duì)類別不明顯的網(wǎng)址的分類方案,更無(wú)法向用戶推薦網(wǎng)址的類型。
發(fā)明內(nèi)容本發(fā)明提供了一種網(wǎng)址類型的設(shè)置方法及系統(tǒng),能夠?qū)W(wǎng)址導(dǎo)航的用戶收藏的類別不明顯的網(wǎng)址進(jìn)行分類,提高網(wǎng)址導(dǎo)航中網(wǎng)址查找效率。本發(fā)明的具體技術(shù)方案如下根據(jù)本發(fā)明一優(yōu)選實(shí)施例,一種網(wǎng)址類型的設(shè)置方法,包括收到用戶收藏網(wǎng)址的請(qǐng)求時(shí),判斷與所述用戶是同一個(gè)社區(qū)的其他用戶的用戶行為數(shù)據(jù)中,是否包含所述網(wǎng)址;如果是,依據(jù)所述其他用戶的用戶行為數(shù)據(jù)中所述網(wǎng)址的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型;否則,設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型為默認(rèn)類型。上述方法中,該方法還包括依據(jù)預(yù)先存儲(chǔ)的用戶行為數(shù)據(jù),創(chuàng)建二維矩陣;所述用戶行為數(shù)據(jù)包括用戶ID、用戶收藏的網(wǎng)址和用戶收藏的網(wǎng)址的類型;所述二維矩陣為用戶ID與用戶收藏的每個(gè)類型的網(wǎng)址個(gè)數(shù)的對(duì)應(yīng)關(guān)系;依據(jù)所述用戶行為數(shù)據(jù)和所述二維矩陣計(jì)算得到用戶之間的相似性數(shù)據(jù),將相似性數(shù)據(jù)大于預(yù)設(shè)的相似度閾值的用戶歸為同一個(gè)社區(qū)。上述方法中,所述依據(jù)所述用戶行為數(shù)據(jù)和所述二維矩陣計(jì)算得到用戶之間的相似性數(shù)據(jù)為利用如下公式依次計(jì)算所有用戶中每?jī)蓚€(gè)用戶之間的相似性數(shù)據(jù)
權(quán)利要求
1.一種網(wǎng)址類型的設(shè)置方法,其特征在于,該方法包括 收到用戶收藏網(wǎng)址的請(qǐng)求時(shí),判斷與所述用戶是同一個(gè)社區(qū)的其他用戶的用戶行為數(shù)據(jù)中,是否包含所述網(wǎng)址; 如果是,依據(jù)所述其他用戶的用戶行為數(shù)據(jù)中所述網(wǎng)址的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型;否則,設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型為默認(rèn)類型。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,該方法還包括 依據(jù)預(yù)先存儲(chǔ)的用戶行為數(shù)據(jù),創(chuàng)建二維矩陣;所述用戶行為數(shù)據(jù)包括用戶ID、用戶收藏的網(wǎng)址和用戶收藏的網(wǎng)址的類型;所述二維矩陣為用戶ID與用戶收藏的每個(gè)類型的網(wǎng)址個(gè)數(shù)的對(duì)應(yīng)關(guān)系; 依據(jù)所述用戶行為數(shù)據(jù)和所述二維矩陣計(jì)算得到用戶之間的相似性數(shù)據(jù),將相似性數(shù)據(jù)大于預(yù)設(shè)的相似度閾值的用戶歸為同一個(gè)社區(qū)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述依據(jù)所述用戶行為數(shù)據(jù)和所述二維矩陣計(jì)算得到用戶之間的相似性數(shù)據(jù)為 利用如下公式依次計(jì)算所有用戶中每?jī)蓚€(gè)用戶之間的相似性數(shù)據(jù)
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述判斷與所述用戶是同一個(gè)社區(qū)的其他用戶的用戶行為數(shù)據(jù)中,是否包含所述網(wǎng)址之前,該方法還包括 依據(jù)預(yù)設(shè)的網(wǎng)址分類字典中網(wǎng)址與類型的對(duì)應(yīng)關(guān)系確定所述網(wǎng)址的類型,判斷所述網(wǎng)址是否是綜合類網(wǎng)址; 當(dāng)所述網(wǎng)址是網(wǎng)址分類字典中的綜合類網(wǎng)址時(shí),執(zhí)行判斷與所述用戶是同一個(gè)社區(qū)的其他用戶的用戶行為數(shù)據(jù)中,是否包含所述網(wǎng)址的操作。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述依據(jù)所述其他用戶的用戶行為數(shù)據(jù)中所述網(wǎng)址的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型,具體為 依據(jù)與所述其他用戶設(shè)置的用戶請(qǐng)求收藏的網(wǎng)址的類型,統(tǒng)計(jì)每種類型對(duì)應(yīng)的用戶數(shù)量; 對(duì)每種類型對(duì)應(yīng)的用戶數(shù)量進(jìn)行由大到小排序; 依據(jù)用戶數(shù)量最多的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型,其中當(dāng)有兩個(gè)以上類型對(duì)應(yīng)的用戶數(shù)量相同時(shí),依據(jù)用戶在所述兩個(gè)以上類型中選出的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型。
6.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型為默認(rèn)類型,具體為 依據(jù)預(yù)設(shè)的網(wǎng)址分類字典中網(wǎng)址與類型的對(duì)應(yīng)關(guān)系,設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型。
7.—種網(wǎng)址類型的設(shè)置系統(tǒng),其特征在于,該系統(tǒng)包括判斷單元、設(shè)置單元;其中, 判斷單元,用于收到用戶收藏網(wǎng)址的請(qǐng)求時(shí),判斷與所述用戶是同一個(gè)社區(qū)的其他用戶的用戶行為數(shù)據(jù)中,是否包含所述網(wǎng)址; 設(shè)置單元,用于當(dāng)判斷單元判斷出其他用戶的用戶行為數(shù)據(jù)中包含所述網(wǎng)址時(shí),依據(jù)所述其他用戶的用戶行為數(shù)據(jù)中所述網(wǎng)址的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型;當(dāng)判斷單元判斷出其他所有用戶的用戶行為數(shù)據(jù)中都不包含所述網(wǎng)址時(shí),設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型為默認(rèn)類型。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,該系統(tǒng)還包括 數(shù)據(jù)處理單元,用于依據(jù)預(yù)先存儲(chǔ)的用戶行為數(shù)據(jù),創(chuàng)建二維矩陣;所述用戶行為數(shù)據(jù)包括用戶ID、用戶收藏的網(wǎng)址和用戶收藏的網(wǎng)址的類型;所述二維矩陣為用戶ID與用戶收藏的每個(gè)類型的網(wǎng)址個(gè)數(shù)的對(duì)應(yīng)關(guān)系; 計(jì)算單元,用于依據(jù)所述用戶行為數(shù)據(jù)和所述二維矩陣計(jì)算得到用戶之間的相似性數(shù)據(jù),將相似性數(shù)據(jù)大于預(yù)設(shè)的相似度閾值的用戶歸為同一個(gè)社區(qū)。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述計(jì)算單元依據(jù)所述用戶行為數(shù)據(jù)和所述二維矩陣計(jì)算得到用戶之間的相似性數(shù)據(jù),具體為 利用如下公式依次計(jì)算所有用戶中每?jī)蓚€(gè)用戶之間的相似性數(shù)據(jù)
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述判斷單元,還用于依據(jù)預(yù)設(shè)的網(wǎng)址分類字典中網(wǎng)址與類型的對(duì)應(yīng)關(guān)系確定所述網(wǎng)址的類型,判斷所述網(wǎng)址是否是綜合類網(wǎng)址;當(dāng)所述網(wǎng)址是網(wǎng)址分類字典中的綜合類網(wǎng)址時(shí),執(zhí)行判斷與所述用戶是同一個(gè)社區(qū)的其他用戶的用戶行為數(shù)據(jù)中,是否包含所述網(wǎng)址的操作。
11.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述設(shè)置單元在依據(jù)所述其他用戶的用戶行為數(shù)據(jù)中所述網(wǎng)址的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型時(shí),具體為 依據(jù)與所述其他用戶設(shè)置的用戶請(qǐng)求收藏的網(wǎng)址的類型,統(tǒng)計(jì)每種類型對(duì)應(yīng)的用戶數(shù)量; 對(duì)每種類型對(duì)應(yīng)的用戶數(shù)量進(jìn)行由大到小排序; 依據(jù)用戶數(shù)量最多的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型,其中當(dāng)有兩個(gè)以上類型對(duì)應(yīng)的用戶數(shù)量相同時(shí),依據(jù)用戶在所述兩個(gè)以上類型中選出的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型。
12.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述設(shè)置單元在設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型為默認(rèn)類型時(shí),具體為依據(jù)預(yù)設(shè)的網(wǎng)址分類字典中網(wǎng)址與類型的對(duì)應(yīng)關(guān)系,設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類 型。
全文摘要
本發(fā)明提供了一種網(wǎng)址類型的設(shè)置方法,包括收到用戶收藏網(wǎng)址的請(qǐng)求時(shí),判斷與所述用戶是同一個(gè)社區(qū)的其他用戶的用戶行為數(shù)據(jù)中,是否包含所述網(wǎng)址;如果是,依據(jù)所述其他用戶的用戶行為數(shù)據(jù)中所述網(wǎng)址的類型設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型;否則,設(shè)置用戶請(qǐng)求收藏的網(wǎng)址的類型為默認(rèn)類型;本發(fā)明還提供一種網(wǎng)址類型的設(shè)置系統(tǒng)。根據(jù)本發(fā)明提供的技術(shù)方案,能夠?qū)W(wǎng)址導(dǎo)航的用戶收藏的類別不明顯的網(wǎng)址進(jìn)行分類,提高網(wǎng)址導(dǎo)航中網(wǎng)址查找效率。
文檔編號(hào)G06F17/30GK102929963SQ20121038462
公開(kāi)日2013年2月13日 申請(qǐng)日期2012年10月11日 優(yōu)先權(quán)日2012年10月11日
發(fā)明者賈春鑫, 張文戰(zhàn) 申請(qǐng)人:北京百度網(wǎng)訊科技有限公司