基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究

基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究

ID:34136456

大小:619.03 KB

頁(yè)數(shù):6頁(yè)

時(shí)間:2019-03-03

基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究_第1頁(yè)
基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究_第2頁(yè)
基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究_第3頁(yè)
基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究_第4頁(yè)
基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究_第5頁(yè)
資源描述:

《基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)

1、101基于領(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型研究3易明王學(xué)東摘要數(shù)字圖書(shū)館傳統(tǒng)信息過(guò)濾技術(shù)有很大的局限性?;陬I(lǐng)域本體的數(shù)字圖書(shū)館信息過(guò)濾模型最大的特點(diǎn)在于它保留了概念之間以及概念屬性之間的關(guān)系,能夠在復(fù)雜語(yǔ)義層次進(jìn)行邏輯推理。該模型實(shí)現(xiàn)的關(guān)鍵問(wèn)題在于基于領(lǐng)域本體的資源評(píng)價(jià)值轉(zhuǎn)化和基于領(lǐng)域本體的匹配。圖1。表2。參考文獻(xiàn)9。關(guān)鍵詞數(shù)字圖書(shū)館信息過(guò)濾領(lǐng)域本體分類號(hào)G250.76ABSTRACTAfteranalyzingthelimitationsoftraditionalinformationfilteringtechnologiesofdigitallibraries,theauth

2、orsproposeaninformationfilteringmodelofdigitallibrariesbasedondomainontology,andthendiscussitsadvantagesandthekeyproblemsconcerningitsimplementation.1figs.2tabs.9refs.KEYWORDSDigitallibrary.Informationfiltering.Domainontology.CLASSNUMBERG250.76揭示資源所涉及的各種對(duì)象之間的復(fù)雜關(guān)系,1數(shù)字圖書(shū)館傳統(tǒng)信息過(guò)濾技術(shù)的局如數(shù)字圖書(shū)館中的圖書(shū)、作者和出

3、版社之間的限性關(guān)系就會(huì)被丟失。由此,這種方法所描述的用戶興趣模型存在很多盲區(qū),而一些有價(jià)值的資針對(duì)數(shù)字圖書(shū)館“信息過(guò)載”的問(wèn)題,如何源就可能被錯(cuò)誤過(guò)濾。幫助用戶濾除與興趣無(wú)關(guān)的資源已成為當(dāng)前研協(xié)作過(guò)濾的出發(fā)點(diǎn)在于任何人的興趣不是[2]究的重點(diǎn)課題。近幾年,在國(guó)外興起的信息過(guò)孤立的,而是處于某個(gè)群體中。這種技術(shù)的濾技術(shù)成為解決這一問(wèn)題的重要手段。目前,關(guān)鍵是根據(jù)用戶對(duì)資源的評(píng)價(jià)進(jìn)行用戶聚類,信息過(guò)濾技術(shù)主要分為兩類:一類是基于內(nèi)容進(jìn)而依據(jù)與用戶興趣最為相似的用戶組的共同的過(guò)濾;另一類是協(xié)作過(guò)濾。興趣來(lái)判斷該用戶的興趣。其最大優(yōu)點(diǎn)是能夠基于內(nèi)容的過(guò)濾假定每個(gè)用戶是相互獨(dú)立發(fā)現(xiàn)用戶新的興趣

4、,而且由于不依賴于資源內(nèi)操作的,因此,過(guò)濾的結(jié)果只取決于資源與用戶容,不僅適用于文本資源,而且還可以廣泛應(yīng)用興趣模型的匹配程度,即利用資源與用戶興趣于多媒體資源。但是,從方法層次來(lái)看,協(xié)作過(guò)[1]的相似性來(lái)過(guò)濾資源。系統(tǒng)通過(guò)學(xué)習(xí)用戶評(píng)濾技術(shù)并沒(méi)有對(duì)資源作更為細(xì)致的表征,始終價(jià)過(guò)的資源特征來(lái)獲得對(duì)用戶興趣的描述。這是基于資源層次來(lái)描述用戶興趣,最終所生成種技術(shù)的優(yōu)點(diǎn)是簡(jiǎn)單、有效,缺點(diǎn)是難以發(fā)現(xiàn)用的用戶興趣模型的盲區(qū)會(huì)更多。同時(shí),也導(dǎo)致[3]戶新的興趣,只能發(fā)現(xiàn)和用戶已有興趣相似的該種技術(shù)面臨一些難以解決的問(wèn)題:①“稀資源。另外,從實(shí)現(xiàn)方法來(lái)看,基于內(nèi)容的過(guò)濾疏性”問(wèn)題,即如果用戶一般都

5、只對(duì)很少的資源通常利用關(guān)鍵詞來(lái)表征資源,進(jìn)而基于關(guān)鍵詞進(jìn)行評(píng)價(jià),那么整個(gè)數(shù)據(jù)陣將變得非常稀疏,這來(lái)描述用戶興趣。然而,關(guān)鍵詞無(wú)法深層次地種情況帶來(lái)的問(wèn)題就是用戶間相似性的比較不3本文系教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目“面向用戶的點(diǎn)擊流信息資源開(kāi)發(fā)與利用研究”(項(xiàng)目批準(zhǔn)號(hào):08JC870005)的研究成果之一。2009年5月May,2009102JournalofLibraryScienceinChina準(zhǔn)確;②“冷開(kāi)始”問(wèn)題,又稱新資源問(wèn)題,即如似于基于內(nèi)容的過(guò)濾。果一個(gè)新資源沒(méi)有用戶評(píng)價(jià),那么這個(gè)資源就首先,利用本體理論構(gòu)建數(shù)字圖書(shū)館領(lǐng)域往往被系統(tǒng)過(guò)濾了,無(wú)論它對(duì)當(dāng)前用戶是否有本

6、體。這一環(huán)節(jié)是模型的基礎(chǔ)。其次,依據(jù)不價(jià)值;③“灰色綿羊”問(wèn)題,即一位用戶游離于不同用戶對(duì)資源庫(kù)中相關(guān)資源的評(píng)價(jià)值(如果對(duì)同用戶組之間,無(wú)法對(duì)該用戶的興趣進(jìn)行準(zhǔn)確某種資源的評(píng)價(jià)為空,即用戶沒(méi)有評(píng)價(jià),則需要定位;④“可擴(kuò)展性”問(wèn)題,即隨著用戶和資源的進(jìn)行一定的技術(shù)處理),對(duì)用戶進(jìn)行聚類,形成k增多,系統(tǒng)性能會(huì)越來(lái)越低。個(gè)用戶組,使得用戶興趣的相似性在同一用戶同時(shí),基于內(nèi)容的過(guò)濾和協(xié)作過(guò)濾都不能組之間最大化,而在不同用戶組之間最小化,并實(shí)現(xiàn)領(lǐng)域之間的相似性比較。主要原因是,在利用每個(gè)聚類的質(zhì)心點(diǎn)矢量來(lái)表征該用戶組對(duì)不同的領(lǐng)域,資源的表示方法很可能是不同的,[5]資源庫(kù)中相關(guān)資源的評(píng)價(jià)值。

7、再次,利用數(shù)從而增加了跨領(lǐng)域相似性比較的難度。比如,字圖書(shū)館領(lǐng)域本體,將不同用戶組對(duì)資源庫(kù)中在描述圖書(shū)時(shí),就可能不會(huì)采用與電影相同的相關(guān)資源的評(píng)價(jià)值轉(zhuǎn)化為對(duì)概念集中不同概念表示方法。然而,用戶的興趣在某個(gè)范圍內(nèi)是的評(píng)價(jià)值。同樣,用戶A對(duì)資源庫(kù)中相關(guān)資源基本一致的,比如喜歡科幻圖書(shū)的用戶可能對(duì)的評(píng)價(jià)值也可以轉(zhuǎn)化為對(duì)概念集中不同概念的科幻電影也感興趣。評(píng)價(jià)值。最后,基于對(duì)不同概念的評(píng)價(jià),將用戶此外,有學(xué)者綜合基于內(nèi)容的過(guò)濾和協(xié)作A與不同的用戶組進(jìn)行匹配,找到與

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。