淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究

淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究

ID:6207523

大?。?0.00 KB

頁數(shù):8頁

時間:2018-01-06

淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究_第1頁
淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究_第2頁
淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究_第3頁
淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究_第4頁
淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究_第5頁
資源描述:

《淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、淺議基于內(nèi)容過濾數(shù)字圖書館推薦系統(tǒng)探究  【摘要】隨著管理系統(tǒng)的廣泛應(yīng)用,信息數(shù)據(jù)在飛速增長,一方面人們擁有了海量的信息資源,另一方面人們尋找合適信息的時間成本和難度也增加了。目前廣泛采用的信息檢索技術(shù)只能夠向用戶提供數(shù)量巨大的、缺乏個性化的檢索結(jié)果。推薦系統(tǒng)是一個由人、計算機(jī)軟硬件和數(shù)據(jù)資源共同組成的系統(tǒng),它把用戶對目標(biāo)對象的使用、評價等相關(guān)數(shù)據(jù)按照特定算法模型進(jìn)行處理,根據(jù)處理的結(jié)果形成推薦列表,進(jìn)而為用戶選擇決策時提供推薦參考。本文就基于內(nèi)容過濾的數(shù)字圖書館推薦系統(tǒng)展開研究和探討?!娟P(guān)鍵詞】內(nèi)容過濾;數(shù)字圖書館;推薦系統(tǒng)1.基于內(nèi)容過濾的推薦方法的特點1.

2、1基于內(nèi)容過濾的圖書推薦系統(tǒng)的原理基于內(nèi)容的推薦系統(tǒng)(Content-basedRecommendation)也被一些學(xué)者稱為“Fea-turebasedRecommendation”,其技術(shù)方法主要源于“信息檢索(InformationRetrieval,IR)”。最初的基于內(nèi)容的推薦系統(tǒng)根據(jù)用戶對內(nèi)容的偏好,自動檢索過濾眾多內(nèi)容,選擇一些與用戶偏好匹配度高的信息推薦給用戶。8基于內(nèi)容過濾的圖書推薦系統(tǒng)根據(jù)讀者的興趣向量在圖書特征向量中自動尋找與之匹配的產(chǎn)品,并依據(jù)相似度的高低順序,產(chǎn)生推薦圖書序列表,進(jìn)而主動向讀者推薦產(chǎn)品。讀者興趣向量主要包括讀者的專業(yè)、學(xué)

3、歷、導(dǎo)師等身份信息和歷史借閱、查詢數(shù)據(jù)等信息,據(jù)此建立讀者模型。圖書特征向量主要是指經(jīng)過人工著錄的圖書書目數(shù)據(jù)庫,包含了書名、責(zé)任者、主題詞、出版社、ISBN、出版日期等信息。當(dāng)某本圖書的特征向量與讀者的興趣特征向量產(chǎn)生較大交集(即較大效用值)時,系統(tǒng)就把該圖書作為讀者的備選推薦產(chǎn)品。系統(tǒng)再依據(jù)效用值的大小對備選產(chǎn)品進(jìn)行排序,最后向用戶推薦?;趦?nèi)容過濾的圖書推薦系統(tǒng)的主要分為以下四個步驟:(1)讀者興趣向量的建模與表達(dá),圖書特征向量的建模與表達(dá);(2)在同一向量空間下,計算讀者興趣特征向量與圖書特征向量的相似度;(3)根據(jù)相似度的大小對結(jié)果進(jìn)行排序,取前幾位圖

4、書產(chǎn)生推薦列表;(4)若讀者興趣特征模型產(chǎn)生更新,或增加新的圖書特征向量模型則返回步驟1。1.2基于內(nèi)容過濾的推薦系統(tǒng)的優(yōu)點和存在問題8基于內(nèi)容過濾的推薦系統(tǒng)利用資源和用戶興趣的相似性來過濾信息,它的關(guān)鍵問題是相似性計算,優(yōu)點是簡單、有效,缺點是難以區(qū)分資源內(nèi)容的品質(zhì)和風(fēng)格,而且不能為用戶發(fā)現(xiàn)新的感興趣的資源,只能發(fā)現(xiàn)和用戶已有興趣相似的資源。基于內(nèi)容過濾的推薦系統(tǒng)根據(jù)用戶查詢內(nèi)容而進(jìn)行推薦,其推薦結(jié)果具有短期效應(yīng),適合電子購物系統(tǒng)。而對于擁有長期用戶的系統(tǒng)來說,則沒有充分利用用戶的歷史數(shù)據(jù)尤其是相似用戶的相關(guān)數(shù)據(jù),缺乏推薦潛在興趣產(chǎn)品的功能。1.3內(nèi)容過濾推薦

5、系統(tǒng)有利于充分開發(fā)數(shù)字圖書館資源數(shù)字圖書館的建設(shè)不應(yīng)該僅考慮組織眾多的數(shù)字化資源,被動地等待用戶前來選擇,而應(yīng)以用戶為中心,整合數(shù)字資源,提供主動的信息服務(wù)。構(gòu)建一個融多種技術(shù)為一體的信息推薦系統(tǒng)。在數(shù)字圖書館的環(huán)境下,圖書文獻(xiàn)信息的種類和數(shù)量都非常多,用戶不可能像在實際的圖書館那樣直接選取所需的文獻(xiàn)資料。因此,數(shù)字圖書館應(yīng)該充分揭示有關(guān)信息,自動推薦用戶可能感興趣的圖書文獻(xiàn),實現(xiàn)數(shù)字資源的深層次挖掘分析,提高其使用價值。1.4基于內(nèi)容過濾推薦是數(shù)字圖書館環(huán)境下的基本需要數(shù)字圖書館具有信息量龐大、內(nèi)容繁雜、形式多樣、數(shù)據(jù)對象異構(gòu)、分布式存儲等特征,用戶選擇和利用

6、所需信息比較困難。數(shù)字化圖書館雖然提供服務(wù)的方式與傳統(tǒng)圖書館有些不同,但為用戶提供高質(zhì)量的服務(wù)的職能卻沒有改變。通過對信息資源的推薦有助于用戶作出正確的評價和選擇,使價值高的信息資源能夠充分被利用。2.基于讀者文件的內(nèi)容推薦算法8為了計算讀者與推薦圖書的相似度,首先需要將讀者的興趣表達(dá)出來以供系統(tǒng)識別和計算。讀者的興趣在系統(tǒng)中表示成讀者興趣文件,文件應(yīng)該包括讀者興趣的內(nèi)容并用系統(tǒng)可以理解的形式表達(dá)出來。讀者興趣文件是圖書推薦系統(tǒng)的重要組成部分,是推薦算法的重要依據(jù)。讀者的興趣主要受到讀者的專業(yè)、身份、借閱行為等信息影響。根據(jù)系統(tǒng)建模工程方法,本文將讀者的信息抽象

7、為屬性和操作。讀者的屬性主要指讀者的專業(yè)、身份、職稱、研究方向等較為固定的靜態(tài)信息。這些可以從圖書館管理系統(tǒng)的讀者數(shù)據(jù)庫中獲取,也可以通過讀者自行修改完善個人信息而獲得。讀者的操作主要是指借閱、查詢等行為信息。該信息可以從圖書館管理系統(tǒng)中的流通數(shù)據(jù)庫中獲得。本文假定讀者在圖書管理系統(tǒng)中的操作行為都因興趣動機(jī)而起,因此操作行為可以反映讀者的興趣特征。于是本文通過對操作行為的研究揭示讀者興趣。根據(jù)興趣的時效性,將用戶的興趣模型概括為近期興趣和長期興趣。近期興趣主要依據(jù)讀者的近期借閱、查詢行為而產(chǎn)生,具有高效用性、亟需性和短期性等特性。長期興趣主要依據(jù)讀者的專業(yè)、身份

8、等靜態(tài)屬性而產(chǎn)生,具有高

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。