資源描述:
《基于本體的中醫(yī)文獻(xiàn)診療信息的智能檢索示范研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、中文摘要基于本體的中醫(yī)文獻(xiàn)診療信息的智能檢索示范研究現(xiàn)代中醫(yī)臨床診療研究開(kāi)始重視從以往的研究和治療經(jīng)驗(yàn)得到論證和指導(dǎo),期刊文獻(xiàn)更新快,文獻(xiàn)數(shù)量大,論文內(nèi)容具有較高的學(xué)術(shù)價(jià)值、比較注意新的趨勢(shì)和發(fā)展等優(yōu)點(diǎn),因此,對(duì)中醫(yī)臨床文獻(xiàn)進(jìn)行有效的檢索至關(guān)重要。本研究旨在設(shè)計(jì)一個(gè)基于中醫(yī)文獻(xiàn)信息本體的智能檢索模型,能夠借助當(dāng)前最新的語(yǔ)義網(wǎng)知識(shí)進(jìn)行本體層次的設(shè)計(jì)和本體概念的研究,從而使檢索模型具備基本的推理能力,提高查全率和查準(zhǔn)率,能將輸出結(jié)果按照相關(guān)性排序并進(jìn)行統(tǒng)計(jì),從檢索到的批量文獻(xiàn)中總結(jié)、發(fā)現(xiàn)和掌握所查專題內(nèi)容的整體發(fā)展?fàn)顩r和遣方用藥規(guī)律。1.
2、研究背景現(xiàn)有的中醫(yī)文獻(xiàn)數(shù)據(jù)庫(kù)大多是針對(duì)文獻(xiàn)外部特征信息建立的,中醫(yī)臨床研究人員很難從檢索到的批量文獻(xiàn)中掌握所查專題內(nèi)容的整體發(fā)展?fàn)顩r。傳統(tǒng)的檢索方式主要通過(guò)關(guān)鍵詞、關(guān)鍵詞串或者主題詞來(lái)進(jìn)行全文檢索,用戶很難表達(dá)其真正的檢索意圖,也很難從檢索結(jié)果提供的大量文獻(xiàn)中提取共性的規(guī)律。由于檢索過(guò)程機(jī)械,不理解語(yǔ)義。導(dǎo)致一方面。檢索結(jié)果中包含大量無(wú)關(guān)信息。另一方面,很多與關(guān)鍵詞同義的信息卻沒(méi)能檢索出來(lái)。其次,大量同領(lǐng)域或者相關(guān)領(lǐng)域的數(shù)據(jù)存儲(chǔ)庫(kù)往往使用不同的標(biāo)識(shí)制度,不兼容的術(shù)語(yǔ)和不同的數(shù)據(jù)格式。目前中醫(yī)藥信息主要以自然描述為主,缺乏知識(shí)層次的科學(xué)
3、表達(dá),沒(méi)有統(tǒng)一的術(shù)語(yǔ)定義,給數(shù)據(jù)的集成和共享造成了一定的困難。2.研究?jī)?nèi)容本研究以中醫(yī)臨床文獻(xiàn)中的診療研究?jī)?nèi)容為對(duì)象,利用本體建設(shè)來(lái)實(shí)現(xiàn)中醫(yī)文獻(xiàn)信息的智能檢索。本研究的研究過(guò)程主要包括確定研究目標(biāo)、需求調(diào)研、數(shù)據(jù)采集、數(shù)據(jù)處理、建立本體、智能檢索模型的設(shè)計(jì)和相關(guān)性排序算法、中醫(yī)臨床文獻(xiàn)的智能檢索模型、系統(tǒng)檢索測(cè)試等八個(gè)部分。2.1確定研究目標(biāo)本研究根據(jù)中醫(yī)醫(yī)生在臨床實(shí)際研究中對(duì)于文獻(xiàn)中所涉及的內(nèi)容的檢索需求,通過(guò)部分中醫(yī)臨床文獻(xiàn)內(nèi)容的語(yǔ)義分析和本體建設(shè),實(shí)現(xiàn)基于中醫(yī)臨床文獻(xiàn)信息的中醫(yī)智能檢索,提高查全率、查準(zhǔn)率和輸出結(jié)果相關(guān)性排序。能
4、將輸出結(jié)中國(guó)中醫(yī)科學(xué)院二oo九級(jí)博士研究生學(xué)位論文果按照相關(guān)性排序并進(jìn)行統(tǒng)計(jì),從檢索到的批量文獻(xiàn)中總結(jié)、發(fā)現(xiàn)和掌握所查專題內(nèi)容的整體發(fā)展?fàn)顩r和遣方用藥規(guī)律。2.2需求調(diào)查2.2.1對(duì)中醫(yī)臨床文獻(xiàn)內(nèi)容的調(diào)研為了基本了解中醫(yī)臨床文獻(xiàn)內(nèi)部診療信息中各項(xiàng)信息出現(xiàn)頻率以及之間的關(guān)系??偨Y(jié)文獻(xiàn)中可以為中醫(yī)臨床診療研究提供的檢索服務(wù)的支撐信息。選取中醫(yī)核心期刊排名前幾名的期刊,對(duì)其所刊登的2006.2007年度的關(guān)于中醫(yī)臨床診療研究的文獻(xiàn)進(jìn)行文獻(xiàn)診療過(guò)程中理、法、方、藥等信息記錄的調(diào)研,發(fā)現(xiàn)臨床作者診療研究的各種具體方向,并抽樣調(diào)查部分文獻(xiàn)中體現(xiàn)的
5、具體數(shù)據(jù)需求。2.2.2對(duì)中醫(yī)臨床醫(yī)生和科研人員檢索需求的調(diào)研為了真正實(shí)現(xiàn)基于中醫(yī)臨床文獻(xiàn)提供臨床診療研究需求的檢索服務(wù),以調(diào)查問(wèn)卷的形式進(jìn)行小規(guī)模的調(diào)查,調(diào)查對(duì)象為三級(jí)甲等醫(yī)院中的初、中、高級(jí)臨床醫(yī)師,共回收有效問(wèn)卷200份。總結(jié)中醫(yī)臨床醫(yī)生在診療研究過(guò)程中對(duì)文獻(xiàn)信息檢索的具體需求。經(jīng)統(tǒng)計(jì)分析后,認(rèn)為臨床醫(yī)師的檢索需求重點(diǎn)停留在病、證、癥及方劑和針灸療法上,并且總結(jié)確定了一些常用檢索式。2.3數(shù)據(jù)采集本研究的目的是實(shí)現(xiàn)中醫(yī)臨床文獻(xiàn)信息的智能檢索,而智能檢索之前必須先確定用戶的檢索需求和檢索的方式、對(duì)象,建立檢索對(duì)象的本體,確定各個(gè)體
6、之間的語(yǔ)義關(guān)聯(lián)關(guān)系。資源庫(kù)是檢索的最基礎(chǔ)的設(shè)施,是實(shí)現(xiàn)智能檢索的最基本的保障,要保證資源庫(kù)中有充足的可供檢索的信息。2.3.1資源庫(kù)本研究選擇了中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所研制的中醫(yī)疾病臨床研究數(shù)據(jù)庫(kù)和中藥藥理實(shí)驗(yàn)數(shù)據(jù)庫(kù)。2.3.2年代’由于資源庫(kù)中共收錄1988年至今的中醫(yī)臨床文獻(xiàn)二十七萬(wàn)余篇,數(shù)據(jù)量龐大,選擇基本已經(jīng)加工完成且年代相對(duì)靠近的2005.2007年發(fā)表于期刊中的中醫(yī)臨床文獻(xiàn)中所涉及的診療內(nèi)容。2.3.3原則臨床文獻(xiàn)篇數(shù)比較多的疾病。所研究的對(duì)象一定要有一定的文獻(xiàn)量,能展現(xiàn)所選年度內(nèi)的臨床研究熱點(diǎn)和多發(fā)疾病的診療情況。
7、6基于本體的中醫(yī)文獻(xiàn)診療信息的智能檢索示范研究2.3.4內(nèi)容選取診療研究過(guò)程中涉及的疾病、證候、癥狀、治則、方劑、中藥、穴位、藥理分類等內(nèi)容。2.4數(shù)據(jù)處理本研究將實(shí)施的本體建設(shè)和智能檢索將基于已有的資源庫(kù)進(jìn)行,因此要對(duì)資源庫(kù)中的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和規(guī)范整理。2.4.1參考標(biāo)準(zhǔn)數(shù)據(jù)處理必須遵循一定的原則,本研究選取美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館研制的Mesh主題詞表和中國(guó)中醫(yī)研究院中醫(yī)藥信息研究所編制的中醫(yī)藥學(xué)主題詞表為最基本的詞表,并選取部分國(guó)標(biāo)、《中華人民共和國(guó)藥典》、《中藥大辭典》等等作為詞表的補(bǔ)充。2.4.2規(guī)范流程首先將各字段內(nèi)容與標(biāo)準(zhǔn)詞
8、表中的正名進(jìn)行匹配,匹配失敗的詞語(yǔ)與異名進(jìn)行匹配,仍然無(wú)法與異名匹配的詞語(yǔ)將納入相似度計(jì)算范圍,與詞表中的正異名分別用Jaccard公式進(jìn)行相似度計(jì)算。根據(jù)計(jì)算結(jié)果,結(jié)合人為分析,進(jìn)行初步的詞語(yǔ)規(guī)范。由于各字段的采集狀況