資源描述:
《大數據環(huán)境下領域本體構建框架研究》由會員上傳分享,免費在線閱讀,更多相關內容在應用文檔-天天文庫。
1、summarizesconclusionsforconstructionofdomainontologyforbigdata,proposesmethodologicalframeworksforbuildingdomainontologythatcanbuildaYangshengdomainontology.Comparedwithotherdomainontology,thedomainontologyofYangshengaccordingtomethodologyhassomeoutstandingfeatures,suchasreusability,s
2、calability,etc..Therefore,thispaperprovidesreferencetoquicklybuilddomainontologyinthebigdataera.Keyword:Bigdata;Domainontology;Knowledgeorganization;Yangsheng;Received:2017年6月[引用本文格式]付苓.大數據環(huán)境下領域本體構建框架研宂[JL圖書館,2017(11):66—711引言大數據環(huán)境下,信息資源呈幾何速度増長且高速變化,數據源多樣并且價值密度低。由于數據的數量、多樣性、速度和價值密度,在大
3、數據環(huán)境下處理相關數據變得越來越困難。大數據的主要挑戰(zhàn)是從結構化和非結構化數據中提取有價值信息。為了處理它們的復雜性,必須將數據分解為知識。木體為此提供了解決方案,因為本體提供了某一領域的明確的和機器可理解的概念化說明。本體是某一領域的共享概念化的規(guī)范說明m,提供特定領域的共享和對重用的知識。一般來說,本體旨在向原始數據添加語義,解決異質性問題,允許推理和推斷。因此,基于大數據構建領域木體是非常有趣的。隨著網上和各領域有效木體數量大量增加,木體構建成為再利用過程m。木體復用關注點不同,如:(1)其他本體,DOLCE1位1,SUM0B1,0B0X51;(2)本體模塊
4、[6-8];(3)非本體資源,如敘詞表,詞表和分類表等,導致本體復用水平不同。本體開發(fā)可表述為構建一個本體網絡M,但由于本體構建過程中缺乏統(tǒng)一清晰、規(guī)范完善的框架和依據,目前已有領域本體復用和整合效果較弱,面對數據量巨大、數據類型多、價值密度低、高速變化[10]的大數據,從構建過程、生命周期、支持構建過程的方法、技術和工具等方面建立統(tǒng)一的領域本體構建方法論,從應用角度方面實現領域本體構建是亟待解決的問題。為了滿足用戶從巨量數據中快速有效獲取有價值信息的需求,本文提出了一種適合大數據特征的本體構建方法。2相關研究NeOn提出一種棊于場景的本體構建方法,支持不同本體開
5、發(fā)過程,支持分布式環(huán)境中網絡化本體的動態(tài)演化,支持不同人員(領域專家和構建人員等)在本體開發(fā)過程的不同階段闡述知識M,旨在通過本體網絡進行大規(guī)模語義應用。NeOn項目設計了9個木體構建場景:從頭開始創(chuàng)建;重用和重建非木體資源;重用本體資源;重用和重構本體資源;重用和整合本體資源;重用、整合、重構本體資源;重用本體設計模型;重組本體資源;本體資源本地化[11]。浼業(yè)本體化網絡mi首先確定本體領域的范圍及包括的數據,然后根據場景1、2、3、7、5構建本體,包括HGIS的漁業(yè)時間序列參考表、AGROVOC、ASFA、漁業(yè)和水產的分面表、FAO地理木體。基于參考表數據重組
6、為木體,用來索引時間序列,是核心木體。STKOS項目組[13]在NeOn本體構建方法基礎上提出了STKOS本體構建方法。馬雨萌等ill!提出丫構建STKOS屮學科領域本體模型的3層架構,并以屮國科學院植物研宄所為例,闡述領域本體模型3層架構模型在構建植物多樣性領域本體的應用。根據概念是否面向學科領域及其描述層次,領域本體研究層次主要分為無只體學科特征的頂層木體、表達學科共有特征的領域上層木體、面向具體建設目標的領域應用本體三方面[15]。Abbes和Gargouriii虹認為手工構建本體是非常困難和容易出錯的工作,提出了一種自動化本體構建方法,它是基于MongoD
7、B數據庫中的數據獲取OWL本體。從MongoDB數據庫學習本體的方法是基于將MongoDB結構映射到OWL本體的轉換規(guī)則U21,伍括五個主要步驟:創(chuàng)建木體框架:學習概念屬性;識別個體:推導出類公理、屬性公理和約束;用類定義運算符(交、并、補)來豐富本體。最后使用“NorthWind”數據庫通過工具M20nto(MongoDB到本體)驗證了此方法的有效性。表1大數據和大規(guī)模語義應用中木體構建方法比較Jirkovsky等[18]和Bansal等提出了大數據集成應用中本體構建方法。Jirkovskf等提出了創(chuàng)建共享本體解決大數據語義異質性問題。首先,處理不同類型的數據源
8、,如文本文