基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究

基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究

ID:33545114

大?。?58.79 KB

頁數(shù):5頁

時(shí)間:2019-02-27

基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究_第1頁
基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究_第2頁
基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究_第3頁
基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究_第4頁
基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究_第5頁
資源描述:

《基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、第11卷第18期2011年6月科學(xué)技術(shù)與工程Vol.11No.18June20111671—1815(2011)18-4223-05ScienceTechnologyandEngineering2011Sci.Tech.Engng.計(jì)算機(jī)技術(shù)基于數(shù)據(jù)元的數(shù)據(jù)集成技術(shù)研究時(shí)貴英文必龍王志寶(東北石油大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,大慶163318)摘要針對(duì)當(dāng)前數(shù)據(jù)集成方法只能精確到屬性級(jí)映射的缺陷,提出了基于數(shù)據(jù)元的數(shù)據(jù)集成方法。用數(shù)據(jù)元語義樹對(duì)實(shí)體屬性概念的內(nèi)涵進(jìn)行語義描述,使實(shí)體屬性的語義能被計(jì)算機(jī)理解。然后通過語義計(jì)算實(shí)現(xiàn)精確到實(shí)例級(jí)的語義映射

2、,從而完成數(shù)據(jù)集成。關(guān)鍵詞數(shù)據(jù)集成數(shù)據(jù)元語義樹語義映射中圖法分類號(hào)TP311.11;文獻(xiàn)標(biāo)志碼A在我國信息化建設(shè)過程中,由于時(shí)間或部門不缺少對(duì)數(shù)據(jù)模式元素進(jìn)行精確描述的語義方法。同,使得各企業(yè)開發(fā)了眾多彼此獨(dú)立的信息系統(tǒng),本文提出的基于數(shù)據(jù)元的數(shù)據(jù)集成方法,通過對(duì)概積累了大量豐富的數(shù)據(jù)資源。隨著企業(yè)規(guī)模的擴(kuò)念的內(nèi)涵進(jìn)行形式化的語義描述,可以實(shí)現(xiàn)不同模大和計(jì)算機(jī)技術(shù)的發(fā)展,企業(yè)信息化建設(shè)勢(shì)在必型之間,乃至實(shí)例級(jí)的語義映射。行。然而,由于建設(shè)時(shí)期不同,開發(fā)部門不同、使用設(shè)備不同、技術(shù)發(fā)展階段不同等原因,使得數(shù)據(jù)存1數(shù)據(jù)元簡介儲(chǔ)管理極為分散,造成了大

3、量的數(shù)據(jù)冗余和數(shù)據(jù)不一致性,形成了眾多的信息孤島,使得數(shù)據(jù)資源難數(shù)據(jù)元是用一組屬性描述定義、標(biāo)識(shí)、表示和以共享訪問。數(shù)據(jù)集成的核心任務(wù)是要將互相關(guān)允許值的數(shù)據(jù)單元,是在一定的環(huán)境下不必要再細(xì)聯(lián)的分布式異構(gòu)數(shù)據(jù)源集成到一起,使用戶能夠以分的最小數(shù)據(jù)單位。數(shù)據(jù)元是可識(shí)別和可定義的,透明的方式訪問這些數(shù)據(jù)源[1]。每個(gè)數(shù)據(jù)元都有其基本屬性,如:名稱、定義、數(shù)據(jù)近年來,基于本體[2—5]的數(shù)據(jù)集成方法研究受類型、精度、值域等。一個(gè)數(shù)據(jù)元由數(shù)據(jù)元概念和到了高度的關(guān)注?;诒倔w的數(shù)據(jù)集成方法是建表示兩部分組成。數(shù)據(jù)元概念(DataElementCon-ce

4、pt)是能以數(shù)據(jù)元的形式表示,且以任何特定的表立全局本體和具體數(shù)據(jù)源的局部本體,以及全局本示法無關(guān)的一種概念。當(dāng)一個(gè)表示被聯(lián)合到一個(gè)體和局部本體、局部本體之間的映射關(guān)系,完成異數(shù)據(jù)概念時(shí)就能夠產(chǎn)生一個(gè)數(shù)據(jù)元。構(gòu)數(shù)據(jù)源之間語義上的映射,最后將這種語義上的按照國家標(biāo)準(zhǔn),數(shù)據(jù)元分為數(shù)據(jù)元概念、通用對(duì)應(yīng)關(guān)系轉(zhuǎn)換為數(shù)據(jù)查詢,完成數(shù)據(jù)集成。但是基數(shù)據(jù)元、應(yīng)用數(shù)據(jù)元。通用數(shù)據(jù)元提供的是一般的于本體的研究方法僅考慮了模型概念的外延即概內(nèi)容,而非具體內(nèi)容,具體內(nèi)容則由應(yīng)用數(shù)據(jù)元提念之間的關(guān)系,沒有考慮概念的內(nèi)涵,對(duì)實(shí)體屬性出。如通用數(shù)據(jù)元可指“日期”、“姓名”,

5、而引伸出的語義只能依靠自然語言描述或分析模型的結(jié)構(gòu),來的應(yīng)用數(shù)據(jù)元可以更為具體,如“考試日期”、“入2011年3月25日收到學(xué)日期”、“學(xué)生姓名”、“教師姓名”等。應(yīng)用數(shù)據(jù)元第一作者簡介:時(shí)貴英(1977—),女,漢族,河北石家莊人,碩士,東規(guī)定為一個(gè)獨(dú)立應(yīng)用的數(shù)據(jù)范疇。一個(gè)應(yīng)用數(shù)據(jù)北石油大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院講師,研究方向:計(jì)算機(jī)軟件工元必須來自某個(gè)通用數(shù)據(jù)元,遵循通用數(shù)據(jù)元給出程與集成技術(shù)。E-mail:dqpisgy@163.com。的框架。一個(gè)數(shù)據(jù)模型中的數(shù)據(jù)項(xiàng)由于限定于數(shù)4224科學(xué)技術(shù)與工程11卷據(jù)模型的應(yīng)用范圍,因此是一個(gè)應(yīng)用數(shù)

6、據(jù)元。圖1抽象語義樹通常對(duì)應(yīng)一個(gè)通用數(shù)據(jù)元,通過附加規(guī)描述了用于數(shù)據(jù)元結(jié)構(gòu)的術(shù)語與傳統(tǒng)的數(shù)據(jù)建模則節(jié)點(diǎn)可派生各種應(yīng)用數(shù)據(jù)元。在數(shù)據(jù)元的語義術(shù)語的關(guān)聯(lián),在數(shù)據(jù)模型中,一個(gè)數(shù)據(jù)項(xiàng)可以等同樹中,特定節(jié)點(diǎn)是根節(jié)點(diǎn),對(duì)象類可被其它限定詞于一個(gè)數(shù)據(jù)元,數(shù)據(jù)模型的數(shù)據(jù)元名稱的典型形式進(jìn)一步限定。在對(duì)數(shù)據(jù)模型中的數(shù)據(jù)項(xiàng)進(jìn)行描述是實(shí)體名稱和實(shí)體屬性名稱的合成,如圖2所示。時(shí),由于數(shù)據(jù)項(xiàng)與具體應(yīng)用場(chǎng)景有關(guān),所以在相應(yīng)的數(shù)據(jù)元的語義描述上增加應(yīng)用場(chǎng)景約束,才能真正地描述該數(shù)據(jù)項(xiàng)在數(shù)據(jù)模型中的語義。數(shù)據(jù)項(xiàng)數(shù)據(jù)元以屬性、實(shí)體、約束為中心,通過對(duì)實(shí)體進(jìn)行直接限定和間接限定

7、,構(gòu)成對(duì)數(shù)據(jù)模型數(shù)據(jù)項(xiàng)語義的完整描述,圖4所示。圖1數(shù)據(jù)元結(jié)構(gòu)圖2數(shù)據(jù)模型中的數(shù)據(jù)元圖4數(shù)據(jù)項(xiàng)的語義樹[6]2數(shù)據(jù)元的語義樹描述方法3基于數(shù)據(jù)元語義樹的映射實(shí)現(xiàn)基于數(shù)據(jù)元的數(shù)據(jù)集成需要解決的一個(gè)關(guān)鍵3.1語義樹中各節(jié)點(diǎn)的權(quán)值分配規(guī)則問題是語義的描述方法,本文采用的是語義樹的描設(shè)N為語義樹T中的任意一個(gè)節(jié)點(diǎn),以N為根述方法,語義樹提供了一種形式化的語義描述方的子樹記為sub(N),N的子節(jié)點(diǎn)數(shù)為n,N的第i個(gè)式,可以方便地描述數(shù)據(jù)元的語義。子節(jié)點(diǎn)記為child(N,i),節(jié)點(diǎn)N的權(quán)記為W(T,N),子樹sub(N)的權(quán)記為W(sub(N))。語義

8、樹中各節(jié)點(diǎn)的權(quán)值分配規(guī)則如下:(1)W(T)=1;(2)W(sub(N))=W(T,N)+n∑W(sub(child(N,i)));i=11(3)W(

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。