資源描述:
《基于網(wǎng)格的異構(gòu)數(shù)據(jù)庫集成技術(shù)研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、哈爾濱T稗大學(xué)碩十學(xué)伊論文圖1.1數(shù)據(jù)倉庫體系結(jié)構(gòu)2.聯(lián)邦數(shù)據(jù)庫系統(tǒng)聯(lián)邦數(shù)據(jù)庫系統(tǒng)(FederatedDatabaseSystem,F(xiàn)DBS)【4】是由參與聯(lián)邦的半自治的數(shù)據(jù)庫系統(tǒng)組成,目的是實現(xiàn)數(shù)據(jù)庫系統(tǒng)間部分數(shù)據(jù)的共享。聯(lián)邦中的每個數(shù)據(jù)庫的操作是獨立于其它數(shù)據(jù)庫和聯(lián)邦的,之所以叫“半自治’’是因為聯(lián)邦中的所有數(shù)據(jù)庫都添加了彼此訪問的接口。對這些半自治數(shù)據(jù)庫的操作進行控制和協(xié)調(diào)的軟件,稱為聯(lián)邦數(shù)據(jù)庫管理系統(tǒng)(FederatedDatabaseManagementSystem,F(xiàn)DBMS)。FDBMS是一個管理中心,它能把各成員
2、數(shù)據(jù)庫模式映射到一個公共的聯(lián)邦模式,負責各種模式之間的轉(zhuǎn)換工作,自動解決網(wǎng)絡(luò)傳輸問題和異構(gòu)數(shù)據(jù)庫操縱問題,接受聯(lián)邦用戶的數(shù)據(jù)請求,把這個請求翻譯后送到各個目的數(shù)據(jù)庫引擎,并將收到的結(jié)果數(shù)據(jù)集成后返回給用戶。FDBS中實現(xiàn)互操作最常用的方法是將每個數(shù)據(jù)庫模式分別和其它所有數(shù)據(jù)庫模式進行映射,這樣聯(lián)邦中需要建立n(n.1)個模式映射規(guī)則,但當參與聯(lián)邦的數(shù)據(jù)庫很多(n值很大)時,建立映射規(guī)則的任務(wù)將變得很復(fù)雜而難于實現(xiàn)。所以,聯(lián)邦數(shù)據(jù)庫集成系統(tǒng)適合于自治數(shù)據(jù)庫的數(shù)量比較小的情況,希望各數(shù)據(jù)庫有較好的自治性,允許用戶單獨查詢,數(shù)據(jù)庫間能
3、夠彼此聯(lián)合回答查詢的情況。其體系結(jié)構(gòu)如圖1.2所示。哈爾濱T稃人學(xué)碩十學(xué)位論文圖1.2聯(lián)邦數(shù)據(jù)厙體系結(jié)構(gòu)3.中介系統(tǒng)中介系統(tǒng)則是一種軟件結(jié)構(gòu),支持虛擬視圖或視圖集合。它不存儲任何實際數(shù)據(jù),作用是在用戶提交了一個查詢后,將用戶查詢翻譯成一個或多個對數(shù)據(jù)源的查詢。然后將數(shù)據(jù)源的查詢結(jié)果進行綜合處理,匯總并將之返回給用戶。用戶的查詢基于中間模式,不必知道每個專門的數(shù)據(jù)源的特點,查詢執(zhí)行引擎直接與包裝器(Wrapper)打交道,將基于中間件模式的查詢轉(zhuǎn)換為基于各個局部數(shù)據(jù)源的模式。中間件模式更適應(yīng)于數(shù)據(jù)源數(shù)目多、各局部數(shù)據(jù)源的自治性很高
4、且局部數(shù)據(jù)經(jīng)常變化的Web環(huán)境。而且XML的出現(xiàn)使得對各種數(shù)據(jù)信息的標準化描述成為可能,使系統(tǒng)更易于適應(yīng)的空間的不同。中介系統(tǒng)與緊耦合聯(lián)邦數(shù)據(jù)庫相比較有如下優(yōu)點:中介系統(tǒng)可以集成非數(shù)據(jù)庫數(shù)據(jù)源,基于中介器(Mediator)的系統(tǒng)中的數(shù)據(jù)源的查詢能力可以是受限制的,數(shù)據(jù)源可以不支持SQL查詢;中介系統(tǒng)中的數(shù)據(jù)源是完全自治的,這就意味著很容易向/從系統(tǒng)中添加/刪除數(shù)據(jù)源【5】。中介系統(tǒng)的主要部分是中介器和針對每個數(shù)據(jù)源的包裝器(Wrapper)。這里中介器的功能是接收針對全局模式生成的查詢,根據(jù)數(shù)據(jù)源描述信息及映射規(guī)則將接收的查詢
5、分解成每個數(shù)據(jù)源的子查詢,再根據(jù)數(shù)據(jù)源描述信息優(yōu)化查詢計劃,最后將子查詢發(fā)送到每個數(shù)據(jù)源包裝器。包裝器將這些子查詢翻譯成符合每個數(shù)據(jù)源模型和模式的查詢,并把查詢結(jié)果返回給中介器。中介器將接收的所有數(shù)據(jù)源的結(jié)果合并成一個結(jié)果返回給用戶。4哈爾濱T程大學(xué)碩十學(xué)伊論文網(wǎng)格環(huán)境所面對的是大量的分布式異構(gòu)數(shù)掘源且數(shù)據(jù)源吏新頻繁,兇此基于網(wǎng)格的數(shù)據(jù)庫集成通常采用的是中介系統(tǒng)的方法,這不僅可以避免聯(lián)邦數(shù)據(jù)系統(tǒng)對聯(lián)邦中數(shù)據(jù)源數(shù)量的限制,也可以避免數(shù)據(jù)倉庫中無法對數(shù)據(jù)進行實時查詢的缺點。國外對于基于網(wǎng)格的數(shù)據(jù)庫集成相關(guān)研究工作起步較早,水平較高,
6、成果較多。其中比較著名的項目有Spitfiret61、OGSA.DQp[r]、Oracle109[8】和開放網(wǎng)格服務(wù)架構(gòu).數(shù)據(jù)訪問和集成(OpenGridServicesArchitecture.DataAccessandIntegration,OGSA.DAI)【9J等。國內(nèi)在數(shù)據(jù)網(wǎng)格方面的相關(guān)研究仍處于起步階段,但已有一些成功的范例,科學(xué)數(shù)據(jù)網(wǎng)格(ScientificDataGrid,SDG)【loJ就是其中的典型應(yīng)用。Spitfire和OGSA.DQP是嘗試在網(wǎng)格中管理數(shù)據(jù)庫的項目。Spitfire使用WebService
7、技術(shù)提供基于SOAP的遠程過程調(diào)用來對數(shù)據(jù)庫進行操作如對一行或幾行的查詢插入等,但它不能處理大數(shù)據(jù)集和一些復(fù)雜的操作。OGSA-DQP的目的是為了提供有效的數(shù)據(jù)服務(wù)編排功能,并對數(shù)據(jù)服務(wù)進行查詢和分析。它由GDQS和GES兩部分組成。GDQS是一個協(xié)調(diào)器,它能夠?qū)Σ樵冋Z句進行編譯、優(yōu)化、劃分和調(diào)度,并生成查詢計劃;GES是一個評估器,被用于執(zhí)行查詢計劃并獲取相應(yīng)的數(shù)據(jù)。不過它有三個明顯的缺點:一是使用的查詢語言是OQL,需要用戶重新學(xué)習(xí);二是GDQS使用的編譯期是基于Polar水的,依賴于Linux平臺,且安裝使用復(fù)雜;三是DQ
8、P還不太完善,很多功能還在進展之中。Oracle109是美國Oracle公司推出的第一個真正的網(wǎng)格數(shù)據(jù)庫。Oracle109作為網(wǎng)格資源的使用方、服務(wù)和數(shù)據(jù)的提供方,對數(shù)據(jù)庫利用存儲和服務(wù)器的方式進行了虛擬化,自動地將集群化的存儲器和服務(wù)器供應(yīng)給網(wǎng)格中的不同數(shù)據(jù)