版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-主數(shù)據(jù)庫(kù)

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶(hù)提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

概述

主數(shù)據(jù)庫(kù)(master database,MDB),簡(jiǎn)稱(chēng)主庫(kù),就是集中存儲(chǔ)管理歷史歸檔數(shù)據(jù)的場(chǎng)所,它永久保管具有長(zhǎng)期保留價(jià)值、有共享需求的、經(jīng)過(guò)數(shù)據(jù)質(zhì)量檢查驗(yàn)證的、規(guī)范化的數(shù)據(jù)。加載進(jìn)入主數(shù)據(jù)庫(kù)后的數(shù)據(jù),原則上不允許進(jìn)行更改;主數(shù)據(jù)庫(kù)一般不直接支持處理解釋等專(zhuān)業(yè)應(yīng)用軟件的數(shù)據(jù)存??;主數(shù)據(jù)庫(kù)面向數(shù)據(jù)管理和共享查詢(xún),通過(guò)管理平臺(tái)支持用戶(hù)的數(shù)據(jù)存取,通過(guò)數(shù)據(jù)接口為項(xiàng)目庫(kù)提供數(shù)據(jù)支持。數(shù)據(jù)庫(kù)的數(shù)據(jù)主要來(lái)源于數(shù)據(jù)源頭的各類(lèi)專(zhuān)業(yè)數(shù)據(jù)庫(kù)以及項(xiàng)目研究成果的歸檔。

建立主數(shù)據(jù)庫(kù)的目的主要是統(tǒng)一管理數(shù)據(jù)資產(chǎn),包括大宗的原始數(shù)據(jù)和處理解釋結(jié)果數(shù)據(jù)。采用主數(shù)據(jù)庫(kù)技術(shù),可以有效地解決由于數(shù)據(jù)管理分散凌亂,數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一造成數(shù)據(jù)管理在時(shí)間和資源方面的浪費(fèi)。

主數(shù)據(jù)庫(kù)首先是一種信息管理模式,它確立了類(lèi)似于銀行運(yùn)作形式的專(zhuān)業(yè)化統(tǒng)一管理;主數(shù)據(jù)庫(kù)又是一種解決方案它提出了一套開(kāi)發(fā)數(shù)據(jù)的邏輯組織方式和物理存儲(chǔ)形式,定義了軟件平臺(tái)數(shù)劇管理和查詢(xún)功能的框架,確立了系統(tǒng)的基本構(gòu)成。主數(shù)據(jù)庫(kù)的核心是數(shù)據(jù)庫(kù),同時(shí)又具有其鮮明的特點(diǎn)。1

特點(diǎn)有別于一般的信息系統(tǒng)或應(yīng)用軟件系統(tǒng),主數(shù)據(jù)庫(kù)的主要特點(diǎn)有:

第一,主數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù)是經(jīng)過(guò)嚴(yán)格質(zhì)量控制、作為永久歸檔的信息資產(chǎn);

第二,主數(shù)據(jù)庫(kù)的信息平臺(tái)綜合了Web技術(shù)和數(shù)據(jù)庫(kù)技術(shù);

第三,以石油勘探為例,主數(shù)據(jù)庫(kù)支持標(biāo)準(zhǔn)的石油數(shù)據(jù)模型(如POSC Epicenter、PPDM等),其中,POSC中心數(shù)據(jù)模型Epicenter是目前國(guó)際石油行業(yè)最高度概括和抽象的油氣勘探開(kāi)發(fā)數(shù)據(jù)模型,支持地球物理、井筒、地質(zhì)、地理信息等各類(lèi)信息的關(guān)聯(lián)存儲(chǔ);

第四,主數(shù)據(jù)庫(kù)支持三級(jí)存儲(chǔ)方式:online(磁盤(pán))、nearline(自動(dòng)帶庫(kù))、offline(脫機(jī)磁帶架)和大容量高密存儲(chǔ)介質(zhì);

第五,主數(shù)據(jù)庫(kù)提供對(duì)部分應(yīng)用軟件的直接數(shù)據(jù)支持和外部數(shù)據(jù)的連接。1

基本功能數(shù)據(jù)整理數(shù)據(jù)整理是主數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)行維護(hù)過(guò)程的一個(gè)重要環(huán)節(jié),也是主數(shù)據(jù)庫(kù)系統(tǒng)必備的功能手段。數(shù)據(jù)在進(jìn)入主數(shù)據(jù)庫(kù)存儲(chǔ)之前必須經(jīng)過(guò)規(guī)范化處理,由數(shù)據(jù)管理人員對(duì)數(shù)據(jù)質(zhì)量進(jìn)行檢查和驗(yàn)證,將不可用或不符合要求的數(shù)據(jù)剔除,為加載數(shù)據(jù)作準(zhǔn)備。主數(shù)據(jù)庫(kù)系統(tǒng)提供的數(shù)據(jù)整理的主要功能包括圖像掃描電子化、地震磁帶轉(zhuǎn)儲(chǔ)、磁帶編目等。

數(shù)據(jù)管理與維護(hù)主數(shù)據(jù)庫(kù)的管理功能主要包括數(shù)據(jù)加載、數(shù)據(jù)索引、數(shù)據(jù)授權(quán)、數(shù)據(jù)編輯修改、數(shù)據(jù)名份與恢復(fù)等。以下將分別加以介紹。

(1)數(shù)據(jù)加載:主數(shù)據(jù)庫(kù)系統(tǒng)提供了方便的加載工具,以支持不同類(lèi)型數(shù)據(jù)的加載,并且能夠通過(guò)邏輯相關(guān)的數(shù)據(jù)進(jìn)行橫向關(guān)聯(lián)索引。同時(shí)該加載工具還能進(jìn)行數(shù)據(jù)的邏輯一致性檢查校驗(yàn),以確保標(biāo)記在主數(shù)據(jù)庫(kù)的所有記錄(出現(xiàn))的唯一性,并將相關(guān)數(shù)據(jù)組織在一起。例如,Petrobank系統(tǒng)在對(duì)地震數(shù)據(jù)的加犁過(guò)程中,首先按照標(biāo)準(zhǔn)格式加載地震導(dǎo)航(測(cè)網(wǎng))數(shù)據(jù),之后在加載地震數(shù)據(jù)體時(shí),要讀取帶頭信息,并與前面加載的導(dǎo)航數(shù)據(jù)進(jìn)行匹配性檢查,如果二者不一致,則系統(tǒng)報(bào)錯(cuò),退出加載,從而確保加載到主數(shù)據(jù)庫(kù)的數(shù)據(jù)的完整性。

(2)用戶(hù)授權(quán):主數(shù)據(jù)庫(kù)的系統(tǒng)管理員可通過(guò)系統(tǒng)提供的工具,為不同的數(shù)據(jù)庫(kù)用戶(hù)建立(或注銷(xiāo))賬號(hào),定義不同的權(quán)限或身份(Role)。

(3)數(shù)據(jù)授權(quán):系統(tǒng)管理員通過(guò)主數(shù)據(jù)庫(kù)系統(tǒng)的平臺(tái)工具,對(duì)不同用戶(hù)或角色授予(或撤回)不同數(shù)據(jù)的訪(fǎng)問(wèn)權(quán)限,保證只有相應(yīng)權(quán)限的用戶(hù)才能對(duì)與其相關(guān)的數(shù)據(jù)進(jìn)行訪(fǎng)問(wèn)。

(4)數(shù)據(jù)修改與刪除:系統(tǒng)管理員通過(guò)操作界面,能對(duì)主數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)進(jìn)行維護(hù)性修改或刪除操作。

(5)數(shù)據(jù)備份與恢復(fù):系統(tǒng)具有數(shù)據(jù)分級(jí)備份和故障恢復(fù)功能,當(dāng)系統(tǒng)環(huán)境升級(jí)或系統(tǒng)出現(xiàn)嚴(yán)重問(wèn)題后,能夠快速進(jìn)行數(shù)據(jù)恢復(fù)。

(6)日志管理:系統(tǒng)能夠根據(jù)管理人員的需要,對(duì)主數(shù)據(jù)庫(kù)中有關(guān)數(shù)據(jù)的操作情況進(jìn)行審計(jì)跟蹤,形成日志文件并能夠?qū)ζ溥M(jìn)行管理。

數(shù)據(jù)應(yīng)用支持主數(shù)據(jù)庫(kù)的應(yīng)用支持功能完全通過(guò)軟件平臺(tái)提供,包括直接面向網(wǎng)絡(luò)終端用戶(hù)的勢(shì)據(jù)查詢(xún)?yōu)g覽、數(shù)據(jù)請(qǐng)求下載、數(shù)據(jù)發(fā)送等。

(1)數(shù)據(jù)查詢(xún):主數(shù)據(jù)庫(kù)管理平臺(tái)以C/S或B/S方式提供基于表格和GIS導(dǎo)航的數(shù)據(jù)查詢(xún)功能,支持對(duì)綜合數(shù)據(jù)及資料信息的單入口訪(fǎng)問(wèn),并支持對(duì)同一對(duì)象多種相關(guān)信息的聯(lián)合查詢(xún)與檢索。主數(shù)據(jù)庫(kù)管理平臺(tái)還提供了SQI。命令查詢(xún)、數(shù)據(jù)表瀏覽、統(tǒng)計(jì)查詢(xún)和報(bào)表等多種功能。

(2)數(shù)據(jù)請(qǐng)求:主數(shù)據(jù)庫(kù)管理平臺(tái)支持用戶(hù)通過(guò)網(wǎng)絡(luò)直接下載所選擇的數(shù)據(jù)。此時(shí),主數(shù)據(jù)庫(kù)系統(tǒng)先接受并處理用戶(hù)的數(shù)據(jù)請(qǐng)求,然后通過(guò)網(wǎng)絡(luò)將請(qǐng)求的數(shù)據(jù)傳送到用戶(hù)端。通過(guò)選擇列表(select list)技術(shù),用戶(hù)可一次挑選多種數(shù)據(jù)放進(jìn)選擇列表,并允許用戶(hù)通過(guò)選擇目的地(不僅限于用戶(hù)所在結(jié)點(diǎn))和下載格式,一次性地請(qǐng)求下載。用戶(hù)還可以通過(guò)發(fā)送消息來(lái)請(qǐng)求數(shù)據(jù)介質(zhì)的傳送。

(3)應(yīng)用軟件接口:典型的主數(shù)據(jù)庫(kù)系統(tǒng)一般都提供對(duì)項(xiàng)目庫(kù)系統(tǒng)(尤其是解釋系統(tǒng))的數(shù)據(jù)支持,通過(guò)主數(shù)據(jù)庫(kù)平臺(tái)的項(xiàng)目構(gòu)建器等接口工具,用戶(hù)或數(shù)據(jù)管理人員可以直接從主數(shù)據(jù)庫(kù)提取有關(guān)數(shù)據(jù),并將其直接傳送或加載到所能支持的項(xiàng)目數(shù)據(jù)庫(kù)系統(tǒng)中。

其他主數(shù)據(jù)庫(kù)還對(duì)某些應(yīng)用軟件尚在使用的文件格式提供支持,并提供網(wǎng)絡(luò)傳遞功能和相互轉(zhuǎn)換的手段。數(shù)據(jù)管理系統(tǒng)應(yīng)通過(guò)對(duì)外部應(yīng)用項(xiàng)目的注冊(cè)管理.能最大限度地支持對(duì)項(xiàng)目數(shù)據(jù)庫(kù)數(shù)據(jù)的透明加載。1

系統(tǒng)基本配置主數(shù)據(jù)庫(kù)系統(tǒng)的基本配置包括一套主數(shù)據(jù)庫(kù)管理軟件、服務(wù)器主機(jī)、外部存儲(chǔ)設(shè)備等。

軟件配置主數(shù)據(jù)庫(kù)系統(tǒng)的基本邏輯梅成如右圖所示,系統(tǒng)的管理功能主要通過(guò)軟件實(shí)現(xiàn),一般分為客戶(hù)機(jī)端軟件和服務(wù)器軟件。客戶(hù)機(jī)端軟件采用Microsoft公司的IE瀏覽器、主數(shù)據(jù)庫(kù)產(chǎn)品廠(chǎng)家的數(shù)據(jù)請(qǐng)求軟件、數(shù)據(jù)整理軟件等。服務(wù)器軟件運(yùn)行在各種服務(wù)器上,包括主數(shù)據(jù)庫(kù)技術(shù)產(chǎn)品廠(chǎng)家提供的數(shù)據(jù)管理軟件平臺(tái)、Web服務(wù)器軟件、GIS軟件(如ArcView等)、數(shù)據(jù)庫(kù)管理軟件(如Oracle 9i等),以實(shí)現(xiàn)主數(shù)據(jù)厙的查詢(xún)和管理維護(hù)功能。

不同的主數(shù)據(jù)庫(kù)系統(tǒng),其軟件配置也不盡相同,下面以Petrobank為例加以簡(jiǎn)要說(shuō)明。這些軟件分為服務(wù)器軟件和客戶(hù)軟件,運(yùn)行在服務(wù)器主機(jī)上的軟件有:

①分布式存儲(chǔ)管理器ADSM,是IBM的基于網(wǎng)絡(luò)的備份與歸檔軟件產(chǎn)品,在Petrobank中用于支持疊后地震數(shù)據(jù)、工作站文件、歸檔數(shù)據(jù)等大塊數(shù)據(jù)的存儲(chǔ);

②IBM公司的層次存儲(chǔ)管理模塊HSM,可在磁盤(pán)陣列與帶庫(kù)之間實(shí)現(xiàn)數(shù)據(jù)文件的自動(dòng)傳遞;

③NetTape/PBTS用于支持對(duì)MDS主庫(kù)中野外和疊前地震帶的存儲(chǔ)管理;

④Uniface是一個(gè)獨(dú)立的4GL應(yīng)用開(kāi)發(fā)環(huán)境,在此用于支持表格、報(bào)告制作等功能;

⑤Surf&Connect(for server)用于支持空間數(shù)據(jù)庫(kù)存取和開(kāi)放式數(shù)據(jù)庫(kù)連接;

⑥ArcView用于支持基于地理信息系統(tǒng)的查詢(xún);

⑦Recall主要用于管理測(cè)井曲線(xiàn)數(shù)據(jù);

⑧Oracle用于底層數(shù)據(jù)管理。

而提供給客戶(hù)端的軟件有:

①HTMI。Viewer用于支持瀏覽器查詢(xún);

②Surf&Connect(for Client)用于支持空間數(shù)據(jù)庫(kù)的存取和開(kāi)放式數(shù)據(jù)庫(kù)的連接;

③Java支持工作站上的Web瀏覽;

④INT用于支持地震數(shù)據(jù)的預(yù)覽查看。

硬件配置為使主數(shù)據(jù)庫(kù)系統(tǒng)上的所有數(shù)據(jù)查詢(xún)和管理軟件正常運(yùn)行和實(shí)現(xiàn)數(shù)據(jù)的在線(xiàn)、近線(xiàn)和離線(xiàn)三級(jí)存儲(chǔ),在硬件方面需要配置高性能的主服務(wù)器、數(shù)據(jù)分發(fā)服務(wù)器、網(wǎng)絡(luò)服務(wù)器、歸檔服務(wù)器、自動(dòng)帶庫(kù)等。此外,為數(shù)據(jù)的整理加載,還需要配置管理工作站和磁帶機(jī)、掃描器等設(shè)備。1