元數據(Meta Date),主要記錄數據倉庫中模型的定義、各層級間的映射關(guān)系、監控數據倉庫的數據狀態(tài)及ETL的任務(wù)運行狀態(tài)。一般會(huì )通過(guò)元數據資料庫(Metadata Repository)來(lái)統一地存儲和管理元數據,其主要目的是使數據倉庫的設計、部署、操作和管理能達成協(xié)同和一致。
元數據是數據倉庫管理系統的重要組成部分,元數據管理是企業(yè)級數據倉庫中的關(guān)鍵組件,貫穿數據倉庫構建的整個(gè)過(guò)程,直接影響著(zhù)數據倉庫的構建、使用和維護。
構建數據倉庫的主要步驟之一是ETL。這時(shí)元數據將發(fā)揮重要的作用,它定義了源數據系統到數據倉庫的映射、數據轉換的規則、數據倉庫的邏輯結構、數據更新的規則、數據導入歷史記錄以及裝載周期等相關(guān)內容。數據抽取和轉換的專(zhuān)家以及數據倉庫管理員正是通過(guò)元數據高效地構建數據倉庫。
用戶(hù)在使用數據倉庫時(shí),通過(guò)元數據訪(fǎng)問(wèn)數據,明確數據項的含義以及定制報表。
數據倉庫的規模及其復雜性離不開(kāi)正確的元數據管理,包括增加或移除外部數據源,改變數據清洗方法,控制出錯的查詢(xún)以及安排備份等。
元數據可分為技術(shù)元數據和業(yè)務(wù)元數據。技術(shù)元數據為開(kāi)發(fā)和管理數據倉庫的IT 人員使用,它描述了與數據倉庫開(kāi)發(fā)、管理和維護相關(guān)的數據,包括數據源信息、數據轉換描述、數據倉庫模型、數據清洗與更新規則、數據映射和訪(fǎng)問(wèn)權限等。而業(yè)務(wù)元數據為管理層和業(yè)務(wù)分析人員服務(wù),從業(yè)務(wù)角度描述數據,包括商務(wù)術(shù)語(yǔ)、數據倉庫中有什么數據、數據的位置和數據的可用性等,幫助業(yè)務(wù)人員更好地理解數據倉庫中哪些數據是可用的以及如何使用。
由上可見(jiàn),元數據不僅定義了數據倉庫中數據的模式、來(lái)源、抽取和轉換規則等,而且是整個(gè)數據倉庫系統運行的基礎,元數據把數據倉庫系統中各個(gè)松散的組件聯(lián)系起來(lái),組成了一個(gè)有機的整體。
元數據(Metadata),又稱(chēng)中介數據、中繼數據,為描述數據的數據(data about data),主要是描述數據屬性(property)的信息,用來(lái)支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。元數據算是一種電子式目錄,為了達到編制目錄的目的,必須在描述并收藏數據的內容或特色,進(jìn)而達成協(xié)助數據檢索的目的。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:0.410秒