點擊查看:2018全國計算機四級數據庫工程師過關試題及答案匯總
1 . 什么是并行數據庫系統? (填空題)
答案
答案要點:并行數據庫系統是在并行機上運行的具有并行處理能力的數據庫系統。并行數據庫系統是數據庫技術與并行計算技術相結合的產物。
2 . 試述并行數據庫系統的研制目標。 (填空題)
答案
答案要點:并行數據庫系統該實現如下目標: ? 高性能 并行數據庫系統通過將數據庫管理技術與并行處理技術有機結合,發揮多處理機結構的優勢,提供比相應的大型機系統更高的性能價格比和可用性。 ? 高可用性 并行數據庫系統可通過數據復制來增強數據庫的可用性。 ? 可擴充性系統通過增加處理和存儲能力來平滑地擴展性能,應具有線性伸縮比和線性加速比。具體說明可參考《概論》15.2。
3 . 什么是并行數據庫系統的伸縮比和加速比? (填空題)
答案
答案要點: 線性伸縮比是指當任務擴大N倍,系統處理和存儲能力也擴大N倍時系統性能不變。線性伸縮比= (小任務在小系統上的運行時間)/(大(N倍)任務在大任務上的運行時間)=1 線性加速比是指當任務不變而系統處理和存儲能力擴大N倍時,系統性能也提高N倍。線性加速比= (小系統上執行一個任務的時間)/(大(N倍)系統上執行同一任務的時間)=N
4 . 并行數據庫系統有哪幾種體系結構?試比較它們的特點。 (填空題)
答案
答案要點:從硬件結構來看,根據處理機與磁盤、內存的相互關系可以將并行計算機分為三種基本的體系結構: ?共享內存結構(SM); ?共享磁盤結構(SD); ?無共享資源結構(SN)。此外還有混合結構,即整個系統是Shared_Nothing結構而每個結點是Shared_Memory結構。這種結構綜合了SM與SN的優點。 (1) SM并行結構 SM并行結構由多個處理機、一個共享內存(主存儲器)和多個磁盤存儲器構成。多處理機和共享內存由高速通訊網絡連接,每個處理機可直接存取一個或多個磁盤,即所有內存與磁盤為所有處理機共享。 (2) SD并行結構 SD并行結構由多個具有獨立內存的處理機和多個磁盤構成。每個處理機都可以讀寫任何磁盤。 (3) SN并行結構 SN并行結構由多個處理節點構成。每個處理節點具有自己獨立的處理機、內存和磁盤存儲器。多個處理機結點由高速通信網絡連接。并行數據庫系統體系結構的詳細說明可參考《概論》15.3.1、15.3.2、15.3.3。
5 . 闡述并行數據庫系統中并行粒度的概念。 (填空題)
答案
答案要點: 并行粒度是用來刻畫查詢執行的并行程度,有四種并行粒度:不同用戶事務間的并行性、同一事務內不同查詢間的并行性、同一查詢內不同操作間的并行性和同一操作內的并行性。具體說明可參考《概論》15.4.1。
6 . 舉例說明水平并行和垂直并行的概念。 (填空題)
答案
水平并行化指:互相獨立的多個操作或者一個操作內互相獨立的多個子操作分別由不同的處理機并行執行的形式。如果兩個操作OP1和OP2之間沒有數據的依賴關系,這兩個操作可以獨立地并行執行。例如圖(a)中對不同表的掃描操作Scan S和Scan P,由不同的處理機并行執行就是水平并行化的實例。如果把操作的輸入數據分解為多個子集,該操作就可以分成多個獨立的子操作,每個子操作只處理一部分數據,這種針對單個操作的并行被稱為操作內并行。例如圖(c)中的Scan S和Sort S都被分解成三個子操作,每個子操作只對部分數據進行掃描和排序。如果一個操作的輸出流是另一個操作的輸入流,這兩個操作之間就存在著流水線并行性,操作間流水線并行又被直觀地稱為垂直并行。垂直并行化也就是指存在流水線方式依賴關系的操作分別由不同處理機并行執行的形式。例如圖(b)中的四個操作都可以采用流水線方式并行執行。詳細說明可參考《概論》15.4.2。
7 . 并行數據庫系統中并行查詢優化的必要性和困難何在? (填空題)
答案
答案要點: 查詢優化始終是數據庫管理系統的重要組成部分,查詢優化的目標在于提高執行效率。由于并行數據庫環境中存在多個處理機,并行查詢優化應盡可能地使每個操作并行處理,充分利用系統資源提高并行度來達到提高系統性能的目的。并行查詢優化面臨的兩大困難在于:(1) 執行計劃的搜索空間十分龐大(2) 執行時的某些系統參數比如CPU數目、內存大小在優化時是未知的。具體說明可參考《概論》15.4.4。
8 . 試述數據劃分在并行查詢處理中的重要性。 (填空題)
答案
答案要點:數據劃分是并行查詢處理的重要基礎。研究和實際表明,數據劃分對于并行數據庫系統的性能具有很大的影響。通過將每個關系的數據劃分為小的片段,并把這些小片段均勻地分布在系統的多個磁盤驅動器上可以降低數據的聚集度,使得每個操作能夠由多個處理機來承擔,從而減少查詢的響應時間并提高整個系統的吞吐量。若負載不均,往往會造成多個處理機結點能力的浪費。所以使用正確的數據分布算法以達到負載均衡是并行數據庫中數據分布的關鍵問題。具體說明可參考《概論》15.5.1。
9 . 并行數據庫系統中有哪幾種常用的數據劃分方法? (填空題)
答案
答案要點:劃分數據時可以依據一個屬性的值,也可以同時依據多個屬性的值,前者稱為一維數據劃分,后者則稱為多維數據劃分。一維數據劃分方法相對比較簡單,常用的數據劃分方法有: ?輪轉法 ?Hash法 ?值域劃分法此外,還有用戶定義的劃分法、模式劃分法、Hybrid_Range劃分法等。具體說明可參考《概論》15.5.1。
10 . 試述并行數據庫系統與分布式數據庫系統的區別。 (填空題)
答案
答案要點:分布式數據庫系統與并行數據庫系統特別是與SN結構的并行數據庫系統具有很多相似點: ? 它們都是用網絡連接各個數據處理結點; ? 整個網絡中的所有結點構成一個邏輯上統一的整體; ? 用戶可以對各個結點上的數據進行透明存取等等。分布式數據庫系統和并行數據庫系統的應用目標和具體實現方法不同,使得它們具有很大的不同: ? 應用目標不同并行數據庫系統的目標是充分發揮并行計算機的優勢,利用各個處理機結點并行地完成任務,提高系統的整體性能。分布式數據庫系統的目標是實現場地自治和數據的全局透明共享,而不要求利用網絡中的各個結點來提高系統處理性能。 ? 實現方式不同在并行數據庫系統中各結點間采用高速網絡互連,結點間的數據傳輸代價相對較低,因此當某些結點處于空閑狀態時,可以將工作負載過大的結點上的部分任務通過高速網傳送給空閑結點處理,從而實現系統的負載平衡。在分布式數據庫系統中,各結點間一般采用局域網或廣域網相連,網絡帶寬較低,點到點的通信開銷較大,因此在查詢處理時一般應盡量減少結點間的數據傳輸量。 ? 各結點的地位不同在并行數據庫系統中,不存在全局應用和局部應用的概念。各結點是非獨立的。而在分布式數據庫系統中,各結點除了能通過網絡協同完成全局事務外,更重要的是各結點具有場地自治性。
微信搜索"考試吧"了解更多考試資訊、下載備考資料
相關推薦: