首頁 考試吧論壇 Exam8視線 考試商城 網絡課程 模擬考試 考友錄 實用文檔 求職招聘 論文下載 | ||
![]() |
2011中考 | 2011高考 | 2012考研 | 考研培訓 | 在職研 | 自學考試 | 成人高考 | 法律碩士 | MBA考試 MPA考試 | 中科院 |
|
![]() |
四六級 | 職稱英語 | 商務英語 | 公共英語 | 托福 | 雅思 | 專四專八 | 口譯筆譯 | 博思 | GRE GMAT 新概念英語 | 成人英語三級 | 申碩英語 | 攻碩英語 | 職稱日語 | 日語學習 | 法語 | 德語 | 韓語 |
|
![]() |
計算機等級考試 | 軟件水平考試 | 職稱計算機 | 微軟認證 | 思科認證 | Oracle認證 | Linux認證 華為認證 | Java認證 |
|
![]() |
公務員 | 報關員 | 銀行從業資格 | 證券從業資格 | 期貨從業資格 | 司法考試 | 法律顧問 | 導游資格 報檢員 | 教師資格 | 社會工作者 | 外銷員 | 國際商務師 | 跟單員 | 單證員 | 物流師 | 價格鑒證師 人力資源 | 管理咨詢師考試 | 秘書資格 | 心理咨詢師考試 | 出版專業資格 | 廣告師職業水平 駕駛員 | 網絡編輯 |
|
![]() |
衛生資格 | 執業醫師 | 執業藥師 | 執業護士 | |
![]() |
會計從業資格考試(會計證) | 經濟師 | 會計職稱 | 注冊會計師 | 審計師 | 注冊稅務師 注冊資產評估師 | 高級會計師 | ACCA | 統計師 | 精算師 | 理財規劃師 | 國際內審師 |
|
![]() |
一級建造師 | 二級建造師 | 造價工程師 | 造價員 | 咨詢工程師 | 監理工程師 | 安全工程師 質量工程師 | 物業管理師 | 招標師 | 結構工程師 | 建筑師 | 房地產估價師 | 土地估價師 | 巖土師 設備監理師 | 房地產經紀人 | 投資項目管理師 | 土地登記代理人 | 環境影響評價師 | 環保工程師 城市規劃師 | 公路監理師 | 公路造價師 | 安全評價師 | 電氣工程師 | 注冊測繪師 | 注冊計量師 |
|
![]() |
繽紛校園 | 實用文檔 | 英語學習 | 作文大全 | 求職招聘 | 論文下載 | 訪談 | 游戲 |
6.2.4 散列文件
是一種利用散列函數支持快速文件訪問的文件組織和存取方法;
6.3 索引技術
6.3.1 基本概念
1、 索引技術:是一種快速文件訪問技術,它將一個文件的每個記錄在某個或某些域(屬性)上的取值與該記錄的物理地址直接聯系起來,提供了一種根據記錄域的取值快速訪問文件記錄的機制;它的關鍵是建立取值域到記錄的物理地址劉的映射關系,這種映射關系叫索引;
2、 索引技術分類:
(1) 有序索引技術:利用索引文件實現記錄域(查找碼)取值到記錄物理地址間的映射關系,索引文件由索引記錄組成,每個記錄中記載一個索引項,索引項記錄了某個特定的查找碼值和具有該值的數據文件記錄的物理地址;
(2) 散列技術:利用一個散列函數實現記錄域取值到記錄物理地址間的直接映射關系;
(3) 有序索引:有序索引作為基于索引文件的索引技術,需要考慮兩個問題:(1)如何組織索引文件中的索引記錄;(2)如何從索引文件出發,訪問數據文件中的數據記錄;
(A) 當需要采用有序索引機制快速訪問數據文件時,首先要為該數據文件建立一個索引文件,它是索引記錄和索引項的集合;
(B) 索引文件建立的方法:首先選定某些記錄域作為查找碼,然后建立數據記錄在查找碼上的取值與物理地址間的映射關系,組成索引項。所有索引項作為索引記錄存儲在索引文件中,索引文件根據某個特定的查找碼值的順序組織為順序文件;
(C) 一個數據文件可以有多個查找碼和索引文件;
6.3.2 有序索引的分類及特點
1、 聚集索引與非聚集索引
(1) 對數據文件和它的一個特定的索引文件,如果數據文件中數據記錄的排列順序與索引文件中索引項的排列順序相一致,則該索引文件稱為聚集索引,否則稱為非聚集索引;
(2) 在一個數據文件上除了建立一個聚集索引外,還可建立多個非聚集索引;
2、 稠密索引和稀疏索引
如果數據文件中的每個查找碼都在索引文件中都對應一個索引記錄,稱為稠密索引,如果只一部分對應,則稱為稀疏索引;
3、 主索引和輔索引
在數據文件包含主碼的屬性集上建立索引稱為主索引,在非主碼屬性上建立的索引稱為輔索引;
4、單層索引和多層索引
(1) 單層索引(線性索引):索引項根據鍵值在索引文件中順序排列,組織成一維線性結構,每個索引項直接指向數據文件中的數據記錄;
(2) 當數據文件很大時,即使采用稀疏索引,建成的索引文件也很大,導致效率低下,為解決該問題,可對索引文件中的索引項本身再建立一級稀疏索引,組成2層索引結構;進一步地,可建立多層樹型索引結構來快速定位;
6.4 散列技術
6.4.1 散列文件
1、 散列是一種快速查找技術,它利用定義在文件記錄上的查找碼,通過計算一個散列函數,以散列函數值作為記錄的物理地址,實現對文件記錄直接快速訪問。
2、 首先指定文件記錄的一個域作為查找碼(散列域),然后定義一個查找碼上的函數(散列函數),函數的輸入為查找碼值,輸出為物理地址;
3、 一般使用桶作為基本的存儲單位,一個桶可存放多個文件記錄,物理地址可以是記錄所在的桶號,散列函數的輸出可以是桶號;
6.4.2 散列函數
1、 散列方法依賴于好的散列函數,它應該盡可能均勻地將查找碼分布到各個桶中,具體要滿足如下兩個條件:
(1) 地址的分布是均勻的;
(2) 地址的分布是隨機的;
6.4.3 桶溢出
1、 產生桶溢出的兩個原因:
(1) 文件初始設計時,為文件記錄預留的存儲空間不足;
(2) 散列函數的均勻分布性不好;
2、 設計散列函數時,應根據文件大小決定物理空間,一般應有20%余量,再設計合適的桶數目和桶大小,盡可能留有一些空閑桶,降低桶溢出的可能性;
3、 桶溢出的現象是難免的,需要DBS采用相應的桶溢出處理機制;
4、 散列方法的缺點:為了避免桶溢出。必須選一合適的散列函數,但這比較復雜,而且不象索引文件那樣可以據數據記錄變化動態調整。
相關推薦:2010年9月計算機等級考試精華備考資料匯總北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內蒙古 |