2009年自學(xué)考試《數(shù)據(jù)結(jié)構(gòu)》各章要點
第一章 概 論
數(shù)據(jù)就是指能夠被計算機(jī)識別、存儲和加工處理的信息的載體。
數(shù)據(jù)元素是數(shù)據(jù)的基本單位,可以由若干個數(shù)據(jù)項組成。數(shù)據(jù)項是具有獨立含義的最小標(biāo)識單位。
數(shù)據(jù)結(jié)構(gòu)的定義:
?邏輯結(jié)構(gòu):從邏輯結(jié)構(gòu)上描述數(shù)據(jù),獨立于計算機(jī)。
?線性結(jié)構(gòu):一對一關(guān)系。
?線性結(jié)構(gòu):多對多關(guān)系。
?存儲結(jié)構(gòu):是邏輯結(jié)構(gòu)用計算機(jī)語言的實現(xiàn)。
?順序存儲結(jié)構(gòu):如數(shù)組。
?鏈?zhǔn)酱鎯Y(jié)構(gòu):如鏈表。
?稠密索引:每個結(jié)點都有索引項。
?稀疏索引:每組結(jié)點都有索引項。
?散列存儲結(jié)構(gòu):如散列表。
?對數(shù)據(jù)的操作:定義在邏輯結(jié)構(gòu)上,每種邏輯結(jié)構(gòu)都有一個運(yùn)算集合。
?常用的有:檢索、插入、刪除、更新、排序。
?數(shù)據(jù)類型:是一個值的集合以及在這些值上定義的一組操作的總稱。
?原子類型:由語言提供。
?結(jié)構(gòu)類型:由用戶借助于描述機(jī)制定義,是導(dǎo)出類型。
抽象數(shù)據(jù)類型ADT:
?是抽象數(shù)據(jù)的組織和與之的操作。相當(dāng)于在概念層上描述問題。
?優(yōu)點是將數(shù)據(jù)和操作封裝在一起實現(xiàn)了信息隱藏。
程序設(shè)計的實質(zhì)是對實際問題選擇一種好的數(shù)據(jù)結(jié)構(gòu),設(shè)計一個好的算法。算法取決于數(shù)據(jù)結(jié)構(gòu)。
算法是一個良定義的計算過程,以一個或多個值輸入,并以一個或多個值輸出。
評價算法的好壞的因素:
?算法是正確的;
?執(zhí)行算法的時間;
?執(zhí)行算法的存儲空間(主要是輔助存儲空間);
?算法易于理解、編碼、調(diào)試。
時間復(fù)雜度:是某個算法的時間耗費,它是該算法所求解問題規(guī)模n的函數(shù)。
漸近時間復(fù)雜度:是指當(dāng)問題規(guī)模趨向無窮大時,該算法時間復(fù)雜度的數(shù)量級。
評價一個算法的時間性能時,主要標(biāo)準(zhǔn)就是算法的漸近時間復(fù)雜度。
算法中語句的頻度不僅與問題規(guī)模有關(guān),還與輸入實例中各元素的取值相關(guān)。
時間復(fù)雜度按數(shù)量級遞增排列依次為:常數(shù)階O(1)、對數(shù)階O(log2n)、線性階O(n)、線性對數(shù)階O(nlog2n)、平方階O(n^2)、立方階O(n^3)、……k次方階O(n^k)、指數(shù)階O(2^n)。
空間復(fù)雜度:是某個算法的空間耗費,它是該算法所求解問題規(guī)模n的函數(shù)。
算法的時間復(fù)雜度和空間復(fù)雜度合稱算法復(fù)雜度。
第二章 線性表
線性表是由n≥0個數(shù)據(jù)元素組成的有限序列。n=0是空表;非空表,只能有一個開始結(jié)點,有且只能有一個終端結(jié)點。
線性表上定義的基本運(yùn)算:
?構(gòu)造空表:Initlist(L)
?求表長:Listlength(L)
?取結(jié)點:GetNode(L,i)
?查找:LocateNode(L,x)
?插入:InsertList(L,x,i)
?刪除:Delete(L,i)
順序表是按線性表的邏輯結(jié)構(gòu)次序依次存放在一組地址連續(xù)的存儲單元中。在存儲單元中的各元素的物理位置和邏輯結(jié)構(gòu)中各結(jié)點相鄰關(guān)系是一致的。地址計算:LOCa(i)=LOCa(1)+(i-1)*d;(首地址為1) /考試 大收集整理/
在順序表中實現(xiàn)的基本運(yùn)算:
?插入:平均移動結(jié)點次數(shù)為n/2;平均時間復(fù)雜度均為O(n)。
?刪除:平均移動結(jié)點次數(shù)為(n-1)/2;平均時間復(fù)雜度均為O(n)。
線性表的鏈?zhǔn)酱鎯Y(jié)構(gòu)中結(jié)點的邏輯次序和物理次序不一定相同,為了能正確表示結(jié)點間的邏輯關(guān)系,在存儲每個結(jié)點值的同時,還存儲了其后繼結(jié)點的地址信息(即指針或鏈)。這兩部分信息組成鏈表中的結(jié)點結(jié)構(gòu)。 一個單鏈表由頭指針的名字來命名。
單鏈表運(yùn)算:
?建立單鏈表
?頭插法:s->next=head;head=s;生成的順序與輸入順序相反。平均時間復(fù)雜度均為O(n)。
?尾插法:head=rear=null;if(head=null) head=s;else r->next=s;r=s; 平均時間復(fù)雜度均為O(n)
?加頭結(jié)點的算法:對開始結(jié)點的操作無需特殊處理,統(tǒng)一了空表和非空表。
?查找
?按序號:與查找位置有關(guān),平均時間復(fù)雜度均為O(n)。
?按值:與輸入實例有關(guān),平均時間復(fù)雜度均為O(n)。
?插入運(yùn)算:p=GetNode(L,i-1);s->next=p->next;p->next=s;平均時間復(fù)雜度均為O(n)
?刪除運(yùn)算:p=GetNode(L,i-1);r=p->next;p->next=r->next;free(r);平均時間復(fù)雜度均為O(n)
單循環(huán)鏈表是一種首尾相接的單鏈表,終端結(jié)點的指針域指向開始結(jié)點或頭結(jié)點。鏈表終止條件是以指針等于頭指針或尾指針。
采用單循環(huán)鏈表在實用中多采用尾指針表示單循環(huán)鏈表。優(yōu)點是查找頭指針和尾指針的時間都是O(1),不用遍歷整個鏈表。
雙鏈表就是雙向鏈表,就是在單鏈表的每個結(jié)點里再增加一個指向其直接前趨的指針域prior,形成兩條不同方向的鏈。由頭指針head惟一確定。
雙鏈表也可以頭尾相鏈接構(gòu)成雙(向)循環(huán)鏈表。
雙鏈表上的插入和刪除時間復(fù)雜度均為O (1)。
順序表和鏈表的比較:
?基于空間:
?順序表的存儲空間是靜態(tài)分配,存儲密度為1;適于線性表事先確定其大小時采用。
?鏈表的存儲空間是動態(tài)分配,存儲密度<1;適于線性表長度變化大時采用。
?基于時間:
?順序表是隨機(jī)存儲結(jié)構(gòu),當(dāng)線性表的操作主要是查找時,宜采用。
?以插入和刪除操作為主的線性表宜采用鏈表做存儲結(jié)構(gòu)。
?若插入和刪除主要發(fā)生在表的首尾兩端,則宜采用尾指針表示的單循環(huán)鏈表。
第三章 棧和隊列
棧(Stack)是僅限制在表的一端進(jìn)行插入和刪除運(yùn)算的線性表,稱插入、刪除這一端為棧頂,另一端稱為棧底。表中無元素時為空棧。棧的修改是按后進(jìn)先出的原則進(jìn)行的,我們又稱棧為LIFO表(Last In First Out)。通常棧有順序棧和鏈棧兩種存儲結(jié)構(gòu)。
棧的基本運(yùn)算有六種:
?構(gòu)造空棧:InitStack(S)
?判??眨篠tackEmpty(S)
?判棧滿:StackFull(S)
?進(jìn)棧:Push(S,x)
?退棧:Pop(S)
?取棧頂元素:StackTop(S) 在順序棧中有“上溢”和“下溢”的現(xiàn)象。
?“上溢”是棧頂指針指出棧的外面是出錯狀態(tài)。
?“下溢”可以表示棧為空棧,因此用來作為控制轉(zhuǎn)移的條件。
順序棧中的基本操作有六種:
?構(gòu)造空棧
?判???/P>
?判棧滿
?進(jìn)棧
?退棧
?取棧頂元素
鏈棧則沒有上溢的限制,因此進(jìn)棧不要判棧滿。鏈棧不需要在頭部附加頭結(jié)點,只要有鏈表的頭指針就可以了。
鏈棧中的基本操作有五種:
?構(gòu)造空棧
?判???/P>
?進(jìn)棧
?退棧
?取棧頂元素
隊列(Queue)是一種運(yùn)算受限的線性表,插入在表的一端進(jìn)行,而刪除在表的另一端進(jìn)行,允許刪除的一端稱為隊頭(front),允許插入的一端稱為隊尾(rear) ,隊列的操作原則是先進(jìn)先出的,又稱作FIFO表(First In First Out) .隊列也有順序存儲和鏈?zhǔn)酱鎯煞N存儲結(jié)構(gòu)。
隊列的基本運(yùn)算有六種:
?置空隊:InitQueue(Q)
?判隊空:QueueEmpty(Q)
?判隊滿:QueueFull(Q)
?入隊:EnQueue(Q,x)
?出隊:DeQueue(Q)
?取隊頭元素:QueueFront(Q)
順序隊列的“假上溢”現(xiàn)象:由于頭尾指針不斷前移,超出向量空間。這時整個向量空間及隊列是空的卻產(chǎn)生了“上溢”現(xiàn)象。
為了克服“假上溢”現(xiàn)象引入循環(huán)向量的概念,是把向量空間形成一個頭尾相接的環(huán)形,這時隊列稱循環(huán)隊列。
判定循環(huán)隊列是空還是滿,方法有三種:
?一種是另設(shè)一個布爾變量來判斷;
?第二種是少用一個元素空間,入隊時先測試((rear+1)%m = front)? 滿:空;
?第三種就是用一個計數(shù)器記錄隊列中的元素的總數(shù)。
隊列的鏈?zhǔn)酱鎯Y(jié)構(gòu)稱為鏈隊列,一個鏈隊列就是一個操作受限的單鏈表。為了便于在表尾進(jìn)行插入(入隊)的操作,在表尾增加一個尾指針,一個鏈隊列就由一個頭指針和一個尾指針唯一地確定。鏈隊列不存在隊滿和上溢的問題。在鏈隊列的出隊算法中,要注意當(dāng)原隊中只有一個結(jié)點時,出隊后要同進(jìn)修改頭尾指針并使隊列變空。
第四章 串
串是零個或多個字符組成的有限序列。
?空串:是指長度為零的串,也就是串中不包含任何字符(結(jié)點)。
?空白串:指串中包含一個或多個空格字符的串。
?在一個串中任意個連續(xù)字符組成的子序列稱為該串的子串,包含子串的串就稱為主串。
?子串在主串中的序號就是指子串在主串中首次出現(xiàn)的位置。
?空串是任意串的子串,任意串是自身的子串。
串分為兩種:
?串常量在程序中只能引用不能改變;
?串變量的值可以改變。
串的基本運(yùn)算有:
?求串長strlen(char*s)
?串復(fù)制strcpy(char*to,char*from)
?串聯(lián)接strcat(char*to,char*from)
?串比較charcmp(char*s1,char*s2)
?字符定位strchr(char*s,charc)
。串是特殊的線性表(結(jié)點是字符),所以串的存儲結(jié)構(gòu)與線性表的存儲結(jié)構(gòu)類似。串的順序存儲結(jié)構(gòu)簡稱為順序串。
順序串又可按存儲分配的不同分為:
?靜態(tài)存儲分配:直接用定長的字符數(shù)組來定義。優(yōu)點是涉及串長的操作速度快,但不適合插入、鏈接操作。
?動態(tài)存儲分配:是在定義串時不分配存儲空間,需要使用時按所需串的長度分配存儲單元。
串的鏈?zhǔn)酱鎯褪怯脝捂湵淼姆绞酱鎯Υ担倪@種鏈?zhǔn)酱鎯Y(jié)構(gòu)簡稱為鏈串。鏈串與單鏈表的差異只是它的結(jié)點數(shù)據(jù)域為單個字符。
為了解決“存儲密度”低的狀況,可以讓一個結(jié)點存儲多個字符,即結(jié)點的大小。
順序串上子串定位的運(yùn)算:又稱串的“模式匹配”或“串匹配”,是在主串中查找出子串出現(xiàn)的位置。在串匹配中,將主串稱為目標(biāo)(串),子串稱為模式(串)。這是比較容易理解的,串匹配問題就是找出給定模式串P在給定目標(biāo)串T中首次出現(xiàn)的有效位移或者是全部有效位移。最壞的情況下時間復(fù)雜度是O((n-m+1)m),假如m與n同階的話則它是O(n^2)。鏈串上的子串定位運(yùn)算位移是結(jié)點地址而不是整數(shù)。
第五章 多維數(shù)組和廣義表
數(shù)組一般用順序存儲的方式表示。存儲的方式有:
?行優(yōu)先順序,也就是把數(shù)組逐行依次排列。PASCAL、C
?列優(yōu)先順序,就是把數(shù)組逐列依次排列。FORTRAN
地址的計算方法:
?按行優(yōu)先順序排列的數(shù)組:LOCa(ij)=LOCa(11)+((i-1)*n+(j-1))*d.
?按列優(yōu)先順序排列的數(shù)組:LOCa(ij)=LOCa(11)+((j-1)*n+(i-1))*d. 矩陣的壓縮存儲:為多個相同的非零元素分配一個存儲空間;對零元素不分配空間。
特殊矩陣的概念:所謂特殊矩陣是指非零元素或零元素分布有一定規(guī)律的矩陣。
稀疏矩陣的概念:一個矩陣中若其非零元素的個數(shù)遠(yuǎn)遠(yuǎn)小于零元素的個數(shù),則該矩陣稱為稀疏矩陣。
特殊矩陣的類型:
?對稱矩陣:滿足a(ij)=a(ji)。元素總數(shù)n(n+1)/2.I=max(i,j),J=min(i,j),LOCa(ij)=LOC(sa[0])+(I*(I+1)/2+J)*d.
?三角矩陣:
?上三角陣:k=i*(2n-i+1)/2+j-i,LOCa(ij)=LOC(sa[0])+k*d.
?下三角陣:k=i*(i+1)/2+j,LOCa(ij)=LOC(sa[0])+k*d.
?對角矩陣:k=2i+j,LOCa(ij)=LOC(sa[0])+k*d.
稀疏矩陣的壓縮存儲方式用三元組表把非零元素的值和它所在的行號列號做為一個結(jié)點存放在一起,用這些結(jié)點組成的一個線性表來表示。但這種壓縮存儲方式將失去隨機(jī)存儲功能。加入行表記錄每行的非零元素在三元組表中的起始位置,即帶行表的三元組表。
廣義表是n(n≥0)個元素的有限序列,其中的元素是原子或者是一個廣義表。
廣義表表頭和表尾的概念:
?若廣義表LS非空(n≥1),則這個廣義表的第一個元素就是表頭。
?其余的元素組成的表稱為LS的表尾,所以表尾必是一個子表。
廣義表有兩種表示法,一種是括號表示法,一種是圖形表示法。
廣義表與樹(形結(jié)構(gòu))相對應(yīng),這個廣義表就是純表。
如果一個廣義表的結(jié)點又可以被其他結(jié)點所共享,則這個表稱為再入表。
允許遞歸的表稱為遞歸表。
線性表∈純表(樹)∈再入表∈遞歸表??梢姡瑥V義表是對線性表和樹的推廣。
廣義表有兩個特殊的基本運(yùn)算:
?取表頭head(LS):取表中的第一個數(shù)據(jù)元素,不能對空表操作。
?取表尾tail(LS);取除表頭外,其余數(shù)據(jù)元素構(gòu)成的子表,不能對空表操作。
第六章 樹
樹是n個結(jié)點的有限集合,非空時必須滿足:只有一個稱為根的結(jié)點;其余結(jié)點形成m個不相交的子集,并稱根的子樹。
根是開始結(jié)點;結(jié)點的子樹數(shù)稱度;度為0的結(jié)點稱葉子(終端結(jié)點);度不為0的結(jié)點稱分支結(jié)點(非終端結(jié)點);除根外的分支結(jié)點稱內(nèi)部結(jié)點;
有序樹是子樹有左,右之分的樹;無序樹是子樹沒有左,右之分的樹;森林是m個互不相交的樹的集合;
樹的四種不同表示方法:
?樹形表示法;
?嵌套集合表示法;
?凹入表示法;
?廣義表表示法。
二叉樹的定義:是n≥0個結(jié)點的有限集,它是空集(n=0)或由一個根結(jié)點及兩棵互不相交的分別稱作這個根的左子樹和右子樹的二叉樹組成。
二叉樹不是樹的特殊情形,與度數(shù)為2的有序樹不同。
二叉樹的4個重要性質(zhì):
?二叉樹上第i層上的結(jié)點數(shù)目最多為2^(i-1)(i≥1);
?深度為k的二叉樹至多有(2^k)-1個結(jié)點(k≥1);
?在任意一棵二叉樹中,若終端結(jié)點的個數(shù)為n0,度為2的結(jié)點數(shù)為n2,則n0=n2+1;
?具有n個結(jié)點的完全二叉樹的深度為int(log2n)+1。 滿二叉樹是一棵深度為k,結(jié)點數(shù)為(2^k)-1的二叉樹;完全二叉樹是滿二叉樹在最下層自右向左去處部分結(jié)點;
二叉樹的順序存儲結(jié)構(gòu)就是把二叉樹的所有結(jié)點按照層次順序存儲到連續(xù)的存儲單元中。(存儲前先將其畫成完全二叉樹)
樹的存儲結(jié)構(gòu)多用的是鏈?zhǔn)酱鎯ΑinTNode的結(jié)構(gòu)為lchild|data|rchild,把所有BinTNode類型的結(jié)點,加上一個指向根結(jié)點的BinTree型頭指針就構(gòu)成了二叉樹的鏈?zhǔn)酱鎯Y(jié)構(gòu),稱為二叉鏈表。它就是由根指針root唯一確定的。共有2n個指針域,n+1個空指針。
根據(jù)訪問結(jié)點的次序不同可得三種遍歷:先序遍歷(前序遍歷或先根遍歷),中序遍歷(或中根遍歷)、后序遍歷(或后根遍歷)。時間復(fù)雜度為O(n)。
利用二叉鏈表中的n+1個空指針域來存放指向某種遍歷次序下的前趨結(jié)點和后繼結(jié)點的指針,這些附加的指針就稱為“線索”,加上線索的二叉鏈表就稱為線索鏈表。線索使得查找中序前趨和中序后繼變得簡單有效,但對于查找指定結(jié)點的前序前趨和后序后繼并沒有什么作用。
樹和森林及二叉樹的轉(zhuǎn)換是唯一對應(yīng)的。
轉(zhuǎn)換方法:
?樹變二叉樹:兄弟相連,保留長子的連線。
?二叉樹變樹:結(jié)點的右孩子與其雙親連。
?森林變二叉樹:樹變二叉樹,各個樹的根相連。
樹的存儲結(jié)構(gòu):
?有雙親鏈表表示法:結(jié)點data | parent,對于求指定結(jié)點的雙親或祖先十分方便,但不適于求指定結(jié)點的孩子及后代。
?孩子鏈表表示法:為樹中每個結(jié)點data | next設(shè)置一個孩子鏈表firstchild,并將data | firstchild存放在一個向量中。
?雙親孩子鏈表表示法:將雙親鏈表和孩子鏈表結(jié)合。
?孩子兄弟鏈表表示法:結(jié)點結(jié)構(gòu)leftmostchild |data | rightsibing,附加兩個分別指向該結(jié)點的最左孩子和右鄰兄弟的指針域?!涞那靶虮闅v與相對應(yīng)的二叉樹的前序遍歷一致;樹的后序遍歷與相對應(yīng)的二叉樹的中序遍歷一致。
樹的帶權(quán)路徑長度是樹中所有葉結(jié)點的帶權(quán)路徑長度之和。樹的帶權(quán)路徑長度最小的二叉樹就稱為最優(yōu)二叉樹(即哈夫曼樹)。
在葉子的權(quán)值相同的二叉樹中,完全二叉樹的路徑長度最短。
哈夫曼樹有n個葉結(jié)點,共有2n-1個結(jié)點,沒有度為1的結(jié)點,這類樹又稱為嚴(yán)格二叉樹。
變長編碼技術(shù)可以使頻度高的字符編碼短,而頻度低的字符編碼長,但是變長編碼可能使解碼產(chǎn)生二義性。如00、01、0001這三個碼無法在解碼時確定是哪一個,所以要求在字符編碼時任一字符的編碼都不是其他字符編碼的前綴,這種碼稱為前綴碼(其實是非前綴碼)。
哈夫曼樹的應(yīng)用最廣泛地是在編碼技術(shù)上,它能夠容易地求出給定字符集及其概率分布的最優(yōu)前綴碼。哈夫曼編碼的構(gòu)造很容易,只要畫好了哈夫曼樹,按分支情況在左路徑上寫代碼0,右路徑上寫代碼1,然后從上到下到葉結(jié)點的相應(yīng)路徑上的代碼的序列就是該結(jié)點的最優(yōu)前綴碼。
第七章 圖
圖的邏輯結(jié)構(gòu)特征就是其結(jié)點(頂點)的前趨和后繼的個數(shù)都是沒有限制的,即任意兩個結(jié)點之間之間都可能相關(guān)。
圖GraphG=(V,E),V是頂點的有窮非空集合,E是頂點偶對的有窮集。
有向圖Digraph:每條邊有方向;
無向圖Undigraph:每條邊沒有方向;
有向完全圖:具有n*(n-1)條邊的有向圖;
無向完全圖:具有n*(n-1)/2條邊的無向圖;
有根圖:有一個頂點有路徑到達(dá)其它頂點的有向圖;
簡單路徑:是經(jīng)過頂點不同的路徑;
簡單回路:是開始和終端重合的簡單路徑;
網(wǎng)絡(luò):是帶權(quán)的圖。
圖的存儲結(jié)構(gòu):
?鄰接矩陣表示法:用一個n階方陣來表示圖的結(jié)構(gòu)是唯一的,適合稠密圖。
?無向圖:鄰接矩陣是對稱的。
?有向圖:行是出度,列是入度。
建立鄰接矩陣算法的時間是O(n+n^2+e),其時間復(fù)雜度為O(n^2)
?鄰接表表示法:用頂點表和鄰接表構(gòu)成不是唯一的,適合稀疏圖。
?頂點表結(jié)構(gòu) vertex | firstedge,指針域存放鄰接表頭指針。
?鄰接表:用頭指針確定。
?無向圖稱邊表;
?有向圖又分出邊表和逆鄰接表;
?鄰接表結(jié)點結(jié)構(gòu)為 adjvex | next,時間復(fù)雜度為O(n+e),空間復(fù)雜度為O(n+e)。
圖的遍歷:
?深度優(yōu)先遍歷:借助于鄰接矩陣的列。使用棧保存已訪問結(jié)點。
?廣度優(yōu)先遍歷:借助于鄰接矩陣的行。使用隊列保存已訪問結(jié)點。
生成樹的定義:若從圖的某個頂點出發(fā),可以系統(tǒng)地訪問到圖中所有頂點,則遍歷時經(jīng)過的邊和圖的所有頂點所構(gòu)成的子圖稱作該圖的生成樹。
最小生成樹:圖的生成樹不唯一,從不同的頂點出發(fā)可得到不同的生成樹,把權(quán)值最小的生成樹稱為最小生成樹(MST)?!?gòu)造最小生成樹的算法:
?Prim算法的時間復(fù)雜度為O(n^2)與邊數(shù)無關(guān)適于稠密圖。
?Kruskal算法的時間復(fù)雜度為O(lge),主要取決于邊數(shù),較適合于稀疏圖。
最短路徑的算法:
?Dijkstra算法,時間復(fù)雜度為O(n^2)。
?類似于prim算法。
拓?fù)渑判颍菏菍⒂邢驘o環(huán)圖G中所有頂點排成一個線性序列,若∈E(G),則在線性序列u在v之前,這種線性序列稱為拓?fù)湫蛄小?/P>
拓?fù)渑判蛞灿袃煞N方法:
?無前趨的頂點優(yōu)先:每次輸出一個無前趨的結(jié)點并刪去此結(jié)點及其出邊,最后得到的序列即拓?fù)湫蛄小?/P>
?無后繼的結(jié)點優(yōu)先:每次輸出一個無后繼的結(jié)點并刪去此結(jié)點及其入邊,最后得到的序列是逆拓?fù)湫蛄小?/P>
第八章 排序
記錄中可用某一項來標(biāo)識一個記錄,則稱為關(guān)鍵字項,該數(shù)據(jù)項的值稱為關(guān)鍵字。
排序是使文件中的記錄按關(guān)鍵字遞增(或遞減)次序排列起來。
?基本操作:比較關(guān)鍵字大小;改變指向記錄的指針或移動記錄。
?存儲結(jié)構(gòu):順序結(jié)構(gòu)、鏈表結(jié)構(gòu)、索引結(jié)構(gòu)?!〗?jīng)過排序后這些具有相同關(guān)鍵字的記錄之間的相對次序保持不變,則稱這種排序方法是穩(wěn)定的,否則排序算法是不穩(wěn)定的。
排序過程中不涉及數(shù)據(jù)的內(nèi)、外存交換則稱之為“內(nèi)部排序”(內(nèi)排序),反之,若存在數(shù)據(jù)的內(nèi)外存交換,則稱之為外排序。
內(nèi)部排序方法可分五類:插入排序、選擇排序、交換排序、歸并排序和分配排序。
評價排序算法好壞的標(biāo)準(zhǔn)主要有兩條:執(zhí)行時間和所需的輔助空間,另外算法的復(fù)雜程序也是要考慮的一個因素。
插入排序:
?直接插入排序;
?逐個向前插入到合適位置;
?哨兵(監(jiān)視哨)有兩個作用;
?作為臨變量存放R[i];
?是在查找循環(huán)中用來監(jiān)視下標(biāo)變量j是否越界;
?直接插入排序是就地的穩(wěn)定排序。時間復(fù)雜度為O(n^2),比較次數(shù)為(n+2)(n-1)/2;移動次數(shù)為(n+4)(n-1)/2。
希爾排序:
?等間隔的數(shù)據(jù)比較并按要求順序排列,最后間隔為1;
?希爾排序是就地的不穩(wěn)定排序。時間復(fù)雜度為O(n^1.25),比較次數(shù)為(n^1.25);移動次數(shù)為(1.6n^1.25);
交換排序: 冒泡排序:
?自下向上確定最輕的一個。
?自上向下確定最重的一個。
?自下向上確定最輕的一個,后自上向下確定最重的一個。
?冒泡排序是就地的穩(wěn)定排序。時間復(fù)雜度為O(n^2),比較次數(shù)為n(n-1)/2;移動次數(shù)為3n(n-1)/2;
快速排序:
?以第一個元素為參考基準(zhǔn),設(shè)定、動兩個指針,發(fā)生交換后指針交換位置,直到指針重合。重復(fù)直到排序完成。
?快速排序是非就地的不穩(wěn)定排序。時間復(fù)雜度為O(nlog2n),比較次數(shù)為n(n-1)/2。
選擇排序:
?直接選擇排序;
?選擇最小的放在比較區(qū)前;
?直接選擇排序就地的不穩(wěn)定排序。時間復(fù)雜度為O(n^2)。比較次數(shù)為n(n-1)/2。
堆排序
?建堆:按層次將數(shù)據(jù)填入完全二叉樹,從int(n/2)處向前逐個調(diào)整位置。
?然后將樹根與最后一個葉子交換值并斷開與樹的連接并重建堆,直到全斷開。
?堆排序是就地不穩(wěn)定的排序,時間復(fù)雜度為O(nlog2n),不適宜于記錄數(shù)較少的文件。
歸并排序:
?先兩個一組排序,形成(n+1)/2組,再將兩組并一組,直到剩下一組為止。
?歸并排序是非就地穩(wěn)定排序,時間復(fù)雜度是O(nlog2n),
分配排序:
箱排序:
?按關(guān)鍵字的取值范圍確定箱子數(shù),按關(guān)鍵字投入箱子,鏈接所有非空箱。
?箱排序的平均時間復(fù)雜度是線性的O(n)。
基數(shù)排序:
?從低位到高位依次對關(guān)鍵字進(jìn)行箱排序。
?基數(shù)排序是非就穩(wěn)定的排序,時間復(fù)雜度是O(d*n+d*rd)。
各種排序方法的比較和選擇:
?待排序的記錄數(shù)目n;n較大的要用時間復(fù)雜度為O(nlog2n)的排序方法;
?記錄的大小(規(guī)模);記錄大最好用鏈表作為存儲結(jié)構(gòu),而快速排序和堆排序在鏈表上難于實現(xiàn);
?關(guān)鍵字的結(jié)構(gòu)及其初始狀態(tài);
?對穩(wěn)定性的要求;
?語言工具的條件;
?存儲結(jié)構(gòu);
?時間和輔助空間復(fù)雜度。
第九章 查找
查找的同時對表做修改操作(如插入或刪除)則相應(yīng)的表稱之為動態(tài)查找表,否則稱之為靜態(tài)查找表。
衡量查找算法效率優(yōu)劣的標(biāo)準(zhǔn)是在查找過程中對關(guān)鍵字需要執(zhí)行的平均比較次數(shù)(即平均查找長度ASL)。
線性表查找的方法:
?順序查找:逐個查找,ASL=(n+1)/2;
?二分查找:取中點int(n/2)比較,若小就比左區(qū)間,大就比右區(qū)間。用二叉判定樹表示。ASL=(∑(每層結(jié)點數(shù)*層數(shù)))/N;
?分塊查找:要求“分塊有序”,將表分成若干塊內(nèi)部不一定有序,并抽取各塊中的最大關(guān)鍵字及其位置建立有序索引表。
二叉排序樹(BST)定義是二叉排序樹是空樹或者滿足如下性質(zhì)的二叉樹:
?若它的左子樹非空,則左子樹上所有結(jié)點的值均小于根結(jié)點的值;
?若它的右子樹非空,則右子樹上所有結(jié)點的值均大于根結(jié)點的值;
?左、右子樹本身又是一棵二叉排序樹。
二叉排序樹的插入、建立、刪除的算法平均時間性能是O(nlog2n)。
二叉排序樹的刪除操作可分三種情況進(jìn)行處理:
?*P是葉子,則直接刪除*P,即將*P的雙親*parent中指向*P的指針域置空即可。
?*P只有一個孩子*child,此時只需將*child和*p的雙親直接連接就可刪去*p。
?*p有兩個孩子,則先將*p結(jié)點的中序后繼結(jié)點的數(shù)據(jù)到*p,刪除中序后繼結(jié)點。
關(guān)于B-樹(多路平衡查找樹)。它適合在磁盤等直接存取設(shè)備上組織動態(tài)的查找表,是一種外查找算法。建立的方式是從下向上拱起?!∩⒘屑夹g(shù):將結(jié)點按其關(guān)鍵字的散列地址存儲到散列表的過程稱為散列。
散列函數(shù)的選擇有兩條標(biāo)準(zhǔn):簡單和均勻。
常見的散列函數(shù)構(gòu)的造方法:
?平方取中法:hash=int((x^2)0)
?除余法:表長為m,hash=x%m
?相乘取整法:hash=int(m*(x*A-int(x*A));A=0.618
?隨機(jī)數(shù)法:hash=random(x)。
處理沖突的方法:
開放定址法: 一般形式為hi=(h(key)+di)%m1≤i≤m-1,開放定址法要求散列表的裝填因子α≤1。
?開放定址法類型:
?線性探查法:address=(hash(x)+i)%m;
?二次探查法:address=(hash(x)+i^2)%m;
?雙重散列法:address=(hash(x)+i*hash(y))%m;
?拉鏈法: 是將所有關(guān)鍵字為同義詞的結(jié)點鏈接在同一個單鏈表中。
?拉鏈法的優(yōu)點:
?拉鏈法處理沖突簡單,且無堆積現(xiàn)象;
?鏈表上的結(jié)點空間是動態(tài)申請的適于無法確定表長的情況;
?拉鏈法中α可以大于1,結(jié)點較大時其指針域可忽略,因此節(jié)省空間;
?拉鏈法構(gòu)造的散列表刪除結(jié)點易實現(xiàn)。
?拉鏈法也有缺點:當(dāng)結(jié)點規(guī)模較小時,用拉鏈法中的指針域也要占用額外空間,還是開放定址法省空間。
第十章 文件
文件是性質(zhì)相同的記錄的集合。記錄是文件中存取的基本單位,數(shù)據(jù)項是文件可使用的最小單位,數(shù)據(jù)項有時稱字段或者屬性。
文件
?邏輯結(jié)構(gòu)是一種線性結(jié)構(gòu)。
?操作有:檢索和維護(hù)。并有實時和批量處理兩種處理方式。
文件
?存儲結(jié)構(gòu)是指文件在外存上的組織方式。
?基本的組織方式有:順序組織、索引組織、散列組織和鏈組織。
?常用的文件組織方式:順序文件、索引文件、散列文件和多關(guān)鍵字文件。
評價一個文件組織的效率,是執(zhí)行文件操作所花費的時間和文件組織所需的存儲空間。
檢索功能的多寡和速度的快慢,是衡量文件操作質(zhì)量的重要標(biāo)志。
順序文件是指按記錄進(jìn)入文件的先后順序存放、其邏輯順序和物理順序一致的文件。主關(guān)鍵字有序稱順序有序文件,否則稱順序無序文件。
一切存儲在順序存儲器(如磁帶)上的文件都只能順序文件,只能按順序查找法存取。 順序文件的插入、刪除和修改只能通過復(fù)制整個文件實現(xiàn)。
索引文件的組織方式:通常是在主文件之外建立一張索引表指明邏輯記錄和物理記錄之間一一對應(yīng)的關(guān)系,它和主文件一起構(gòu)成索引文件。
索引非順序文件中的索引表為稠密索引。索引順序文件中的索引表為稀疏索引。
若記錄很大使得索引表也很大時,可對索引表再建立索引,稱為查找表。是一種靜態(tài)索引。
索引順序文件常用的有兩種:
?ISAM索引順序存取方法:是專為磁盤存取文件設(shè)計的,采用靜態(tài)索引結(jié)構(gòu)。
?VSAM虛擬存儲存取方法:采用B+樹作為動態(tài)索引結(jié)構(gòu),由索引集、順序集、數(shù)據(jù)集組成。
散列文件是利用散列存儲方式組織的文件,亦稱為直接存取文件。
散列文件
?優(yōu)點是:文件隨機(jī)存放,記錄不需要排序;插入刪除方便;存取速度快;不需要索引區(qū),節(jié)省存儲空間。
?缺點是:不能進(jìn)行順序存取,只能按關(guān)鍵字隨機(jī)存取,且詢問方式限地簡單詢問,需要重新組織文件。
多重表文件:對需要查詢的次關(guān)鍵字建立相應(yīng)的索引,對相同次關(guān)鍵字的記錄建一個鏈表并將鏈表頭指針、長度、次關(guān)鍵字作為索引表的索引項。
倒排表:次關(guān)鍵字索引表稱倒排表,主文件和倒排表構(gòu)成倒排文件。
?2008年10月各地自考報名時間及考試課程查詢
?環(huán)球網(wǎng)校2009年自考課程查看
最新資訊
- 2026年4月自學(xué)考試《習(xí)概15040》名詞解釋??家c整理及答題模板2026-03-08
- 2026年4月自考《馬原》簡答題??贾攸c,附近4年真題匯總【免費領(lǐng)取】2026-03-08
- 2026年4月自考本科《英語》萬能答題模板!收藏備用~2026-03-07
- 2026年4月自學(xué)考試《中國近現(xiàn)代史綱要》名詞解釋??家c整理2026-03-06
- 重點!2026年4月自學(xué)考試《習(xí)概》評分標(biāo)準(zhǔn)出爐,這些題型分值最高2026-03-05
- 2026年4月自考《毛概》簡答、論述高分模板:答題技巧+時政結(jié)合策略2026-03-05
- 2026年4月自學(xué)考試《習(xí)概》萬能答題模板!收藏備用~2026-03-04
- 2026年4月自考本科備考:《英語二》核心考點、必記知識點2026-02-22
- 2026年4月自考熱門專業(yè)難度升級!高數(shù)、英語答題模板速收藏2026-02-21
- 【免費領(lǐng)取】自學(xué)考試歷年真題合集:出題套路一眼看懂(適配26年4月備考)2026-02-11