漫談經(jīng)典排序算法:一、從簡單選擇排序到堆排序的深度解析

Dlfming 2017-01-15

展開全文

1、序言

這是《漫談經(jīng)典排序算法系列》第一篇，該篇從最簡單的選擇排序算法談起，由淺入深的詳細解析兩種選擇排序算法的過程及性能比較。逐步揭露選擇排序的本質(zhì)及其基本思想。

各種排序算法的解析請參考如下：

《漫談經(jīng)典排序算法:一、從簡單選擇排序到堆排序的深度解析》

《漫談經(jīng)典排序算法:二、各種插入排序解析及性能比較》

《漫談經(jīng)典排序算法:三、冒泡排序 && 快速排序》

《漫談經(jīng)典排序算法:四、歸并排序》

《漫談經(jīng)典排序算法:五、線性時間排序(計數(shù)、基數(shù)、桶排序)》

《漫談經(jīng)典排序算法:六、各種排序算法總結(jié)》

　　注：為了敘述方便，本文以及源代碼中均不考慮A[0],默認下標從1開始。

2、提出問題

　?。?）簡單選擇排序和堆排序的基本思想是什么？

　?。?）選擇排序的本質(zhì)是什么？

　　相信看完這篇文章，讀者一定可以找到答案。

3、漫談簡單選擇排序

　　3.1 從一個簡單問題談起

　　給定待排序序列A[ 1.....n ]，選擇出A中最小的記錄（也可以理解為求一個無序數(shù)組A中的最小的元素）。下面給出代碼如下：

//選擇待排序序列a中的最小記錄,其下標為index
　　for(index=i=1;i<>
if(a[i]<>
　　index=i;
}

　　相信這段代碼大家都能看懂，其中A[index]即為要找的最小記錄。也許有人要問作者是在寫選擇排序，干嘛要談這個簡單的問題呢？請不要急，看到后面自然就知道了。

　　3.2 簡單選擇排序的過程

　　描述：給定待排序序列A[ 1......n ] ，選擇出第i小元素，并和A[i]交換，這就是一趟簡單選擇排序。

　　代碼：

//簡單選擇排序
void simpleSelectionSort1(int *a,int n)
{
int i,j,index;
//1.進行n-1趟選擇，每次選出第i小記錄
for(i=1;i<>
index=i;
//2.選擇第i小記錄為a[index]
for(j=i+1;j<>
if(a[j]<>
index=j;
//3.與第i個記錄交換
if(index!=i){
a[i]=a[i]+a[index];
a[index]=a[i]-a[index];
a[i]=a[i]-a[index];
}
}
}

　　示例：假設(shè)給定數(shù)組A[1......6]={ 3,5,8,9,1,2 }，我們來分析一下A數(shù)組進行選擇排序的過程

　　第一趟：i=1，index=5， a[1] 和 a[5] 進行交換。得到序列：{ 1,5,8,9,3,2 }

　　第二趟：i=2，index=6， a[2] 和 a[6] 進行交換。得到序列：{ 1,2,8,9,3,5 }

　　第三趟：i=3，index=5， a[3] 和 a[5] 進行交換。得到序列：{ 1,2,3,9,8,5 }

　　第四趟：i=4，index=6， a[3] 和 a[5] 進行交換。得到序列：{ 1,2,3,5,8,9 }

　　第五趟：i=5，index=5，不用交換。得到序列：{ 1,2,3,5,8,9 }

　　（6-1）趟選擇結(jié)束，得到有序序列：{ 1,2,3,5,8,9 }

　　3.3 性能分析

容易看出，簡單選擇排序所需進行記錄移動的操作次數(shù)較少，這一點上優(yōu)于冒泡排序，最佳情況下（待排序序列有序）記錄移動次數(shù)為0，最壞情況下（待排序序列逆序）記錄移動次數(shù)n-1。外層循環(huán)進行了n-1趟選擇，第i趟選擇要進行n-i次比較。每一趟的時間：n-i次的比較時間+移動記錄的時間（為一常數(shù)0或1，可以忽略）。總共進行了n-1趟。忽略移動記錄的時間，所以總時間為(n-1)*(n-i)=n^2-(i+1)*n+i。時間復雜度為O（n^2）。不管是最壞還是最佳情況下，比較次數(shù)都是一樣的，所以簡單選擇排序平均時間、最壞情況、最佳情況時間復雜度都為O（n^2）。同時簡單選擇排序是一種穩(wěn)定的原地排序算法。當然穩(wěn)定性還是要看具體的代碼，在此就不做深究。

3.4 簡單選擇排序引發(fā)的思考

第一趟排序后：{ 1,5,8,9,3,2 } ，此時A[ 1 ]已經(jīng)有序，我們可以把待排序序列縮減到A[ 2......6 ]

第二趟排序后：{ 1,2,8,9,3,5 }，此時A[ 1...2 ]已經(jīng)有序，我們可以把待排序序列縮減到A[ 3......6 ]

第三趟排序后：{ 1,2,3,9,8,5 }，此時A[ 1...3 ]已經(jīng)有序，我們可以把待排序序列縮減到A[ 4......6 ]

第四趟排序后：{ 1,2,3,5,8,9 }，此時A[ 1...4 ]已經(jīng)有序，我們可以把待排序序列縮減到A[ 5......6 ]

第五趟排序后：{ 1,2,3,5,8,9 }，此時A[ 1...5 ]已經(jīng)有序，我們可以把待排序序列縮減到A[ 6......6 ]

也就是說第i趟后，A[ 1...i ]已經(jīng)有序，待排序序列縮減為A[ (i+1)...n ]。這是一個待排序序列中記錄不斷減少的遞歸過程。也許很多讀者已經(jīng)發(fā)現(xiàn)，我們每次都是從待排序序列中選擇最小的那個記錄然后跟待排序序列的首元素進行交換。于是可以用一個遞歸函數(shù)來進行簡單選擇排序，代碼如下：

//遞歸函數(shù)進行簡單選擇排序
void simpleSelectionSort2(int *a,int n)
{
　　int index,i;
if(n==1)
return;
//1.選擇待排序序列a中的最小記錄,其下標為index
　　for(index=i=1;i<>
if(a[i]<>
　　index=i;
}
//2.最小記錄與待排序序列首元素進行交換
if(index!=1){
a[1]=a[1]+a[index];
a[index]=a[1]-a[index];
a[1]=a[1]-a[index];
}
//3.待排序序列元素個數(shù)減少，遞歸對剩下的無序序列排序
simpleSelectionSort2(a+1,n-1);
}

看到這里，不知大家是否還記得上文3.1中談到的簡單的問題。由此可以看出這個簡單的問題正是簡單選擇排序的本質(zhì)所在。

4、深入堆排序

　　4.1 堆排序的引入

　　從上文我們知道簡單選擇排序的時間復雜度為O（n^2），熟悉各種排序算法的朋友都知道，這個時間復雜度是很大的，所以怎樣減小簡單選擇排序的時間復雜度呢？從上文分析中我們知道簡單選擇排序主要操作是進行關(guān)鍵字的比較，所以怎樣減少比較次數(shù)就是改進的關(guān)鍵。簡單選擇排序中第i趟需要進行n-i次比較，如果我們用到前面已排好

的序列a[1...i-1]是否可以減少比較次數(shù)呢？答案是可以的。舉個例子來說吧，A、B、C進行比賽，B戰(zhàn)勝了A，C戰(zhàn)勝了B，那么顯然C可以戰(zhàn)勝A，C和A就不用比了。正是基于這種思想，有人提出了樹形選擇排序：對n個記錄進行兩兩比較，然后在（[n/2]向上取整）個較小者之間在進行兩兩比較，如此重復，直到選出最小記錄。但是這種排序算法需要的輔助空間比較多，所以威洛姆斯在1964年提出了另一種選擇排序，這就是下面要談的堆排序。

　　4.2 什么是堆

　　首先堆是一種數(shù)據(jù)結(jié)構(gòu)，是一棵完全二叉樹且滿足性質(zhì)：所有非葉子結(jié)點的值均不大于或均不小于其左、右孩子結(jié)點的值，如下是一個堆得示例：

SosoImg

　　9>8,9>5;8>3,8>1;5>2 由此發(fā)現(xiàn)非葉子結(jié)點的值均不小于左右孩子結(jié)點的值，所以這是個大頂堆，即堆頂?shù)闹凳沁@個堆中最大的一個。

　　下面的問題是我們怎么樣在計算機中存儲這個堆呢？也許有人會想到樹的存儲，確實，剛看這個堆我也是這么想的。然而事實并非如此，這個堆可以看成是一個一維數(shù)組A[6]={9,8,5,3,1,2}，那么相應(yīng)的這個數(shù)組需滿足性質(zhì)：A[i]<><=a[2*i+1]>非葉子結(jié)點下標為[n/2]向下取整。

　　為什么是[n/2]向下取整呢？在這里我簡單的說明一下：設(shè)n1表示完全二叉樹中有一個孩子的結(jié)點，n2表示表示完全二叉樹中有兩個孩子的結(jié)點，d表示非葉子結(jié)點的個數(shù)，那么總的結(jié)點個數(shù)：n=n1+2*n2+1。

　　（1）當n為奇數(shù)時，n1=0，n2=(n-1)/2，d=n2+n1=(n-1)/2

　　（2）當n為偶數(shù)時，n1=1，n2=n/2-1，d=n2+n1=n/2

　　由此可以看出d=[n/2]向下取整.

　　注：請大家一定要結(jié)合完全二叉樹形式的堆以及堆的數(shù)組存儲形式來看下面的內(nèi)容，這樣才能真正理解堆排序的過程及其本質(zhì)。

　　4.3 篩選法調(diào)整堆

　?。?）引出：

　　現(xiàn)給定一個大頂堆： SosoImg 即：A[6]={9,8,5,3,1,2}，如果我們稍做破壞，把9跟2互換，同時把a[6]這個結(jié)點從堆中去掉，于是得到下面這個完全二叉樹：

SosoImg A[5]={2,8,5,3,1}

　　顯然它不是一個堆，那我們怎么把它調(diào)整為一個堆呢？首先觀察，我們只是改變了根結(jié)點的值，所以根結(jié)點左、右子樹均是大頂堆。其次思考，既然是根結(jié)點可能破壞了堆的性質(zhì)，那我們就可以把根結(jié)點往下沉，讓最大值網(wǎng)上浮，即比較根結(jié)點和左、右孩子的值，若根結(jié)點的值不小于孩子結(jié)點的值，說明根結(jié)點并沒有破壞堆的性質(zhì)，不用調(diào)整；若根結(jié)點的值小于左右孩子結(jié)點中的任意一個值，則根結(jié)點與孩子結(jié)點中較大的一個互換，互換之后又可能破壞了左或右子樹的堆性質(zhì)，于是要對子樹進行上述調(diào)整。這樣的一次調(diào)整我們稱之為一次篩選。

　?。?）代碼：

//調(diào)整堆，保持大頂堆的性質(zhì),參數(shù)i指向根結(jié)點
void maxHeap(int *a,int n,int i)
{
//left、right、largest分別指向
//左孩子、右孩子、{a[i],a[left]}中最大的一個
int left,right,largest;
largest=left=2*i;
if(left>n)
return;
right=2*i+1;
if(right<=n && a[right]>a[left]){
　　largest=right;
}
if(a[i]
a[i]=a[i]+a[largest];
a[largest]=a[i]-a[largest];
　　a[i]=a[i]-a[largest];
//自上而下調(diào)整堆
maxHeap(a,n,largest);
}
}

（3）示例

以這個完全二叉樹為例： SosoImg A[5]={2,8,5,3,1}

第一次篩選：2和8交換

SosoImg A[5]={8,2,5,3,1}

第二次篩選：2和3交換

SosoImg A[5]={8,3,5,2,1}

篩選完畢，得到大頂堆A[5]={8,3,5,2,1}。

（4）時間代價分析

每一次篩選的過程就是調(diào)用一次maxHeap函數(shù)，需要的時間是O（1）。那么要執(zhí)行多少次篩選呢？從上述中可以看出，每一次篩選根結(jié)點都往下沉，所以篩選次數(shù)不會超過完全二叉樹的深度：（[log2n]向下取整+1），其中n為結(jié)點個數(shù),2為底數(shù),即時間復雜度為O（log2n）

為什么n個結(jié)點的完全二叉樹的深度是([log2n]向下取整+1)呢？這里給出簡單的說明：

　　深度為h的完全二叉樹至多有2^h-1個結(jié)點，即2^(h-1)<><><>2n<>[log2n]向下取整+1 .

　　4.4 建堆

　　4.3中敘述了堆的篩選過程，但是給定一個待排序的序列，怎樣通過篩選使這個序列滿足堆的性質(zhì)呢？

　　給定待排序序列 SosoImg A[6]={3,5,8,9,1,2},怎樣使它變成一個堆呢？

　　仔細想一想篩選法的前提條件是什么：根結(jié)點的左右子樹已經(jīng)是堆。那么這棵樹中哪個結(jié)點的左右子樹是堆呢，很自然的發(fā)現(xiàn)是最后一個非葉子結(jié)點，所以我們在這里需要自下而上的調(diào)整這個完全二叉樹。

　　（2）代碼：

//建堆
void creatHeap(int *a,int n)
{
int i;
//自下而上調(diào)整堆
for(i=n/2;i>=1;i--)
maxHeap(a,n,i);
}

　?。?）示例

　　待排序序列： SosoImg A[6]={3,5,8,9,1,2},

　　以8為根結(jié)點調(diào)整堆后：因為8>2，此處不進行記錄移動操作

　　以5為根結(jié)點調(diào)整堆后：5<>

SosoImg 　　A[6]={3,9,8,5,1,2}

　　以3為根結(jié)點調(diào)整堆后：3<>

SosoImg A[6]={9,3,8,5,1,2}

　　以9為根的左子樹不滿足大頂堆的性質(zhì)，所以以3為跟調(diào)整堆,即交換3和5，得A[6]={9,5,8,3,1,2}

　?。?）時間代價分析

　　從最后一個非葉子結(jié)點到第二個結(jié)點，總共循環(huán)了n/2-1次，每次調(diào)用maxHeap函數(shù)，4.3中已經(jīng)分析過maxHeap時間復雜度為O（log2n）。所以建堆的時間復雜度為O（n*log2n）

　　4.5 堆排序

　　（1）堆排序過程

　　也許有的朋友想問：不是講堆排序嗎，為什么不直接講呢，而是先敘述篩選法和建堆呢？因為篩選法和建堆就構(gòu)成了堆排序，講到這里，堆排序可以說是水到渠成。所以一定要理解篩選法和建堆的過程。

　　過程描述：1、建堆 2、將堆頂記錄和堆中最后一個記錄交換 3、篩選法調(diào)整堆，堆中記錄個數(shù)減少一個，重復第2步。整個過程中堆是在不斷的縮減。

　?。?）代碼

//堆排序
void heapSort(int *a,int n)
{
int i;
creatHeap(a,n);//建堆
for(i=n;i>=2;i--){
//堆頂記錄和最后一個記錄交換
a[1]=a[1]+a[i];
a[i]=a[1]-a[i];
a[1]=a[1]-a[i];
//堆中記錄個數(shù)減少一個，篩選法調(diào)整堆
maxHeap(a,i-1,1);
}
}

　?。?）示例
0.待排序序列：

SosoImg A[6]={3,5,8,9,1,2},

　　1.建堆后（建堆過程參見4.4）：

SosoImg A[6]={9,3,8,5,1,2}

　　2.9和2交換，然后把9從堆中去掉后：

SosoImg A[6]={2,3,8,5,1,9}

　　3.篩選法調(diào)整堆A[5]={2,3,8,5,1}后（調(diào)整過程參見4.3）：

SosoImg A[6]={8,3,2,5,1,9}

　　4.堆頂記錄與最后一個記錄互換，重復第二步，但是堆頂記錄和最后一個記錄的值變了

　?。?）堆排序性能分析

　　堆排序時間=建堆時間+調(diào)整堆時間。從上文中知道建堆時間復雜度為O（n*log2n）。篩選法調(diào)整堆（maxHeap函數(shù)）時間O（log2n），總共循環(huán)了n-1次maxHeap函數(shù)，所以調(diào)整堆時間復雜度為O（n*log2n）。得出堆排序時間復雜度O（n*log2n）。

　　熟悉了堆排序的過程后，可以發(fā)現(xiàn)堆排序不存在最佳情況，待排序序列是有序或者逆序時，并不對應(yīng)于堆排序的最佳或最壞情況。且在最壞情況下時間復雜度也是O（n*log2n）。此外堆排序是不穩(wěn)定的原地排序算法。

　　4.6 反思堆排序 ------ 揭開選擇排序的本質(zhì)和基本思想

　　敘述到這里，堆排序就敘述完了。不知道大家發(fā)現(xiàn)沒有，上文中每一個樹形的堆邊上都有一個數(shù)組，其實待排序的整個過程中都是數(shù)組元素在不斷的交換移動，樹形的堆只是能形象的表示這個過程。通過觀察這個數(shù)組的變化，我們發(fā)現(xiàn)了什么呢？

　　仔細回想一下篩選法調(diào)整堆的過程我們發(fā)現(xiàn)，第i次調(diào)整堆，其實就是把A中的第i大元素放到首位置A[1]，然后A[1]和A[n-i+1]互換.這樣A[(n-i+1)...n]就已經(jīng)有序，于是又把A[1...n-i]看成一個堆再進行排序，如此重復。

　　還記得3.1中提到那個簡單的問題（選擇出A中最小的記錄）嗎？調(diào)整堆不就是選擇出待排序序列中的最大值嗎？所以堆排序的本質(zhì)和選擇排序的本質(zhì)是一樣的。選擇一個待排序序列中的最?。ù螅┲?，這就是選擇排序的本質(zhì)。

　　敘述到此，相信大家已然知道開篇提出的兩個問題的答案了吧。選擇排序的基本思想是：每一趟從n-i+1個記錄中選擇最?。ù螅┯涗浐偷趇（n-i+1）個記錄交換。

5、附件

　　5.1 附件1

　　參考文獻：《數(shù)據(jù)結(jié)構(gòu)》嚴蔚敏版《算法導論》第二版

　　5.2 附件2

　　本文涉及的源代碼免積分下載地址：http://download.csdn.net/detail/touch_2011/3594107

　　5.3 附件3

　　源代碼

　　simple_selection_sort.c

#include
//簡單選擇排序
void simpleSelectionSort1(int *a,int n)
{
int i,j,index;
//1.進行n-1趟選擇，每次選出第i小記錄
for(i=1;i<>
index=i;
//2.選擇第i小記錄為a[index]
for(j=i+1;j<>
if(a[j]<>
index=j;
//3.與第i個記錄交換
if(index!=i){
a[i]=a[i]+a[index];
a[index]=a[i]-a[index];
a[i]=a[i]-a[index];
}
}
}
//遞歸函數(shù)進行簡單選擇排序
void simpleSelectionSort2(int *a,int n)
{
　　int index,i;
if(n==1)
return;
//1.選擇待排序序列a中的最小記錄,其下標為index
　　for(index=i=1;i<>
if(a[i]<>
　　index=i;
}
//2.最小記錄與待排序序列首元素進行交換
if(index!=1){
a[1]=a[1]+a[index];
a[index]=a[1]-a[index];
a[1]=a[1]-a[index];
}
//3.待排序序列元素個數(shù)減少，遞歸對剩下的無序序列排序
simpleSelectionSort2(a+1,n-1);
}

　　heap_sort.c

#include
//調(diào)整堆，保持大頂堆的性質(zhì),參數(shù)i指向根結(jié)點
void maxHeap(int *a,int n,int i)
{
//left、right、largest分別指向
//左孩子、右孩子、{a[i],a[left]}中最大的一個
int left,right,largest;
largest=left=2*i;
if(left>n)
return;
right=2*i+1;
if(right<=n && a[right]>a[left]){
　　largest=right;
}
if(a[i]
a[i]=a[i]+a[largest];
a[largest]=a[i]-a[largest];
　　a[i]=a[i]-a[largest];
//自上而下調(diào)整堆
maxHeap(a,n,largest);
}
}
//建堆
void creatHeap(int *a,int n)
{
int i;
//自下而上調(diào)整堆
for(i=n/2;i>=1;i--)
maxHeap(a,n,i);
}
//堆排序
void heapSort(int *a,int n)
{
int i;
creatHeap(a,n);//建堆
for(i=n;i>=2;i--){
//堆頂記錄和最后一個記錄交換
a[1]=a[1]+a[i];
a[i]=a[1]-a[i];
a[1]=a[1]-a[i];
//堆中記錄個數(shù)減少一個，篩選法調(diào)整堆
maxHeap(a,i-1,1);
}
}

　　test.c

#include
#include
#include'heap_sort.c'
#include'simple_selection_sort.c'
void main()
{
int i;
int a[7]={0,3,5,8,9,1,2};//不考慮a[0]
　　simpleSelectionSort1(a,6);
simpleSelectionSort1(a,6);
heapSort(a,6);
for(i=1;i<>
printf('%-4d',a[i]);
printf('\n');
}