排序算法可以说是计算机专业学生要学习的最基础的算法,但其实也是最重要的,现在大部分互联网公司笔试面试也都会涉及到排序算法的知识。除了了解思想之外,还应该动手写一写,分析一些具体思路、时间复杂度、空间复杂度和稳定性等。

我们面试讨论小分队也简单讨论了一下排序算法,为了加深记忆,我自己也动手写了一些代码(Linux平台写的,自己测试是通过了),并做一些分析(由于水平较水,代码可能有误!)。

9种排序算法分别为:选择排序、冒泡排序、插入排序、希尔排序、归并排序、堆排序、快速排序、计数排序、基数排序!

1. 选择排序

基本思想:从第一个位置开始依次选择该位置的元素,第i次扫描就可以选出第i小的元素,思想很简单,现在用的较少。

特点:平均时间复杂度O(n^2),最坏时间复杂度O(n^2),额外空间O(1),不稳定排序(举例:序列5 8 5 2 9, 第一遍选择第1个元素5会和2交换,原序列中2个5的相对前后顺序就被破坏了),n较小时较好!

代码:

void select_sort(int *a, int n)
{
    for(inti = 1; i <= n; i++) {
        intmin_pos = i;
        for(intj = i+1; j <= n; j++)
            if(a[j] < a[min_pos])
                min_pos = j;
                                                                                                                                                                                                                  
        if(min_pos != i) {
            inttemp = a[i];
            a[i] = a[min_pos];
            a[min_pos] = temp;
        }   
    }   
}

2. 冒泡排序

基本思想:顾名思义,每一趟都通过相邻元素两两比较,通过交换将较小的元素往前移动,一趟下来就可以将最小的元素(气泡)移动到最前面。一般会加一个标志flag,若一趟扫描没有任何元素交换,则说明序列已经有序,flag为false,直接退出。

特点:平均时间复杂度O(n^2),最坏时间复杂度O(n^2),额外空间O(1),稳定排序(因为比较和交换都是两相邻元素,相等时不交换),n较小时较好!

代码:

void bubble_sort(int *a, int n)
{
    boolflag =false;
    for(inti = 1; i <= n; i++) {
        for(intj = n; j > i; j--)
            if(a[j] < a[j-1]) {
                inttemp = a[j];
                a[j] = a[j-1];
                a[j-1] = temp;
                flag =true;
            }
        if(!flag)
            return;
    }
}

3. 插入排序

基本思想:假定一个已排好序的序列和一个元素,只需将该元素从序列末尾向前比较,找到第一个小于它的序列元素,排在其之后即可。思想类似于玩扑克牌时整理牌面。

特点:平均时间复杂度O(n^2),最坏时间复杂度O(n^2),额外空间O(1),稳定排序(比较元素和序列时,找到序列中相等元素的话,排在其之后),序列大部分已排好序时(时间复杂度可提升至O(n))较好!

代码:

void insert_sort(int *a, int n)
{
    inttemp;
    for(inti =2; i <= n; i++) {
        intj = i - 1;
        temp = a[i];
        while(j >= 1) {
            if(a[j] > temp) {
                a[j+1] = a[j];
                j--;
            }else
                break;
        }
        a[j+1] = temp;
    }
}

4. 希尔排序

基本思想:插入排序的升级版(根据其特点:序列大部分已排好序时效率很高),将数据分为不同的组,先对每一组进行排序,然后对所有元素进行一次排序(即最后步长必须为1),步长的选择是递减的,比如5、3、1,现在一般使用D.E.Knuth分组方法(n很大是,用h(n+1)=3h(n)+1来分组,即1、4、13......)。

特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n^s)(1<s<2),额外空间O(1),不稳定排序(相等元素在不同组里,交换后相对顺序可能改变)!

代码:

void shell_sort(int *a, int n)
{   //我这里步长为5、3、1,仅为举例
    for(intgap = 5; gap > 0; gap -= 2)
        for(inti = gap + 1; i <=n; i++) {
            intj = i - gap;
            inttemp = a[i];
            while(j >= 1) {
                if(a[j] > temp) {
                    a[j + gap] = a[j];
                    j -= gap;
                }else
                    break;
            }
            a[j+gap] = temp;
        }
}

5. 归并排序

基本思想:分治的思想,就是用递归先将序列分解成只剩一个元素的子序列,然后逐渐向上进行合并,每次合并过程就是将两个内部已排序的子序列进行合并排序,只需O(n)时间。

特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n*logn),额外空间O(n)(另外需要一个数组),稳定排序,当n较大时较好(当也不能太大,用了递归就要考虑栈溢出)!

代码:

int b[MAX] = {0};
                                                                                                                               
void merge(int *a,intlow, int mid, inthigh)
{
    inti = low, j = mid + 1;//左边和右边的初始位置
    intk = i;
    while(i <= mid && j <= high) {
        if(a[i] <= a[j]) {
            b[k++] = a[i];
            i++;
        }else{
            b[k++] = a[j];
            j++;
        }
    }
    while(i <= mid){
        b[k++] = a[i++];
    }
    while(j <= high){
        b[k++] = a[j++];
    }
                                                                                                                               
    for(intx = 1, i = low; x <= high-low+1; x++, i++)
        a[i] = b[i];
}
                                                                                                                               
voidmerge_sort(int*a,int low, int high)
{
    intmid;
    if(low < high) {
        mid = (low + high) / 2;
        merge_sort(a, low, mid);
        merge_sort(a, mid+1, high);
        merge(a, low, mid, high);
    }
}

6. 堆排序

基本思想:利用最大堆的性质——父节点拥有最大值,所以不断的将堆的根节点与最后节点交换,减小堆长度,然后再恢复堆性质,堆排序主要就是建立最大堆和不断恢复堆性质两个过程。堆排序不需要用到递归,所以适合海量数据处理,同时堆还可以用于优先级队列。

特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n*logn),额外空间O(1),不稳定排序(涉及根节点与最后节点的交换,可能会破坏两相等元素的相对位置!),当n较大时较好(海量数据)!

代码:

void max_heapify(int *a, int p, int n)
{
    intleft = 2 * p;
    intright = 2 * p + 1;
    intlarge = p; 
    if(left <= n && a[left] > a[p])
        large = left;
    if(right <= n && a[right] > a[large])
        large = right;
                                                                                                                
    if(large != p) {
        inttemp = a[p];
        a[p] = a[large];
        a[large] = temp;
        max_heapify(a, large, n);
    }
}
                                                                                                    
voidheap_sort(int*a,int n)
{
    //build_max_heap
    for(inti = n/2; i > 0; i--)
        max_heapify(a, i, n);
                                                                                                    
    inttemp;
    while(n > 1){
        temp = a[n];
        a[n] = a[1];
        a[1] = temp;
                                                                                                            
        --n;
        max_heapify(a, 1, n);
    }
}

7. 快速排序

基本思想:快排是目前使用最多的排序算法,每次都是先选择一个位置的元素(可以为序列的最左或最右位置)作为中间值,将比其小的元素放在其左边,比其大的元素放在右边,然后递归对其左边和右边的子序列进行相同操作,直到子序列为单个元素。

特点:平均时间复杂度O(n*logn),最坏时间复杂度O(n^2)(序列基本有序时,退化为冒泡排序),额外空间O(logn),不稳定排序(举例:序列为 5 3 3 4 3 8 9 10 11, 现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱),当n较大时较好(当也不能太大,用了递归就要考虑栈溢出)!

代码:

void quick_sort(int *a, int p, int r)
{
    if(p < r) {
        inttemp;
        intx = a[r];
        inti = p - 1;
        for(intj = p; j < r; j++)
            if(a[j] < x) {
                i++;
                temp = a[j];
                a[j] = a[i];
                a[i] = temp;
            }
                                                                                
        temp = a[i+1];
        a[i+1] = a[r];
        a[r] = temp;
        quick_sort(a, p, i);
        quick_sort(a, i+2, r);
    }
}

8. 计数排序

基本思想:假定输入是有一个小范围内的整数构成的(比如年龄等),利用额外的数组去记录元素应该排列的位置,思想比较简单,看代码即可了解。

特点:在一定限制下时间复杂度为O(n),额外空间O(n)(需要两个数组),稳定排序!

代码:

int b[MAX] = {0};
int c[MAX] = {0};
                                                           
void counting_sort(int *a, int n)
{
                                                           
    for(inti=1; i <= n; i++)
        c[a[i]]++;   //c[i]包含等于i的元素个数
                                                           
    for(inti=1; i < MAX; i++)
        c[i] += c[i-1];//c[i]包含小于等于i的元素个数
                                                           
    for(inti = n; i>0; i--){
        b[c[a[i]]] = a[i];
        c[a[i]]--;
    }
    for(inti = 1; i <=n; i++)
        a[i] = b[i];
}

9. 基数排序

基本思想:只适用于整数排序,确定序列中元素的最大位数d,只要进行d次循环,从低位开始根据相应位置的数进行排序。(我的代码中具体排序是参考了计数排序,数据结构中还可以用链式相关的方法)。

特点:在一定限制下时间复杂度为O(n),额外空间O(n)(需要两个数组),稳定排序!

代码:

int b[MAX] = {0};
int counter[10] = {0};
int get_value(int v, int d) //获取第d位上的值
{
    for(inti = 1; i < d; i++) 
        v = v/10;
    returnv%10;
                                      
}
//只能排序d位的十进制数
voidradix_sort(int*a,int n, int d)
{
    intx;
    for(intk = 1; k <= d; k++) {
        for(inti = 0; i < 10; i++)
            counter[i] = 0;//注意,一定要清零
        for(inti = 1; i <= n; i++) {
            x = get_value(a[i], k);
            counter[x]++;
        }
                                              
        for(inti = 1; i < 10; i++)
            counter[i] += counter[i-1];
        for(inti = n; i > 0; i--) {
            x = get_value(a[i], k);
            b[counter[x]] = a[i];
            counter[x]--;
        }
        for(inti = 1; i <= n; i++)
            a[i] = b[i];
    }
}

排序总结

稳定性:选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法,而冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。

快速排序算法使用最广泛,大数据量时适合使用快速排序、归并排序和堆排序,需要O(n)时间复杂度时(当然要考虑数值范围的限制),可以考虑使用计数排序、基数排序、桶排序(上面未介绍,思想很简单,假设数据分布均匀!)等。

最后是我用来测试排序算法的main函数,非常简单!

#include <iostream>
usingnamespacestd;
                            
constintMAX = 255;
                        
int main ()
{
    intn;
    inta[MAX];
    cin >> n;
    for(inti = 1; i <= n; i++)
        cin >> a[i];
                        
    cout <<"Before sort:";
    for(inti = 1; i <= n; i++)
        cout << a[i] <<" ";
    cout << endl;
    //radix_sort(a, n, 2);
    //select_sort(a, n);
    //insert_sort(a, n);
    //bubble_sort(a, n);
    //quick_sort(a, 1, n);
    //heap_sort(a, n);
    //merge_sort(a, 1, n);
    //counting_sort(a, n);
    //shell_sort(a, n);
    cout <<"Sort:";
    for(inti = 1; i <= n; i++)
        cout << a[i] <<" ";
    cout << endl;
    return0;
}

排序算法基本上就总结如上,告诫自己,不能死记硬背!要理解思想,同时要注意实现上的一些技巧!

Logo

更多推荐