排序算法之【快速排序】

📙作者简介: 清水加冰,目前大二在读,正在学习C/C++、Python、操作系统、数据库等。

📘相关专栏:C语言初阶、C语言进阶、C语言刷题训练营、数据结构刷题训练营、有感兴趣的可以看一看。

欢迎点赞 👍 收藏 ⭐留言 📝 如有错误还望各路大佬指正!

✨每一次努力都是一种收获,每一次坚持都是一种成长✨       

目录


 前言

        快速排序是一种常用的排序算法,也是一种很高效的排序的,它是由Hoare于1962年提出的一种二叉树结构的交换排序方法。本篇文章我将带你深入了解快速排序。

1. 快速排序

        快速排序是一种常用的排序算法,它的基本思想是通过一趟排序将待排序的数据分割成独立的两部分,其中一部分的所有数据都比另一部分的所有数据小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列的目的。快速排序常见的实现方法主要分为三种版本:

  1.  hoare版本
  2. 挖坑法版本
  3. 前后指针版本

 我们废话不多说直接步入正题。

 1.1 hoare版本

        hoare版本是选择一个key值(一般选用最左边)例如:

         然后开始从数组两边开始移动寻找符合条件的值,R向左移动寻找小于key的值,L向右移动寻找大于key的值。R和L都找到符合条件的数字后进行交换。

 然后再继续走,直到L和R相遇停止。

 它们相遇的位置是数字3,3比key小,最后再将相遇位置的数据和key的数据进行交换。整个逻辑过程如下图:

 这个图呈现的逻辑过程更加形象,然后我们再从R和L相遇的位置将数组分为两部分,当左半部分和右半部分有序,那么这个数组就会有序,所以我们重复上述过程:

 继续分,数组最终被细分为一个数据或没有数据。

        当数据为1个或没有时就开始返回,执行完毕后左半部分就变得有序,右半部分也是这样的逻辑,返回后两边子数组就会变得有序,进而使整个数组有序。以上便是hoare版本的整个过程。

 接下来我们对代码进行实现:

void PathSort(int* a, int left,int right)
{
	int key = a[left];
	while (left < right)
	{
		while (a[right] > a[key])
		{
			right--;
		}
		while (a[left] < a[key])
		{
			left--;
		}
		Swap(&a[left], &a[right]);
	}
	Swap(&key, &a[right]);
}

         快速排序的hoare版本有很多的坑,上述的代码是否存在错误呢?

上述的代码存3个问题:

  1. 死循环问题
  2. 数组越界问题
  3. key值交换问题

         首先是死循环问题,R要找比key小的数据,L要找比key大的数据,那当L和R都遇到了和key相同的数据时,它们都停止移动,开始进行交换,交换后仍然相等,以此往复一直交换,进而形成了死循环。

        数组越界问题,R找比key的值,如果R一直到数组遍历结束都没有找到,那它就会发生越界。

        key值交换问题,我们在上述逻辑中,需要将key值(第一个数据)位置上的数据与L和R相遇位置的数据进行交换。而上述代码中交换的是key的值与L和R相遇位置的数据,实际上第一个数据(key值位置)并没有变,这样会造成数据丢失。

 这三个问题都是在编写代码时经常遇到的错误。改正后代码如下:

int PathSort(int* a, int left,int right)
{
	int key = left;
	while (left < right)
	{
		while (right>left && a[right] >= a[key])
		{
			right--;
		}
		while (right > left && a[left] <= a[key])
		{
			left++;
		}
		Swap(&a[left], &a[right]);
	}
	Swap(&a[key], &a[left]);
	return left;
}

上述代码我们是进行了一次调整,接下来就是递归使得左右两边数组有序。递归调用这里没有什么问题,重点在于递归结束条件。当递归到最后时,要么是数组只有一个数据,要么是没有数据。

那要如何编写设置结束条件呢?

        以左边递归为例:第一次进入左边区间是0到4,第二次是0到1,然后key是下标为1的数据,key-1=0,第三次调用传入的key-1=begin=0,返回后调用右边,右边没有数据,key+1=2,end=1,所以由此我们可以做出判断,当begin>=end时,就证明递归已经到最小,然后就返回。

 递归过程如下图:

void QuickSort(int* a, int begin,int end)
{
	if (begin >= end)
	{
		return;
	}
	int key=PathSort(a, begin, end);
	QuickSort(a, begin, key - 1);
	QuickSort(a, key + 1, end);
}

         从上述的逻辑过程,可以发现L和R相遇的位置一定比key小(相遇位置比key小交换才有意义),那凭什么说L和R相遇位置一定比key小?

        它是有一个前提的,就是一定要让R先走,但是又会存在两种情况:

  1. 最后一次R不动让L去相遇。
  2.  L不动让R去相遇。

         如下图让R先走,最后是R不动让L去相遇,但如果是L先走,当R到下标为6的位置停止交换后,L开始走,此时相遇位置就会变成下标为6的位置,数据是9比6大。(R不动,让L去相遇)

 当然还有一种情况,最后一次时是L不动让R去相遇:

 两次交换后如上图,此时R先走,11比key大R会继续走,R就会去和L相遇,相遇的位置还是比key小(L和R交换后,L位置数据一定比key小)。

        上述的方式和代码排序很不稳,上述过程最理想的状态是key的值是中位数,这样在分割数组进行递归时能尽可能将数组二分。

最坏的情况就是没有比key小的数据或者大的数据,那么就会造成如下情况:

         这样它的时间复杂度和空间复杂度也会变差,所以我们还需要对hoare版本的进行优化,以避免这样情况的发生。我们可以将左右和中间的值进行比较,取三数的中间值作为key值。优化后:

//三数取中
int GetMid(int* a, int left, int right)
{
	int mid = (left + right) / 2;
	if (a[mid] > a[left])
	{
		if (a[mid] < a[right])
		{
			return mid;
		}	
		else if(a[left]>a[right])
		{
			return left;
		}
		else
		{
			return right;
		}
	}
	else//a[left]>a[mid]
	{
		if (a[mid] > a[right])
		{
			return mid;
		}
		else if (a[right] < a[left])
		{
			return right;
		}
		else
		{
			return left;
		}
	}
}
int PathSort(int* a, int left,int right)
{
	int mid = GetMid(a, left, right);
	Swap(&a[left], &a[mid]);
	int key = left;
	while (left < right)
	{
		while (right>left && a[right] >= a[key])
		{
			right--;
		}
		while (right > left && a[left] <= a[key])
		{
			left++;
		}
		Swap(&a[left], &a[right]);
	}
	Swap(&a[key], &a[left]);
	return left;
}

1.2 挖坑法

         挖坑法是对hoare版本思路上的一种优化,挖坑法的整体逻辑如下:

         挖坑法不用考虑R先走还是L先走,开始时第一个数据作为坑位,必须R先走,R找到比key小的数数据填补到坑位,R位置形成新的坑位。然后L开始走,遇到比key大的将数据填补到坑位,然后L位置形成新的坑位。具体代码如下:

int PathSort2(int* a, int left, int right)
{
	int mid = GetMid(a, left, right);
	Swap(&a[left], &a[mid]);

	int key = a[left];
    //保存key值左边形成第一个坑位
	int hole = left;
	while (left < right) 
	{
        //右边先走,寻找比key小的数据,填补到左边坑位
		while (right > left && a[right] >=key)
		{
			right--;
		}
		a[hole] = a[right];
		hole = right;
        //左边走,寻找比key大的数据,填补到右边坑位
		while (right > left && a[left] <= key)
		{
			left++;
		}
		a[hole] = a[left];
		hole = left;
	}
	a[hole] =key;
	return hole;
	
}

1.3 双指针版本

         双指针法是对快排的更近一步优化,相对于前两种,思路和代码也更简单,使用两个指针cur和prev,来控制数据进行调整。

逻辑如下:

         cur遍历数组,如果cur比key小,那就prev向后移动,将prev指向的数据于cur指向的数据进行交换。

 然后cur继续向后走,遇到比key小的数据就重复上述过程:

 直到cur遍历结束停止,之后再将prev最终指向位置的数据与key位置的数据进行交换。最终情况如下图:

 根据上述的逻辑,我们对代码进行实现:

int PathSort3(int* a, int left, int right)
{
	int cur = left + 1;
	int prev = left;
	int key = left;
	while (cur <= right)
	{
		if (a[cur] <a[key] )
		{
			prev++;
			Swap(&a[prev], &a[cur]);
		}
		cur++;
	}
	Swap(&a[key], &a[prev]);
	return prev;

}

         在cur指向1和2时,cur指向的数据依然和prev指向的数据进行了交换(此时cur和prev指向同一个数据),此时交换并没有什么意义,所以我们也可以为了防止prev和cur指向同一位置时进行交换,这里我们可以进行优化:

int PathSort3(int* a, int left, int right)
{
	int mid = GetMid(a, left, right);
	Swap(&a[left], &a[mid]);

	int cur = left + 1;
	int prev = left;
	int key = left;
	while (cur <= right)
	{
		if (a[cur] <a[key] && ++prev!=cur)
		{
			Swap(&a[prev], &a[cur]);
		}
		cur++;
	}
	Swap(&a[key], &a[prev]);
	return prev;

}

        双指针法不需要考虑从哪边先走,也不需要考虑数组越界问题,代码和逻辑都十分的清晰简单。在这三种方法的实际调用时都是使用了递归,来进行分治排序。

         但快速排序使用递归是需要不断进行开空间的,快速排序的二分递归模式类似于满二叉树,我们知道,满二叉树的后两层的节点个数占了总个数的75%,所以我们可以考虑在递归到小区间时使用插入排序来进行优化。

void QuickSort2(int* a, int begin, int end)
{
	if (begin >= end)
	{
		return;
	}
	if ((end - begin + 1) > 10)
	{
		int key = PathSort3(a, begin, end);

		QuickSort(a, begin, key - 1);
		QuickSort(a, key + 1, end);
	}
	else
	{
		InsertSort(a + begin, end - begin + 1);
	}
	
}

同时我们还可以使用非递归的方法来实现快排。

2. 非递归实现快速排序

         上述的快速排序使用了递归,但使用递归还是存在弊端的,递归的深度问题,递归创建的空间在栈区,而栈区的空间大概只有8MB,所以我们还是很有必要学习非递归的方法。

 非递归实现快排需要用到栈的数据结构,通过栈来模拟系统栈区。

 不断地入栈每次调整的数组区间,使用栈的特性来模拟递归调用的调整函数。

 还是以上述的数组为例:

以左边为例:

先入栈0和9(数据的区间下标),然后出栈,取栈顶元素作为调整函数的参数,然后调用调整函数,再将key两边的数组下标区间入栈,直至栈为空结束。具体代码实现如下:

逻辑比较简单,不再进行细节讲解。

void QuickSort3(int* a, int begin, int end)
{
	Stack st;
	InItStack(&st);
	StackPush(&st, end);
	StackPush(&st, begin);

	while (!IsEmpty(&st))
	{
		int left=TopData(&st);
		StackPop(&st);
		int right = TopData(&st);
		StackPop(&st);
		int key =PathSort3(a, left, right);
		if (key < right)
		{
			StackPush(&st, right);
			StackPush(&st, key+1);
		}
		if (left < key - 1)
		{
			StackPush(&st, key - 1);
			StackPush(&st, left);
		}
	}

	DestoryStack(&st);

}

总结 

        快速排序是一种极其高效的排序方法,从上述的分析快速排序使用的二分分治排序的方法,可以得出时间复杂度为O(N*logN),同时快速排序并不稳定,我们使用了各种方法来进行优化,使它的时间复杂度稳定在O(N*logN)。好了以上便是本期全部内容,感谢阅读!

版权声明:本文为博主作者:清水加冰原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/2202_75605090/article/details/133395093

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年12月29日
下一篇 2023年12月29日

相关推荐