算法解惑：快速排序(二) | VyronLee's Notebook

type

Post

status

Published

date

Mar 10, 2024

slug

summary

本文继续探讨快速排序算法，介绍了两种优化算法：两路快速排序和三向切分快速排序。两路快速排序通过从数组两端同时扫描并交换元素以处理含有大量相同元素的数组，减少了不平衡分区的问题。三向切分快速排序进一步优化了对重复元素多的数组的排序，它通过将数组划分为小于、等于和大于基准值的三个部分，减少了不必要的交换操作并降低了递归深度。这两种方法都提高了快速排序在特定情况下的性能。

两路快速排序

基本概念

两路快速排序（Two-Way Quick Sort）是对基本快速排序的又一种改进。在这个变体中，分区操作跟一路快速排序有所不一样，会同时从数组的两端开始，分别向中间进行扫描，直到找到需要交换的一对元素为止，然后交换这对元素的位置。

算法解释

在两路快速排序中，我们首先选择第一个元素作为基准值，然后设置两个指针i和j分别指向数组的头部和尾部。

两个指针分别向中间移动，右指针j寻找比基准值小的元素，左指针i寻找比基准值大的元素，当找到这样的一对元素时，交换它们的位置。注意：需要先移动右指针j！

重复这个过程直到两个指针相遇，此时便找到基准值所在位置j。

交换基准值与右指针j所指元素，一次分区流程即结束。

递归左区间以及右区间，重复执行上述步骤，直到每个区间内剩下1个或0个元素，排序终止。

代码示例

过程说明

我们仍然以代码中的数据 [23,4,41,8,65,34,8,22,7,84,14,8] 为例进行说明

第一次分区：low = 0, high = 11, pivot = 23 ，流程如下

第一次分区结果：[22,4,8,8,14,7,8,23,34,84,65,41] 其中 j = 7 为 pivot(23) 的最终位置。通过对比可以看出，两路排序比一路排序的第一次分区步骤就少不少。

然后对左边区域 low = 0, high = 6 进行递归分区，依次得到结果：

[(8,4,8,8,14,7,22),23,34,84,65,41] [(7,4,8,8,8,14),22,23,34,84,65,41] [(4,7,8,8),8,14,22,23,34,84,65,41] [(4),7,8,8,8,14,22,23,34,84,65,41] [4,7,(8,8),8,14,22,23,34,84,65,41] [4,7,8,(8),8,14,22,23,34,84,65,41] [4,7,8,8,8,(14),22,23,34,84,65,41] 对右边区域 low = 7, high = 11 进行递归分区，依次得到结果：

[4,7,8,8,8,14,22,23,(34,84,65,41)] [4,7,8,8,8,14,22,23,34,(41,65,84)] [4,7,8,8,8,14,22,23,34,(41,65),84] [4,7,8,8,8,14,22,23,34,41,(65),84] 得到最终排序结果：

[4,7,8,8,8,14,22,23,34,41,65,84]

优势

两路快速排序相对于一路快速排序的优势：更好的处理重复元素，更平衡的分区。

两路快速排序通过双向扫描，能够有效地处理重复元素，使得递归树更加平衡，从而提高算法的整体性能。

三向切分快速排序

基本概念

三向切分快速排序，又称三路快速排序（Three-Way Quick Sort）是快速排序的变体之一，它在处理含有大量重复元素的数组时表现更为出色。该算法将数组分为三个部分：小于基准值（pivot）的元素、等于基准值的元素以及大于基准值的元素。这种方法可以有效减少不必要的交换操作，并且在某些情况下能够提供更好的性能。