前言
归并排序与快速排序是两种有实际应用的排序算法,它们有一些共同的特点,整体思路上也比较相近。本文会从更简单的一些排序算法开始,过渡到归并排序和快速排序的实现,并对它们做一些简单的对比思考和总结。在这之前,先简单介绍一下排序算法的意义。
排序算法就是将一串数据依照特定排序方式进行排列,它们在计算机科学中有大量研究以及应用。
想象一下下列场景:
- 从通讯录中寻找某个联系人
- 从一大堆文件中寻找某个文件
- 到了影厅之后,寻找电影票上指定的座位
如果以上情况中,联系人、文件、影厅座位这些“数据”没有按照需要的顺序组织,如何找到想要的特定“数据”呢?会非常麻烦!所以说,对于需要搜索的数据,往往应该先排个序!
热身一:选择排序
本文的示例都是数值排序,对于这个问题,最简单直观的方法是:先找出最小的、再找出第二小的、接着找出第三小的……这就是选择排序的思路。
1 | function selectionSort(array) { |
实现解析:
- 遍历数组
- 找到当前范围内最小的元素,用 minIndex 记录它的下标,第一次遍历时范围就是整个数组
- 将下标为 minIndex 的元素的值与当前最小下标的元素交换,第一次遍历时下标最小的元素就是 a[0]
- 第二次遍历时,范围就从第二个数据元素的下标开始,那么当前最小下标元素就是 a[1]
- 重复交换直至遍历结束
用一段辅助代码,做一些展示用的示例。
1 | function createUnsortedArray(size) { |
先创建一个随机生成的未排序的数组,然后打印结果。
1 | show(selectionSort); |
热身二:冒泡排序
冒泡排序与选择排序有些类似,区别在于冒泡排序是先将最大值冒泡到最后的位置。早在 1956 年,就已经有人研究冒泡排序。
1 | function bubbleSort(array) { |
实现解析:
- 遍历数组
- 做第二层遍历,从前到后依次对比相邻两项,前一项的值大于后一项,则交换(冒泡)。第一遍冒泡,将最大的元素值冒泡至最后
- 由于每一遍冒泡都确定一个当前最大值并放到当前范围的最后的位置,每一遍的冒泡就可以少检查一个位置
- 可以使用一个变量记录当前一遍的冒泡有没有产生元素交换,如果没有,说明当前已经是排序完成的状态,终止循环
热身三:插入排序
插入排序的思想在日常生活其实很常见,例如如何排定卢俊义的座次?综合出身、能力、江湖地位、形势人心等各项指标,他在梁山泊排名第二,地位仅次于宋江。这就是插入排序的思路。数据量很小,或类似“给卢俊义排座次”这种在已排序数据中增加一条数据的情况,插入排序优于本文提到的其他排序方式。
1 | function insertionSort(array) { |
实现解析:
- 从第一个元素开始,该元素可以认为已经被排序
- 取出下一个元素,在已经排序的元素序列中从后向前扫描
- 如果该元素(已排序)大于新元素,将该元素移到下一位置
- 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
- 将新元素插入到该位置后
- 重复步骤2~5
归并排序(递归实现)
选择排序和冒泡排序的时间复杂度都是 O(n^2),很少用在实际工程中;归并排序的时间复杂度是 O(nlog(n)),是实际工程中可选的排序方案。
1 | function mergeSort(unsorted) { |
实现分析:
- 将数组从中间切分为两个数组
- 切分到最小之后,开始归并操作,即合并两个已排序的数组
- 递归合并的过程,由于是从小到大合并,所以待合并的两个数组总是已排序的,一直做同样的归并操作就可以
快速排序(递归实现)
快速排序是实际应用非常多的排序算法,它通常比其他 O(nlog(n)) 时间复杂度的算法更快。
1 | function quickSort(unsorted) { |
实现分析:
- 将当前数组分区
- 分区时先选择一个基准值,再创建两个指针,左边一个指向数组第一个项,右边一个指向数组最后一个项。移动左指针直至找到一个比基准值大的元素,再移动右指针直至找到一个比基准值小的元素,然后交换它们,重复这个过程,直到左指针的位置超过了右指针。如此分区、交换使得比基准值小的元素都在基准值之前,比基准值大的元素都在基准值之后,这就是分区(partition)操作。
- 对于上一次分区后的两个区域重复进行分区、交换操作,直至分区到最小。
对比归并排序与快速排序
- 都用了分治的思想。相比选择排序和冒泡排序,归并排序与快速排序使用了切分而不是直接遍历,这有效减少了交换次数。
- 归并排序是先切分、后排序,过程可以描述为:切分、切分、切分……排序、排序、排序……
- 快速排序是分区、排序交替进行,过程可以描述为:分区、排序、分区、排序……
- 上两条所说的“排序”,在归并排序与快速排序中并非同样的操作,归并排序中的操作是将两个数组合并为一(归并操作),而快速排序中的操作是交换。