排序

以下两个函数是排序中会用到的通用函数,就不一一写了

  1. function checkArray(array) {
  2. if (!array || array.length <= 2) return
  3. }
  4. function swap(array, left, right) {
  5. let rightValue = array[right]
  6. array[right] = array[left]
  7. array[left] = rightValue
  8. }

冒泡排序

冒泡排序的原理如下,从第一个元素开始,把当前元素和下一个索引元素进行比较。如果当前元素大,那么就交换位置,重复操作直到比较到最后一个元素,那么此时最后一个元素就是该数组中最大的数。下一轮重复以上操作,但是此时最后一个元素已经是最大数了,所以不需要再比较最后一个元素,只需要比较到 length - 1 的位置。

排序 - 图1

以下是实现该算法的代码

  1. function bubble(array) {
  2. checkArray(array);
  3. for (let i = array.length - 1; i > 0; i--) {
  4. // 从 0 到 `length - 1` 遍历
  5. for (let j = 0; j < i; j++) {
  6. if (array[j] > array[j + 1]) swap(array, j, j + 1)
  7. }
  8. }
  9. return array;
  10. }

该算法的操作次数是一个等差数列 n + (n - 1) + (n - 2) + 1 ,去掉常数项以后得出时间复杂度是 O(n * n)

插入排序

插入排序的原理如下。第一个元素默认是已排序元素,取出下一个元素和当前元素比较,如果当前元素大就交换位置。那么此时第一个元素就是当前的最小数,所以下次取出操作从第三个元素开始,向前对比,重复之前的操作。

排序 - 图2

以下是实现该算法的代码

  1. function insertion(array) {
  2. checkArray(array);
  3. for (let i = 1; i < array.length; i++) {
  4. for (let j = i - 1; j >= 0 && array[j] > array[j + 1]; j--)
  5. swap(array, j, j + 1);
  6. }
  7. return array;
  8. }

该算法的操作次数是一个等差数列 n + (n - 1) + (n - 2) + 1 ,去掉常数项以后得出时间复杂度是 O(n * n)

选择排序

选择排序的原理如下。遍历数组,设置最小值的索引为 0,如果取出的值比当前最小值小,就替换最小值索引,遍历完成后,将第一个元素和最小值索引上的值交换。如上操作后,第一个元素就是数组中的最小值,下次遍历就可以从索引 1 开始重复上述操作。

排序 - 图3

以下是实现该算法的代码

  1. function selection(array) {
  2. checkArray(array);
  3. for (let i = 0; i < array.length - 1; i++) {
  4. let minIndex = i;
  5. for (let j = i + 1; j < array.length; j++) {
  6. minIndex = array[j] < array[minIndex] ? j : minIndex;
  7. }
  8. swap(array, i, minIndex);
  9. }
  10. return array;
  11. }

该算法的操作次数是一个等差数列 n + (n - 1) + (n - 2) + 1 ,去掉常数项以后得出时间复杂度是 O(n * n)

归并排序

归并排序的原理如下。递归的将数组两两分开直到最多包含两个元素,然后将数组排序合并,最终合并为排序好的数组。假设我有一组数组 [3, 1, 2, 8, 9, 7, 6],中间数索引是 3,先排序数组 [3, 1, 2, 8] 。在这个左边数组上,继续拆分直到变成数组包含两个元素(如果数组长度是奇数的话,会有一个拆分数组只包含一个元素)。然后排序数组 [3, 1][2, 8] ,然后再排序数组 [1, 3, 2, 8] ,这样左边数组就排序完成,然后按照以上思路排序右边数组,最后将数组 [1, 2, 3, 8][6, 7, 9] 排序。

排序 - 图4

以下是实现该算法的代码

  1. function sort(array) {
  2. checkArray(array);
  3. mergeSort(array, 0, array.length - 1);
  4. return array;
  5. }
  6. function mergeSort(array, left, right) {
  7. // 左右索引相同说明已经只有一个数
  8. if (left === right) return;
  9. // 等同于 `left + (right - left) / 2`
  10. // 相比 `(left + right) / 2` 来说更加安全,不会溢出
  11. // 使用位运算是因为位运算比四则运算快
  12. let mid = parseInt(left + ((right - left) >> 1));
  13. mergeSort(array, left, mid);
  14. mergeSort(array, mid + 1, right);
  15. let help = [];
  16. let i = 0;
  17. let p1 = left;
  18. let p2 = mid + 1;
  19. while (p1 <= mid && p2 <= right) {
  20. help[i++] = array[p1] < array[p2] ? array[p1++] : array[p2++];
  21. }
  22. while (p1 <= mid) {
  23. help[i++] = array[p1++];
  24. }
  25. while (p2 <= right) {
  26. help[i++] = array[p2++];
  27. }
  28. for (let i = 0; i < help.length; i++) {
  29. array[left + i] = help[i];
  30. }
  31. return array;
  32. }

以上算法使用了递归的思想。递归的本质就是压栈,每递归执行一次函数,就将该函数的信息(比如参数,内部的变量,执行到的行数)压栈,直到遇到终止条件,然后出栈并继续执行函数。对于以上递归函数的调用轨迹如下

  1. mergeSort(data, 0, 6) // mid = 3
  2. mergeSort(data, 0, 3) // mid = 1
  3. mergeSort(data, 0, 1) // mid = 0
  4. mergeSort(data, 0, 0) // 遇到终止,回退到上一步
  5. mergeSort(data, 1, 1) // 遇到终止,回退到上一步
  6. // 排序 p1 = 0, p2 = mid + 1 = 1
  7. // 回退到 `mergeSort(data, 0, 3)` 执行下一个递归
  8. mergeSort(2, 3) // mid = 2
  9. mergeSort(3, 3) // 遇到终止,回退到上一步
  10. // 排序 p1 = 2, p2 = mid + 1 = 3
  11. // 回退到 `mergeSort(data, 0, 3)` 执行合并逻辑
  12. // 排序 p1 = 0, p2 = mid + 1 = 2
  13. // 执行完毕回退
  14. // 左边数组排序完毕,右边也是如上轨迹

该算法的操作次数是可以这样计算:递归了两次,每次数据量是数组的一半,并且最后把整个数组迭代了一次,所以得出表达式 2T(N / 2) + T(N) (T 代表时间,N 代表数据量)。根据该表达式可以套用 该公式 得出时间复杂度为 O(N * logN)

快排

快排的原理如下。随机选取一个数组中的值作为基准值,从左至右取值与基准值对比大小。比基准值小的放数组左边,大的放右边,对比完成后将基准值和第一个比基准值大的值交换位置。然后将数组以基准值的位置分为两部分,继续递归以上操作。

排序 - 图5

以下是实现该算法的代码

  1. function sort(array) {
  2. checkArray(array);
  3. quickSort(array, 0, array.length - 1);
  4. return array;
  5. }
  6. function quickSort(array, left, right) {
  7. if (left < right) {
  8. swap(array, , right)
  9. // 随机取值,然后和末尾交换,这样做比固定取一个位置的复杂度略低
  10. let indexs = part(array, parseInt(Math.random() * (right - left + 1)) + left, right);
  11. quickSort(array, left, indexs[0]);
  12. quickSort(array, indexs[1] + 1, right);
  13. }
  14. }
  15. function part(array, left, right) {
  16. let less = left - 1;
  17. let more = right;
  18. while (left < more) {
  19. if (array[left] < array[right]) {
  20. // 当前值比基准值小,`less` 和 `left` 都加一
  21. ++less;
  22. ++left;
  23. } else if (array[left] > array[right]) {
  24. // 当前值比基准值大,将当前值和右边的值交换
  25. // 并且不改变 `left`,因为当前换过来的值还没有判断过大小
  26. swap(array, --more, left);
  27. } else {
  28. // 和基准值相同,只移动下标
  29. left++;
  30. }
  31. }
  32. // 将基准值和比基准值大的第一个值交换位置
  33. // 这样数组就变成 `[比基准值小, 基准值, 比基准值大]`
  34. swap(array, right, more);
  35. return [less, more];
  36. }

该算法的复杂度和归并排序是相同的,但是额外空间复杂度比归并排序少,只需 O(logN),并且相比归并排序来说,所需的常数时间也更少。

面试题

Sort Colors:该题目来自 LeetCode,题目需要我们将 [2,0,2,1,1,0] 排序成 [0,0,1,1,2,2] ,这个问题就可以使用三路快排的思想。

以下是代码实现

  1. var sortColors = function(nums) {
  2. let left = -1;
  3. let right = nums.length;
  4. let i = 0;
  5. // 下标如果遇到 right,说明已经排序完成
  6. while (i < right) {
  7. if (nums[i] == 0) {
  8. swap(nums, i++, ++left);
  9. } else if (nums[i] == 1) {
  10. i++;
  11. } else {
  12. swap(nums, i, --right);
  13. }
  14. }
  15. };

Kth Largest Element in an Array:该题目来自 LeetCode,题目需要找出数组中第 K 大的元素,这问题也可以使用快排的思路。并且因为是找出第 K 大元素,所以在分离数组的过程中,可以找出需要的元素在哪边,然后只需要排序相应的一边数组就好。

以下是代码实现

  1. var findKthLargest = function(nums, k) {
  2. let l = 0
  3. let r = nums.length - 1
  4. // 得出第 K 大元素的索引位置
  5. k = nums.length - k
  6. while (l < r) {
  7. // 分离数组后获得比基准树大的第一个元素索引
  8. let index = part(nums, l, r)
  9. // 判断该索引和 k 的大小
  10. if (index < k) {
  11. l = index + 1
  12. } else if (index > k) {
  13. r = index - 1
  14. } else {
  15. break
  16. }
  17. }
  18. return nums[k]
  19. };
  20. function part(array, left, right) {
  21. let less = left - 1;
  22. let more = right;
  23. while (left < more) {
  24. if (array[left] < array[right]) {
  25. ++less;
  26. ++left;
  27. } else if (array[left] > array[right]) {
  28. swap(array, --more, left);
  29. } else {
  30. left++;
  31. }
  32. }
  33. swap(array, right, more);
  34. return more;
  35. }

堆排序

堆排序利用了二叉堆的特性来做,二叉堆通常用数组表示,并且二叉堆是一颗完全二叉树(所有叶节点(最底层的节点)都是从左往右顺序排序,并且其他层的节点都是满的)。二叉堆又分为大根堆与小根堆。

  • 大根堆是某个节点的所有子节点的值都比他小
  • 小根堆是某个节点的所有子节点的值都比他大

堆排序的原理就是组成一个大根堆或者小根堆。以小根堆为例,某个节点的左边子节点索引是 i * 2 + 1,右边是 i * 2 + 2,父节点是 (i - 1) /2

  1. 首先遍历数组,判断该节点的父节点是否比他小,如果小就交换位置并继续判断,直到他的父节点比他大
  2. 重新以上操作 1,直到数组首位是最大值
  3. 然后将首位和末尾交换位置并将数组长度减一,表示数组末尾已是最大值,不需要再比较大小
  4. 对比左右节点哪个大,然后记住大的节点的索引并且和父节点对比大小,如果子节点大就交换位置
  5. 重复以上操作 3 - 4 直到整个数组都是大根堆。
排序 - 图6

以下是实现该算法的代码

  1. function heap(array) {
  2. checkArray(array);
  3. // 将最大值交换到首位
  4. for (let i = 0; i < array.length; i++) {
  5. heapInsert(array, i);
  6. }
  7. let size = array.length;
  8. // 交换首位和末尾
  9. swap(array, 0, --size);
  10. while (size > 0) {
  11. heapify(array, 0, size);
  12. swap(array, 0, --size);
  13. }
  14. return array;
  15. }
  16. function heapInsert(array, index) {
  17. // 如果当前节点比父节点大,就交换
  18. while (array[index] > array[parseInt((index - 1) / 2)]) {
  19. swap(array, index, parseInt((index - 1) / 2));
  20. // 将索引变成父节点
  21. index = parseInt((index - 1) / 2);
  22. }
  23. }
  24. function heapify(array, index, size) {
  25. let left = index * 2 + 1;
  26. while (left < size) {
  27. // 判断左右节点大小
  28. let largest =
  29. left + 1 < size && array[left] < array[left + 1] ? left + 1 : left;
  30. // 判断子节点和父节点大小
  31. largest = array[index] < array[largest] ? largest : index;
  32. if (largest === index) break;
  33. swap(array, index, largest);
  34. index = largest;
  35. left = index * 2 + 1;
  36. }
  37. }

以上代码实现了小根堆,如果需要实现大根堆,只需要把节点对比反一下就好。

该算法的复杂度是 O(logN)

系统自带排序实现

每个语言的排序内部实现都是不同的。

对于 JS 来说,数组长度大于 10 会采用快排,否则使用插入排序 源码实现 。选择插入排序是因为虽然时间复杂度很差,但是在数据量很小的情况下和 O(N * logN)相差无几,然而插入排序需要的常数时间很小,所以相对别的排序来说更快。

对于 Java 来说,还会考虑内部的元素的类型。对于存储对象的数组来说,会采用稳定性好的算法。稳定性的意思就是对于相同值来说,相对顺序不能改变。

排序 - 图7