跳至主要内容

博文

目前显示的是 九月, 2017的博文

算法 | 堆排序(heap sort)

    注:本文只讨论最大堆排序,最小堆排序同理 一 . 堆   堆(heap)可以定义为一棵 完全 二叉树,并且这棵树的每一个节点都大于或等于它的子女节点。  最大堆长这样子: 堆的特性 一棵n节点的 完全 二叉树,其高度为$$\lfloor \log_{2}n\rfloor$$ 堆的每一个节点都大于等于它的子女节点。 可以用数组来实现堆。留空H[0],然后在H[1]到H[n]中存在堆元素。留空H[0]的目的是为了让之后的堆排序更加的方便。 所有父母节点的键会在数组的前$$\lfloor n/2 \rfloor$$ 个位置中,而叶子节点会占据后面的$$\lceil n/2 \rceil$$个位置。 在数组中,对于每一个位于父母位置i的键来说,它的子女会位于2i和2i+1 对于一个位于位置i的键来说它的父母将会位于$$\lfloor i/2 \rfloor$$ 如何生成堆 自底向上堆构造(bottom-up heap construction): 对每个父母节点进行父母优势检查: 从最后的父母节点开始,到根为止,检查这些节点的键是否满足父母优势要求。 如果该节点不满足,就把该节点的键K与它子女的最大键进行交换。 然后再检查新位置上,K是不是满足父母的优势要求。 效率: 最坏情况下,每个位于树第i层的节点都要移动到树的最底层h,因为移动一层需要两次键值比较,因此移动到h层需要 2(h-i) 次键值比较,所以总键值比较次数为: 自顶向下堆构造(top-down heap construction): 把新的键连续插入到已经预先构造好的堆: 把包含k附加到堆的最后一个叶节点的后面。 拿k与它的父母节点作比较,如果k刚好小于它的父母节点,则算法停止。 否则,交换k和其父母节点的位置 重复2,3步骤直到k不大于它的父母,或者到达了根为止。 效率: 因为包含n个节点的树的高度大约是 log n ,因此每次插入的时间效率属于 O(log n) 总时间效率叠加即可。 二. 堆排序 堆排序的思路很简单: 把数组构造成堆,此时根是最大值。 把根从堆中“移除”,即把...

算法 | 归并排序(merge sort)(Javascript实现)

算法第二弹,归并排序(merge sort)。语言:Javascript。 核心思想: 归并排序的思路还是比较简单的,话不多说,看图: divide阶段:每次把数组一分为二,循环直到每个分组只有一个元素为止。 merge阶段:每次比较两个待合并数组的第一个元素,将较小的元素添加到一个新创建的数组中。接着,被复制数组中的指针后移。再比较两个数组各自的第一个元素……循环直到两个数组中的一个被处理完为止。然后,把未处理完的数组剩下的元素复制到新数组的尾部。看不懂请移步下面的动图。 (下图来自维基百科) 代码 既然已经懂了归并排序的原理。那就可以开始敲代码了。 如果简单粗暴地把归并排序的思想转化为代码,那结果是这样的: 不过理想很丰满,现实很骨感。这种实现方法虽然做到了时间上的高效,但是空间上付出的代价时惨重的。想象一下,假设数组有 n 个元素,那么算法就要递归 log n 次,因为数组的元素个数是不会减少的,也就是每次要额外的 n 个空间来暂时存储划分好的元素。如果你计算的是一个比较大的数组,而你的计算机刚好又是那种内存比较小的……嗯,画面太美我不敢看。 一个好的解决方法是建立一个临时数组,每次递归时,交替使用临时数组和原数组来进行切片,合并,以达到节省空间的目的。(此时空间复杂度为 n)。 可以从两个方向来进行递归。 一个是自顶向下的归并排序(Top-Down),代码如下。 代码可能有点难理解,看不懂的同学请拿出一张纸,创造一个数组,按着代码步骤一步一步将数组排序。实践出真理。 另一个是自底向上的归并排序(Bottom-Up),代码如下。 效率 空间复杂度 前面已经讲过,所以这里不再赘述。 时间复杂度 计算归并排序的键值比较次数,每做一步,都要进行一次比较,比较之后,两个数组中尚未处理的元素个数减 1 。 最坏情况下,无论哪个数组都不会为空,除非另外一个数组只剩下最后一个元素(也就是连个数组中的元素是按序交错存在的)。当每个数组有 k/2 个元素时,比较的次数为 k-1 (只有最后一个元素不用比较)。所以递归式为 最好情况下,其中一个数组的所有元素都小于另一个数组的最小元素,当每个数组有 k/2 个元素时,键值比较次数为 k/2 ,因此递归式为 ...

算法 | 用Javascript实现快速排序(quicksort)

最近在学各种排序算法,刚好写成几篇文记录下来,方便以后查看。 快速排序(quicksort)的主要思想就是:选择一个基准元素,把小于基准的元素全部移到左边,大于基准的元素移到右边。然后对左边和右边的元素分别再进行排序,如此循环到每个小分组只剩下一个元素为止。 对元素的划分有两种算法。一个是Lomuto算法。 把第一个元素作为基准元素。从第二个开始遍历余下的元素,a[i]>=p则继续往前走,当遇到一个小于p的元素时,就停下来,将s增加1,再交换a[s],a[i]的元素。这样就保证比p小的元素永远在左边,比p大的元素永远再右边。 循环结束后,再交换a[s]和a[left]的值。使基准元素成为分界点。 另一个算法是Hoare算法。Hoare就是提出快速排序思想的人,图灵奖得主。 变量i跟踪小于基准的元素,从左到右遍历,遇到大于等于基准的元素就停下来。j跟踪大于基准的元素,从右到左遍历,遇到小于基准的元素就停下来,然后交换a[i]和a[j]。直到i,j相遇。再把基准元素和a[j]交换。比较麻烦的就是每次都要判断i是否溢出。 两个划分算法效率是一样的,个人认为Lomuto算法比较容易理解。 有了划分算法之后,要写快速排序就容易多了。 下面是用js写的原地排序( in-place) : 还有另一种比较有js特色的快速排序实现,代码如下: 第二种快速排序实现有一个很大的缺点,就是很耗内存,对一个有n个元素的数组进行排序,每一次递归都要新建两个数组来存放两边的元素,最好情况下递归循环 log n 次,每次需要 n 个元素的空间,因此需要额外 n(log n) 的空间,加上创建数组需要一些额外开销。因此这种方法对于大数组而言就不合适了。 关于快速排序的效率: 最好情况下,每次都刚好平均分为两个相同长度的分组,递归循环 log n 次, 键值比较次数为 C(n)=2*C(n/2)+n,C(1)=0 最坏情况下,每次数组都会分成一边长度为0,一边长度为n-1的两个分组,递归循环  n-1 次,键值比较次数为 n+(n-1)+(n-2)+……+1 平均情况下,键值比较次数约等于 1.39nlog n     所以它们的效率分别是: 关于快速排序的优化: 更好的基准元素选择方...