FreeCodeCamp 高级算法题 - 字符串排列

687 阅读13分钟
原文链接: zhuanlan.zhihu.com

问题解释

  • 这个 function 接收一个字符串参数 str。返回值为参数 str 没有连续重复字符串的排列个数
  • 如果 str"aab",则返回值应为 2,因为全排列后,会出现两个 "aba",不含连续重复字符串 (排除 "aab""baa")

解题思路

  • 这道题应该是高级算法题目中难度稍大的一道题。题目的难点在于获取字符串的全排列。我觉得这里有必要先说一下,如何获取全排列
  • 只要我们可以获取字符串的全排列,那就至少有两种方式判断字符串是否含有连续重复的字符。可以遍历,也可以用正则
  • 排列 (也叫置换),Permutation组合,Combination,高中数学就已经涉及到。比如,对于 123,从中取出两个数有三种组合,分别是 121323。同样是取出两个数,有六种排列,分别是 122113312332
  • 再说一下什么是全排列 (Full Permutation),全排列的意思是,从 n 个中取出 n 个的排列。对于 123,取出三个数的排列,就是 123 的全排列。123 的全排列总共有六种,分别是 123132213231312321。计算数量方式很简单,就是 n!n 的阶乘。对于 123 来说,也就是 3!,得 6

全排列的实现 - 封装,循环

  • 我们可以先根据这个实际的例子想想,怎样才能无遗漏的输出全排列
    • 两个数就不用说了,对于 12,只有 1221 两种
    • 三个数,比如 123,我们先分为三种情况,就是 1 开头,2 开头和 3 开头
      • 对于 1 开头的情况,剩下 23,这就回到了两个数的排列
      • 对于 2 开头的情况,剩下 13,这也回到了两个数的排列
      • 3 开头的情况同理
    • 四个数,先按照开头分为四种情况,然后按照三个数的排列去处理
    • ……
    • 以此类推
  • 你可能已经看出来了,这就是一个递归。就好像求斐波那契数列的某一个元素,我们要先求出前面的;要想求出前面的,我们就要求出更前面的。记 “斐波那契数列的第 n 位” 这件事为 F(n),则有 F(n) = F(n - 1) + F(n - 2)
  • 类似地,记 “求出 n 个字符串的全排列” 这件事为 P(n),则有 P(n) = 分别以这n个字符之一开头 + P(n - 1)。其中,P(n - 1) 表示去掉那个开头字符的剩余字符串的全排列。哪怕只有两个字符,比如对于上面例子中的 12,同样符合这一条结论
  • 'abc' 为例,执行步骤如下:
给出 abc
1. a 作为开头 -> 求 bc 全排列 -> 得到 bc 和 cb -> 与 a 合并 -> 得到 abc 和 acb
2. b 作为开头 -> 求 ac 全排列 -> 得到 ac 和 ca -> 与 b 合并 -> 得到 bac 和 bca
3. c 作为开头 -> 求 ab 全排列 -> 得到 ab 和 ba -> 与 c 合并 -> 得到 cab 和 cba
  • 注意,这只是其中一种实现方式。后面我们还会看到另一种实现
  • 首先我们来想一下公共逻辑是什么。对于一个字符串,我们取出一个字符作为开头,然后对去掉这个开头字符的剩余字符串继续求全排列。求出来之后,与取到的字符合并起来就行
  • 对于 P(n) 来说,我们要取出一个字符作为开头,而且原始的字符串可能本身就含有重复的字符。在代码中,我们可以通过开头字符在原字符串中的索引来区分
  • 对于我们封装的函数,可以直接使用字符串作为参数。这是因为,在获取剩余字符串全排列,即 P(n - 1) 时,我们并不关心去掉的那个,用作开头的字符是什么,只需要关心现在我们要生成谁的全排列就好
  • 因此,我们需要在递归调用时,传入去掉那个用作开头的字符之后的,剩余字符串。这个很容易实现,如果我们知道了去掉的那个字符的索引,那我们就可以用 str.slice(0, i) 来获取这个字符之前的字符串,用 str.slice(i + 1, str.length) 来获取这个字符之后的字符串 (注意,slice 方法的第一个参数是包含的,第二个不包含。如果 i 本身就是 0,那么取到的是 空字符串),拼接在一起就可以作为递归调用的参数
  • 跳出条件也不难想,只要传入的参数长度为 10,直接返回即可
  • 另外,每次调用,我们都需要一个数组来保存根据当前参数生成的全排列。代码如下
function permAlone(string) {
    function _perm(str) {
        // 跳出条件
        if (str.length < 2) return str;
        var permutations = [];
        for (var i = 0; i < str.length; i++) {
            // 获取开头的字符串和剩余字符串
            var start = str[i];
            var remaining = str.slice(0, i) + str.slice(i + 1, str.length);
            // 根据通过剩余字符串的全排列,生成前一次的全排列。注意 _perm(remaining) 是一个数组
            for (var permutation of _perm(remaining)) {
                permutations.push(start + permutation);
            }
        }
        return permutations;
    }
}

判断连续重复字符

遍历

  • 判断是否有连续重复的字符,最简单的方式是遍历。只需要在外面用一个变量记录上一个字符就可以
  • 只要当前的和上一个相同,直接跳出就可以,不需要继续判断。代码如下:
function hasRepeatChar(str) {
    var previous = '';
    for (var i = 0; i < str.length; i++) {
        if (previous === str[i]) {
            return true;
        } else {
            // 赋值,用于下次判断
            previous = str[i];
        }
    }
    // 不存在连续重复字符
    return false;
}

递归

  • 递归也是很容易写的。跟上面的思路一样,调用的时候传入两个参数,分别是上一个字符,和剩余字符串。其中,剩余字符串可以通过 str.slice(1) 获取
  • 为避免 str 本身就是空字符串,需要多一次判断,即如果 prevChar 不是空的 (这说明 prevChar 被赋过值,而并非初始的空值),我们才可以认为 str 不含连续重复字符,则返回 false。因此,跳出条件是 str 为空且 prevChar 有值。如果这时候 prevChar 也是空的,那就证明传入的 str 本身就是空的。为了防止混淆,我们直接给它返回 "Empty string"。事实上,这种 corner case 在这道题目中不会遇到。代码如下:
function hasRepeatChar(str, prevChar) {
    if (str.length === 0) return prevChar ? false : 'Empty string';
    if (prevChar === str[0]) return true;
    return hasRepeatChar(str.slice(1), str[0]);
}

正则表达式

  • 正则是个好东西。在正则里,有一中写法叫做 back reference,就是 \\ 后面加一个正整数。请参考 文档\\n 的那一行
  • 简单来说,\\x 就是匹配之前,正数第 x 个 matched group (匹配组,也叫捕获组,其实就是小括号包含的内容)
  • 对于判断一个字符串是否含有连续重复字符,我们并不关注它重复了几次,也不需要关注它有几组重复的。因此,这里不需要 global flag /g
  • 那么,对于字符串中的任意字符,只要这个字符右边的字符和它相同,那就匹配到,并且返回 false。听起来像是句废话,只是,如果你看不懂后面的正则,记得回来再读读这句话。代码如下:
function hasRepeatChar(str) {
    return !/(\w)\1/.test(str);
}

基本解法

思路提示

  • 思路上面已经说得很清楚。通过上面的递归调用,我们可以得到了一个包含字符串全排列的数组,只需要通过上面的正则过滤一下,保留不含连续重复字符的字符串,并返回它的 length

代码

function permAlone(string) {
    function _perm(str) {
        if (str.length < 2) return str;
        var permutations = [];
        for (var i = 0; i < str.length; i++) {
            var start = str[i];
            var remaining = str.slice(0, i) + str.slice(i + 1, str.length);
            for (var permutation of _perm(remaining)) {
                permutations.push(start + permutation);
            }
        }
        return permutations;
    }
    return _perm(string).filter(function(str) {
        return !/(\w)\1/.test(str);
    }).length;
}

数组方法 - 思路的优化

思路提示

  • 上面的方式是把子问题 (剩余字符串的全排列) 添加到之前取出的开头字符后面,这也就意味着,对于长度为 n 的字符串 string,开头的字符我们要获取 n 次。每一次取了开头,我们又要再对子问题进行 n - 1 次取开头的操作,因此这时候的时间复杂度会是 n!。效率很低
  • 如果我们换一个思路,采用 “插值” 的方法,会让整体操作变少一些。注意,这个思路并不一定需要用数组去实现。确切的说,如果不用数组去实现,效率会更高。只是个人觉得,用数组会比较容易写,也比较容易理解
  • 之前的方式,如果我们说它是 “从前往后” 实现的,那现在我们来试试从后往前实现
  • 对于字符串 'abc',给出子串 'bc',剩余 'a'。我们可以通过把 'a' 放到 'bc' 里面,不同的位置来实现排列。注意到 'bc' 有三个位置可以插入 'a',分别是:
b c
↑ ↑ ↑
1 2 3
  • 如果把 'a' 分别插入上面说的位置 123,我们就可以得到 'abc''bac''bca
  • 'bc' 排列还有一种情况 'cb'。再把 'a' 插入到 'cb' 的三个位置,我们就可以得到另外三种排列
  • 注意到,'bc''cb',其实就是在子串 'c' 中插入 'b' 产生的。因为 'c' 只有两个位置可以插入 'b'
c
↑ ↑
1 2

这样,我们就得到了一个新的递归思路,如下 (左边的竖线只是为了方便看清递归弹出的时候对应上面的哪一步,弹出步骤中的插入值与上面取出的第一个字符相对应):

给出 'abc'
|- 取出第一个字符 a,剩余 bc
|  |- 取出第一个字符 b,剩余 c
|  |  |- 取出第一个字符 c,剩余空字符串 (划重点,这个就是弹出的条件)
|  |  |- 在上次剩余值中插入 c,只能得到一种情况 c
|  |- 在上次剩余值 (c) 中插入 b,得到 bc 和 cb
|- 在上次剩余值 (bc 和 cb) 中插入 a,得到 abc, bac, bca 和 acb, cab, cba
  • 这个思路很像是,先一直走到底 (即长度为 0 的时候),弹出的过程中,我们再来生成需要的结果
  • 这段代码加注释不太方便,详细解释还是写到代码之后吧
  • 如果你还是不知道如何写代码,不要怕麻烦,试着写出来 'abcd' 的详细过程,写完你就能理解了

代码

function permAlone(string) {
    return _perm(string.split('')).filter(function(str) {
        return !/(\w)\1/.test(str);
    }).length;
    function _perm(arr) {
        return arr.length === 0 ? [[]] : _perm(arr.slice(1)).reduce(function(accum, curr) {
            // 插值的实现
            for (var i = 0; i < arr.length; i++) {
                accum.push([curr.slice(0, i), arr[0], curr.slice(i)].join(''));
            }
            return accum;
        }, []);
    }
}

解释

  • 先说一句,上面的代码,尽管思路优化了,但速度理论上会比之前的慢,因为咱们用了数组
  • 外面那层应该没啥疑问,既然决定了用数组去处理,那就干脆直接传入数组,一个 split 的事儿而已
  • 封装的 _perm,其实还是要进行递归调用的。当外面的 string 是空字符串时,返回值是 [[]],而不可以是 []。原因很简单,如果是 [],那么 reduce 就不会执行了,因为没有元素。你可以试试以下的代码片段,就理解了:
// 不会输出 '执行了',返回值是 []
[].reduce((accum, curr) => {
    console.log('执行了');
    return accum;
}, []);
// 会输出 '执行了',返回值也是 []
[[]].reduce((accum, curr) => {
    console.log('执行了');
    return accum;
}, []);
  • 只要 arr 长度不为 0,那我们就递归调用 _perm(arr.slice(1)),直到遇到传入的 arr 长度为 0,才开始执行 reduce 弹出的过程。详情请看上面的思路分析
  • 里面的 for 循环很重要,”插值” 这个核心步骤就是在这里实现的。如果看不懂这个过程,请去了解一下 slice 方法是怎么回事,然后举几个例子带进去试一试就明白了

算法优化 - Heap’s algorithm

思路提示

  • 注意,这里的 Heap 不是指数据结构的 “堆”,而是发明者的名字。如果你从来没听说过这个算法,那只靠自己想可能有些困难
  • 给出字符串 'abc',我们可以按照先确定结尾字符的思路来这样推一下:
    • 'c' 作为结尾:
      • 我们得到第一个排列 'abc'
      • 通过交换 'a''b',我们可以得到另一种排列 'bac'
    • 交换开头结尾,这时候 'b' 作为结尾:
      • 得到 'cab'
      • 通过交换 'c''a',得到 'acb'
    • 交换开头结尾,这时候 'a' 作为结尾:
      • 得到 'bca'
      • 通过交换 'b''c',得到 'cba'
  • 思路大致上是这样,通过交换去实现。交换的好处在于,我们不需要额外的空间去存储。值得注意的是,在 JavaScript 中,字符串可以通过 index 访问某一个位置的字符,但不可以修改它的值。因此,想要换位,我们还是要通过数组来实现的
  • 事实上,真正实现起来还与上面的例子有区别。在 Heap's Algorithm维基百科页面 有详细的解释,也有四个元素的详细步骤示例。其实,并不是 “交换开头结尾” 这么简单的
  • 实现数组中元素交换的方式也非常多。有朋友可能首先想到的是用 splice,但这样做效率会很低,我会比较推荐用变量缓存一个值的做法,很容易写。比如,我们需要交换 index 为 24 的元素:
var arr = [1, 2, 3, 4, 5, 6];
var temp = arr[2];
arr[2] = arr[4];
arr[4] = temp;
console.log(arr);  // [1, 2, 5, 4, 3, 6]

当然,还有一种比较好玩儿的黑科技:

var arr = [1, 2, 3, 4, 5, 6];
arr[2] = [arr[4], arr[4] = arr[2]][0]
console.log(arr);  // [1, 2, 5, 4, 3, 6]

如果你听说过 ES6 的解构赋值,也可以这么写。注意这个在不支持 ES6 的浏览器里是不行的:

var arr = [1, 2, 3, 4, 5, 6];
[arr[2], arr[4]] = [arr[4], arr[2]]
console.log(arr);  // [1, 2, 5, 4, 3, 6]

维基百科页面也提供了伪代码,而且提供了递归和非递归的两个版本。两个版本都用到了两个参数,但我们只需要一个 n 就够了,不需要第二个 A,因为我们的数组可以通过 var arr = str.split(''); 将它定义到函数 generate 外面。这样,伪代码如下:

函数 generate
参数 num
如果 num 等于 1:
    arr.join('')并添加到结果数组
否则:
    循环0  num:
        递归调用 generate(num - 1)
        如果 num 为偶数:
            交换 strArr[i]  strArr[num - 1]
        如果 num 为奇数:
            交换 strArr[0]  strArr[num - 1]

代码

function permAlone(str) {
    var arr = str.split('');
    var result = [];
    // 声明需要放在这里,因为赋值是在弹出的时候执行的
    var tempIndex;
    function generate(num) {
        if (num === 1) {
            result.push(arr.join(''));
        } else {
            for (var i = 0; i < num; i++) {
                generate(num - 1);
                tempIndex = num % 2 ? 0 : i;
                arr[tempIndex] = [arr[num - 1], arr[num - 1] = arr[tempIndex]][0];
            }
        }
    }
    
    generate(arr.length);
    
    return result.filter(function(str) {
        return !/(\w)\1/.test(str);
    }).length;
}

本文标题:FreeCodeCamp 高级算法题 - 字符串排列

文章作者:S1ngS1ng

转载请保留原文链接及作者