前端面试题,写出一个快速找出两个数组不同值的函数。

5,943 阅读5分钟

时间复杂度的定义

一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n))为算法的渐进时间复杂度(O是数量级的符号),简称时间复杂度。

求法

如果lim(T(n)/f(n))的值为不等于0的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n))。

实现方法

这篇文章讨论两种不同时间复杂度的实现方法

方法一

function findDifferentElements1(array1, array2) {
    // 先对两个数组进行去重操作。基本操作次数2n(最糟糕的情况)。
    const arrayA = Array.from(new Set(array1))
    const arrayB = Array.from(new Set(array2))
    // 定义一个数组A,B内一定不存在的变量 SAME_ELE 。基本操作次数1
    const SAME_ELE = Symbol('?__SAME__ELE__TAG')
    // 提前取出数组长度常数。基本操作次数2
    const lengthA = arrayA.length
    const lengthB = arrayB.length
    // 用两层 for 循环嵌套检查出每一个相同的元素。基本操作次数 3n^2 + 4n + 2
    for(let i = 0; i < lengthA; i++ ){ // n次i比较 n次i++ 初始化i记一次 一共操作2n+1次
        for(let j = 0; j < lengthB; j++) { // n次j比较 n次j++ 初始化j记一次 一共操作2n+1次
            if(arrayA[i] === arrayB[j]){ // 基本操作次数1(外层循环n*n次)
                // 然后用 splice 函数将相同的元素替换成SAME_ELE。
                arrayA.splice(i,1,SAME_ELE) // 基本操作次数1(外层循环n*n次)
                arrayB.splice(j,1,SAME_ELE) // 基本操作次数1(外层循环n*n次)
                //break (实际上可以用break优化,这里不讨论break优化的情况)
            }
        }
    }
    // 合并两个数组然后将数组内所有的 SAME_ELE 去掉,留下的就是不同的元素了。基本操作次数2n+1
    return Array.prototype.concat(arrayA,arrayB).filter(item=>item!==SAME_ELE)
}

时间复杂度分析

这个函数前面定义了5个变量基本操作数为2n+3。

接下来是两个for循环嵌套,假设两个数组的长度都是n,那么第一个for循环需要运行n次,第二个for循环在最坏的情况下也要运行n次,也就是说被这两个for循环包裹起来的基本操作将会被重复运行n*n次,被包裹起来的代码一共有3条语句,加上for循环本身有4n次操作所以一共有3*n*n+4n次基本操作。接下来的return语句是一个复合语句concat基本操作记为n,filter的基本操作记为n,那么整个函数的基本操作函数

T(n) = 4n^2+8n+6 .

令 f(n) = T(n) 的数量级。

lim(T(n)/f(n)) = k {k|k≠0,k∈常数}

f(n) = n^2 (口诀是去掉常数项和低次幂项以及去掉最高次幂项的系数)

T(n) = O(n^2)

方法二

function findDifferentElements2(array1, array2) {
    // 定义一个空数res组作为返回值的容器,基本操作次数1。
    const res = []
    // 定义一个对象用于装数组一的元素,基本操作次数1。
    const objectA = {}
    // 使用对象的 hash table 存储元素,并且去重。基本操作次数2n。
    for(const ele of array1) { // 取出n个元素n次
        objectA[ele] = undefined // 存入n个元素n次
    }
    // 定义一个对象用于装数组二的元素,基本操作次数1。
    const objectB = {}
    // 使用对象的 hash table 存储元素,并且去重。基本操作次数2n。
    for(const ele of array2){ // 取出n个元素n次
        objectB[ele] = undefined // 存入n个元素n次
    }
    // 使用对象的 hash table 删除相同元素。基本操作次数4n。
    for(const key in objectA){ //取出n个key (n次操作)
        if(key in objectB){ // 基本操作1次 (外层循环n次)
            delete objectB[key] // 基本操作1次 (外层循环n次)
            delete objectA[key] // 基本操作1次 (外层循环n次)(总共是3n 加上n次取key的操作 一共是4n)
        }
    }
    // 将第一个对象剩下来的key push到res容器中,基本操作次数是3n次(最糟糕的情况)。
    for(const key in objectA){ // 取出n个元素n次(最糟糕的情况)。
        res[res.length] = key // 读取n次length n次,存入n个元素n次,一共2n(最糟糕的情况)。
    }
    // 将第二个对象剩下来的key push到res容器中,基本操作次数也是3n次(最糟糕的情况)。
    for(const key in objectB){ // 取出n个元素n次(最糟糕的情况)。
        res[res.length] = key // 读取n次length n次,存入n个元素n次,一共2n(最糟糕的情况)。
    }
    // 返回结果,基本操作次数1。
    return res
}

时间复杂度分析

改进后的函数基本操作次数算起来非常简单,注释写的很清楚了,所以

T(n) = 14n+7 。

令 f(n) = T(n) 的数量级。

lim(T(n)/f(n)) = k {k|k≠0,k∈常数}

f(n) = n (去掉常数项和低次幂项以及去掉最高次幂项的系数)

T(n) = O(n)

预测具体差距

当n趋于无穷大的时候

算法1应该比算法2的性能慢 O(n^2)/O(n) 倍

=> O(n) 慢 n 倍

测试 当n=100时的耗时情况

//  定义两个数组
const array1 = []
const array2 = []
// 数据量为100
const n = 100
// 初始化
for(let i = 0; i < n; i++){
    array1.push(i)
    array2.push(n - i) // 这两个数组中相同的元素距离相距都比较远,算是比较接近糟糕的情况的但也不是时最糟糕的情况。
}
// 开始测试第一个方法耗时
console.time()
const res1 = findDifferentElements1(array1,array2)
console.timeEnd()
console.log(res1)
// 开始测试第二个方法耗时
console.time()
const res2 = findDifferentElements2(array1,array2)
console.timeEnd()
console.log(res2)

当n=100时的耗时结果

n=100
相差15倍

当n=1000时的耗时结果

n=1000
相差128倍

当n=10000时的耗时结果

n=10000
相差1148倍