JS 底蕴之 变量、作用域和垃圾回收

4,469 阅读10分钟

基本类型和引用类型

在 JavaScript 中,数据类型可分为基本类型和引用类型,

基本类型有六种:Null,Undefined,String,Boolean,Number,Symbol

而引用类型就是传说中的 Object 了。

其中基本类型是按值传递,而引用类型的值是按引用访问的,所以在操作对象时,实际上是在操作对象的引用而不是实际的对象 ( ps:在为对象添加属性时,操作的是实际的对象 )。

关于基本类型和引用类型的不同,大概有以下几点:

1、引用类型是动态的属性,而基本类型不是。

对于引用类型,我们可以为其添加、删除属性和方法,但不能给基本类型的值添加属性:

// 基本类型
var name = 'Fly_001';
name.age = 22;
alert(name.age); // undefined;

// 引用类型
var person = new Object();
person.name = 'Fly_001';
alert(person.name); // 'Fly_001';

2、复制的方式不同。

如果从一个变量向另一个变量复制基本类型的值,会将值复制到为新变量分配的位置上:

var num1 = 5;
var num2 = num1;

当使用 num1 的值来初始化 num2 时,num2 中也保存了值5,但该值只是 num1 中 5 的一个副本,两个变量不会互相影响。

当从一个变量向另一个变量复制引用类型的值时,传递的是一个指针,其指向存储在堆中的一个对象,在复制结束后,两个变量实际上将引用同一个对象,改变其中一个变量就会影响另一个变量:

var obj1 = new Object();
var obj2 = obj1;
obj1.name = 'Fly_001';
alert(obj2.name); // 'Fly_001';

3、传递参数的特点。

这是一个容易困惑的点 😖。

ECMAScript 中所有函数的参数都是按值传递的。也就是说,把函数外部的值复制给函数内部的参数,就和把值从一个变量复制到另一个变量一样。基本类型值的传递如同基本类型变量的复制一样,而引用类型的传递,则如同引用类型变量的复制一样,这一点确实会引起很多小伙伴的争议,欢迎讨论~

  • 在向参数传递基本类型的值时,被传递的值会被复制给一个局部变量( 即 arguments 对象中的一个元素 )。

  • 在向参数传递引用类型的值时,会把这个值在内存中的地址复制给一个局部变量,因此该局部变量的变化会反映到函数的外部:

function addTen(num) {
    num += 10;
    return num;
}
var count = 20;
var result = addTen(count);
alert(count); // 20,木有变化;
alert(result); // 30

function setNmae(obj) {
    obj.name = 'Fly_001';
}
var person = new Object();
setName(person);
alert(person.name); // 'Fly_001';

在上面代码中我们创建了一个对象,并将其保存在了变量 person 中。然后,这个对象被传递到 setName () 函数中就被复制给了 obj,在这个函数内部,obj 和 person 引用的是同一个对象。

很多小伙伴会认为该参数是按引用传递的,为了证明对象是按值传递的,再看下这个修改过的代码:

function setName(obj) {
    obj.name = 'Fly_001';
    obj = new Object();
    obj.name = 'juejin';
}

var person  = new Object();
setName(person);
alert(person.name); // 'Fly_001';

如果 person 是按引用传递的,那么 person 就会自动被修改为指向其 name 属性为 ‘juejin’ 的新对象。但接下来再访问 person.name 时仍然显示 ‘Fly_001’,这说明即使在函数内部修改了参数的值,但原始的引用仍保持不变。( 实际上,当在函数内部重写 obj 时,这个变量引用的就是一个局部对象了,其将在函数执行完毕后立即被销毁。)

4、检测类型的操作符不同。

  • 检测基本类型适宜用 typeof 操作符
alert(typeof 'Fly_001'); // 'string';
alert(typeof []); // 'object';

因为 typeof 操作符的返回值为 'undefined','string','boolean','number','symbol','object','function' 其中之一。

它可以很友好地指出某一具体基本类型,而对于引用类型则笼统地返回 'object'( typeof 对 数组、正则、null 都会返回 'object' )。

  • 在检测引用类型时更适合用 instanceof 操作符:
result = varible instanceof constructor;

如果变量是给定引用类型的实例( 根据它的原型链来识别 ),那 instanceof 操作符将会返回 true。

执行环境及作用域

下面聊下 JavaScript 中很重要的一个概念 —— 执行环境

JS 中每个执行环境都有一个与之关联的变量对象,在 Web 浏览器中,全局执行环境是 window 对象,因此所有全局变量和函数都是作为 window 对象的属性和方法创建的。

某个执行环境中的所有代码执行完毕后,该环境将会被销毁,保存在其中的所有变量和函数定义也随之销毁,全局执行环境直至网页或浏览器关闭时才被销毁( 如果存在闭包,情况又有所不同,会在后面几篇提到 😅,多谢 吴hr 指正)。

每个函数都有自己的执行环境。当执行流进入一个函数时,函数的环境就会被推入一个环境栈中。而在函数执行之后,栈会将其环境弹出,把控制权返回给之前的执行环境。

var color = 'blue';

function changeColor() {
    var anotherColor = 'red';
    
    function swapColors() {
        var tempColor = anotherColor;
        anotherColor = color;
        color = tempColor;
        
        // 这里可以访问 color、anotherColor 和 tempColor;
    }
    
    swapColors();
    // 这里可以访问 color 和 anotherColor,但不能访问 tempColor;
}

changeColor();
// 这里只能访问 color;

以上代码共涉及 3 个执行环境:全局环境、changeColor() 的局部环境和 swapColor() 局部环境。其中,内部环境可以通过作用域链访问所有的外部环境,但外部环境不能访问内部环境中的任何变量和函数。 这些环境之间的联系是线性的、有次序的。每个环境可以向上搜索作用域链 🔍,以查询变量和函数名;但任何环境都不能通过向下搜索作用域链而进入另一个执行环境。

  • 延长作用域链。

虽然执行环境的类型总共只有两种 —— 全局和局部 (函数),但还是两种办法来延长作用域链~ 就是通过 try-catch 语句的 catch 块和 with 语句。

这两个语句都会在作用域链的前端添加一个变量对象。对 with 语句来说,会将指定的对象添加到作用域链中;对于 catch 语句来说,会创建一个新的变量对象,其中包含的是被抛出的错误对象的声明。

  • 没有块级作用域。

JavaScript 没有块级作用域经常会导致理解上的困惑 😲。在其它类 C 的语言中,由花括号封闭的代码块都有自己的作用域,即执行环境,但在 JavaScript 中却不是这样:

if (true) {
    var color = 'blue';
}

alert(color); // 'blue';

for (var i = 0; i < 10; i ++) {
    // dosomething
}

alert(i); // 10;

使用 var 声明的变量会自动被添加到最接近的环境中。在函数内部,最接近的环境就是函数的局部环境,若初始化变量时没有使用 var 声明,该变量会自动被添加到全局环境。( 创建块范围局部变量使用 let 关键字更方便 ):

function add(num1, num2) {
    var sum = num1 + num2;
    return sum;
}

var result = add(10, 20); // 30;
alert(sum); // 'sum is not defined';

在上面代码中,虽然 sum 从函数中返回了,但在函数外部是访问不到的。如果省略 var 关键字,这时 sum 是可以访问到的( 不过在严格模式下,初始化未声明的变量会报 'xxx is not defined' 错 )。

  • 模仿块级作用域。

虽然 js 没有块级作用域,但我们可以用匿名函数来模仿块级作用域~,语法格式如下:

(function() {
    // 这里是块级作用域;
}) ();

将函数声明包含在一对圆括号里,表示它实际上是一个函数表达式,而紧随其后的圆括号会立即调用这个函数。实际上就相当于:

var someFunction() {
    // 这里是块级作用域;
};
someFunction();

同时因为 JavaScript 将 function 关键字当作一个函数声明的开始,后面不能直接跟圆括号,而函数表达式后面可以跟圆括号,所以将函数声明加上圆括号转换成函数表达式。

无论在什么地方,只要临时需要一些变量,就可以使用私有作用域:

function outputNumbers(count) {
    (function () {
        for (var i = 0; i < count; i ++) {
            alert(i);
        }
    }) ();
    
    alert(i); // 会导致错误,读取不到 i;
}

因为在匿名函数中定义的任何变量,都会在执行结束时立即销毁,所以变量 i 只能在循环中使用。

  • 查询标识符。

当在某个环境中为了读取或写入而引用一个变量或函数名 ( 标识符 ),必须通过搜索来确定该它实际代表什么。

搜索过程从作用域的前端开始,向上逐级查找,如果存在一个局部的变量的定义,则停止搜索,即同名局部变量将覆盖同名全局变量:

var color = 'blue';

function getColor() {
    var color = 'red'; // 局部变量;
    return color;
}

alert(getColor()); // 'red';
alert(window.color); // 'blue';

垃圾收集。

JavaScript 具有自动垃圾收集机制,所以开发人员不必担心内存使用问题,是不是很开森 🤗,但最好还是了解下 😕。

首先我们来分析函数中局部变量的正常生命周期:局部变量只在函数执行的过程中存在,函数执行结束后就会释放掉它们的内存以供将来使用。所以 垃圾收集器必须跟踪哪些变量有用、哪些变量没用,具体到浏览器的实现有两个策略:标记清除和引用计数

  • 标记清除

此乃 JavaScript 中最常用的垃圾收集机制。

垃圾收集器在运行的时候会把存储在内存中的所有变量都加上标记,然后去掉环境中的变量及被环境中的变量引用的变量的标记,

在此之后还有标记的变量将被视为准备删除的变量,因为环境中的变量已经无法访问到这些变量了。最后垃圾收集器完成内存清除工作,销毁那些带标记的值并回收它们所占用的内存空间。

  • 引用计数

另一种出镜率不高的垃圾收集策略是引用计数。

它主要跟踪记录每个值被引用的次数,当某个值的引用次数为 0 时,则说明没有办法再访问这个值了,因此就可以将其占用的内存空间回收。

但引用计数会存在一个循环引用的问题:

function problem() {
    var objA = new Object();
    var objB = new Object();
    
    objA.someOtherObject = objB;
    objB.anotherObject = objA;
}

也就是说,在函数执行完之后,objA 和 objB 还将继续存在,因此它们的引用次数永远不会是 0,假如这个函数被重复多次调用,就会导致大量内存得不到回收 😱。

为了避免这样的循环引用问题,最好在不使用它们的时候手动断开连接:

objA.someOtherObject = null;
objB.anotherObject = null;

当垃圾收集器下次运行时,就会删除这些值并回收它们所占用的内存。

Tips:一旦数据不再有用,最好将其设为 null。

( 此条适合全局变量和全局对象的属性,因为局部变量会在它们离开执行环境时自动被解除引用 )。

ok,JavaScript 基础的变量、作用域和垃圾回收咱就先讲到这,下一篇会聊聊 JavaScript 面向对象的程序设计和函数表达式。

有赞咱再更吧,多谢多谢~ 🤗