阅读 603

【译】The story of a V8 performance cliff in React

前言

本文是根据自己的理解翻译而来,如有疑惑可查看原文。

本次暂定翻译三篇文章:

  1. JavaScript engine fundamentals: Shapes and Inline Caches(Published 14th June 2018)
  2. JavaScript engine fundamentals: optimizing prototypes(Published 16th August 2018)
  3. The story of a V8 performance cliff in React(Published 28 August 2019)

JavaScript types

在 JavaScript 中,值有 8 总类型(当前):NumberStringSymbolBigIntBooleanUndefinedNullObject

01-javascript-types
01-javascript-types

除了一个明显的例外,这些类型都可以用 typeof 直接查看。

typeof 42;
// → 'number'
typeof 'foo';
// → 'string'
typeof Symbol('bar');
// → 'symbol'
typeof 42n;
// → 'bigint'
typeof true;
// → 'boolean'
typeof undefined;
// → 'undefined'
typeof null;
// → 'object' 🤔
typeof { x: 42 };
// → 'object'
复制代码

typeof null 返回的是 'object',而不是 'null',要了解为什么,首先要把所有的 JavaScript 类型分成两组:

  • objects(即,对象类型)
  • primitives(即,非对象类型)

照此来说,null 表示「没有对象」,而 undefined 表示 「没有值」。

02-primitives-objects
02-primitives-objects

按照这个思路,Brendan Eich 在设计 JavaScript 时,受到 Java 的影响,使得右手边的值执行 typeof 后都返回 object。因此,即便规范里有 Null 类型,typeof null === 'object' 依然成立。

03-primitives-objects-typeof
03-primitives-objects-typeof

Value representation

JavaScript 引擎能够在内存中表示任意的 JavaScript 值。然而,值得注意的是,JavaScript 引擎在内存中值类型的表现形式是不同于 JavaScript 中的类型描述。

例如,42,在 JavaScript 中是 number 类型。

typeof 42;
// → 'number'
复制代码

在内存中有好多种方式表示整数,例如 42:

representation bits
two’s complement 8-bit 0010 1010
two’s complement 32-bit 0000 0000 0000 0000 0000 0000 0010 1010
packed binary-coded decimal (BCD) `0100 0010
`
32-bit IEEE-754 floating-point `0100 0010 0010 1000 0000 0000 0000 0000
`
64-bit IEEE-754 floating-point `0100 0000 0100 0101 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
`

ECMAScript 将数字标准化为 64 位浮点值,也称为双精度浮点或 Float64。但是,这并不意味着 JavaScript 引擎总是以 Float64 的形式存储数字 —— 这么做会很低效。引擎会选择其它的内部表现形式,除非观测到的行为完全匹配 Float64。

在真实的 JavaScript 应用中,大多数数字都是合法的 ECMAScript 数组索引,即,属于 0 ~ 2³²−2 范围内的整数。

array[0]; // Smallest possible array index.
array[42];
array[2**32-2]; // Greatest possible array index.
复制代码

JavaScript 引擎会为数字选择最优存储的表达形式以此优化数组元素的访问效率。对于处理器的内存访问操作,数组索引必须是二进制补码的形式。用 Float64 表示数组是一种很费性能的行为,因为每次访问数组元素引擎都需要在 Float64 和二进制补码之间转换。

32 位的二进制补码表达形式对数组操作是很有用的。通常来说,处理器执行整型操作比执行浮点型操作要快得多。所以说,下面的例子,第一个循环比第二个循环快两倍。

for (let i = 0; i < 1000; ++i) {
  // fast 🚀
}

for (let i = 0.1; i < 1000.1; ++i) {
  // slow 🐌
}
复制代码

操作符也是一样。在下面的代码中,模运算符的性能取决于处理的是否是整数。

const remainder = value % divisor;
// Fast 🚀 if `value` and `divisor` are represented as integers,
// slow 🐌 otherwise.
复制代码

如果两个操作数都是整数的形式,CPU 就可以高效地计算出结果。如果除数是 2 的倍数,V8 还会有额外的捷径。对于值是浮点型的形式,计算过程会变得复杂耗时。

因为整型操作的执行速度通常比浮点型要快很多,所以,引擎就应该使用二进制补码来表示所有的整型和整型操作的结果。遗憾的是,那是有悖于 ECMAScript 规范的!ECMAScript 采用了 Float64,某些整数运算实际上产生的是浮点型。在下面这种情况下,对于能够产生正确的结果很重要。

// Float64 has a safe integer range of 53 bits. Beyond that range,
// you must lose precision.
2**53 === 2**53+1;
// → true

// Float64 supports negative zeros, so -1 * 0 must be -0, but
// there’s no way to represent negative zero in two’s complement.
-1*0 === -0;
// → true

// Float64 has infinities which can be produced through division
// by zero.
1/0 === Infinity;
// → true
-1/0 === -Infinity;
// → true

// Float64 also has NaNs.
0/0 === NaN;
复制代码

左边的值都是整型,而右边的却是浮点型。以上的操作在使用 32 位二进制补码的形式是没法正确执行的。JavaScript 引擎必须确保整型操作被合理地处理以生成想要的 Float64 结果。

对于在 31 位有符号整数范围内的小整数,V8 有特殊的表示形式,称为 Smi。对于非 Smi 的数值会被表示为 HeapObject,它是内存中某些实体的地址。我们使用一种特殊的 HeapObject,即所谓的 HeapNumber,来表示超出 Smi 范围的数字。

 -Infinity // HeapNumber
-(2**30)-1 // HeapNumber
  -(2**30) // Smi
       -42 // Smi
        -0 // HeapNumber
         0 // Smi
       4.2 // HeapNumber
        42 // Smi
   2**30-1 // Smi
     2**30 // HeapNumber
  Infinity // HeapNumber
       NaN // HeapNumber
复制代码

如上所示,某些数字被表示为 Smi,其它数字被表示为 HeapNumber。V8 对 Smi 专门优化,因为在真实的 JavaScript 编程中,小的整数是非常普遍的。Smi 没必要在内存中分配专用的实体,而且它本可以快速地整型操作。

Smi vs. HeapNumber vs. MutableHeapNumber

有以下对象:

const o = {
  x: 42,  // Smi
  y: 4.2, // HeapNumber
};
复制代码

x 的值 42 被编程为 Smi,因此它被存储在对象里。另一方面值 4.2 需要一个独立的实例(空间)来保存这个值,并且这个对象会指向这个实体。

04-smi-vs-heapnumber
04-smi-vs-heapnumber

运行以下 JavaScript 代码片段:

o.x += 10;
// → o.x is now 52
o.y += 1;
// → o.y is now 5.2
复制代码

这种情况下,x 的值可以就地更新,因为新的值 52 也在 Smi 的范围内。

05-update-smi
05-update-smi

然而,新的值 y=5.2 不在 Smi 范围内且不同于之前的值 4.2,因此 V8 为 y 重新分配了新的 HeapNumber 实体。

06-update-heapnumber
06-update-heapnumber

HeapNumber 是不可变的,它使得某些优化成为可能。例如,我们把 y 赋值给 x:

o.x = o.y;
// → o.x is now 5.2
复制代码

我们只需要把它连接到同一个 HeapNumber 上而不是重新分配一个新的实体(空间)。

07-heapnumbers
07-heapnumbers

HeapNumber 不可变也存在缺点,如果更新的值经常不在 Smi 的范围内,它就会变慢,例如下面的例子:

// Create a `HeapNumber` instance.
const o = { x: 0.1 };

for (let i = 0; i < 5; ++i) {
  // Create an additional `HeapNumber` instance.
  o.x += 1;
}
复制代码

第一行创建了一个 HeapNumber 实例,其初始值为 0.1。在循环体中值从 1.1,2.1,3.1,4.2 变到 5.1,一共创建了 6 个 HeapNumber 实例,其中 5 个会在循环结束后变没有任何用处。

08-garbage-heapnumbers
08-garbage-heapnumbers

为了避免这种情况,作为优化,V8 提供了就地更新非 Smi 数值的方法。当一个字段对应着非 Smi 的数值,V8 会在 shape 上将这个字段标记为 Double,并分配一个保存 Float64 的 MutableHeapNumber 实体。

09-mutableheapnumber
09-mutableheapnumber

当字段里的值发生变化时,V8 不必分配一个新的 HeapNumber,而是在 MutableHeapNumber 实体中就地更新。

10-update-mutableheapnumber
10-update-mutableheapnumber

然而,需要注意的是,MutableHeapNumber 中的值是可以改变的,所以值不应该传来传去的。

11-mutableheapnumber-to-heapnumber
11-mutableheapnumber-to-heapnumber

例如,你把 o.x 赋值给变量 y,你不希望 y 会随着 o.x 的改变而改变!所以在给 y 赋值前,必须将 o.x 的值重新包装成 HeapNumber。

对于浮点型,V8 已经默默地包装了一下。但是,对于小的整数也采用和 MutableHeapNumber 相同的方法,就会显得浪费,因为 Smi 本就是一种更高效的表现形式。

const object = { x: 1 };
// → no “boxing” for `x` in object

object.x += 1;
// → update the value of `x` inside object
复制代码

为了避免低效率,我们会在 shape 上为小整数对应的字段上标记 Smi,并且会原地更新数值,只要这个数值在 Smi 范围内。

12-smi-no-boxing
12-smi-no-boxing

Shape deprecations and migrations

如果一个字段里包含的值在 Smi 范围内,之后又不属于 Smi 范围,这中间发生了什么?现有两个对象,它们的 x 属性值都是 Smi 表示形式。

const a = { x: 1 };
const b = { x: 2 };
// → objects have `x` as `Smi` field now

b.x = 0.2;
// → `b.x` is now represented as a `Double`

y = a.x;
复制代码

这两个对象都指向同一个 shape,x 属性特性 Representation 被标记为 Smi:

13-shape
13-shape

b.x 变成 Double 形式,V8 会创建一个新的 shape,属性 x 的 Representation 被标记为 Double 且指向之前的空 shape。V8 也会为属性 x 分配一个 MutableHeapNumber 实体用来保存值 0.2。然后让对象 b 指向新创建的 shape 并且内部偏移量为 0 的位置指向刚分配的 MutableHeapNumber 实体。最后,我们把旧的 shape 标记为废弃的,并断开与过渡树(transition tree)的链接。这就完成了从空 shape 到新 shape 的过渡。

14-shape-transition
14-shape-transition

我们不能同时完全删除旧 shape,因为对象 a 还在使用,而且短时间找到所有链接到旧 shape 的对象并更新它们,对 V8 来说是笔很大的开销。相反,V8 不急着处理:只有在改变对象 a 的时候才开始迁移到新的 shape。最终,标记为废弃的 shape 会慢慢淡出视野并被垃圾回收机制抹除。

15-shape-deprecation
15-shape-deprecation

更棘手的问题是,如果对象上属性特性 Representation 发生变化的属性不是 shape 链上的最后一个,又会发生什么呢?

16-split-shape
16-split-shape

从产生分支的 shape 开始,我们为属性 y 创建了一个新的过渡链且 y 被标记为 Double。我们在使用新的过渡链时,也就意味着旧的过渡链将被废弃。在最后一步,我们把实例 o 迁移到新的 shape 并用 MutableHeapNumber 保存 y 的值。就这样,新对象不再使用老的那一套,一旦旧的 shape 上的链接都被移除掉,旧 shape 也会从过渡树上消失。

Extensibility and integrity-level transitions

Object.preventExtensions() 防止将新属性添加到对象中。如果你这么做了,它将会抛异常。(如果是在非严格模式下,它不会抛异常而是默认什么都不做。)

const object = { x: 1 };
Object.preventExtensions(object);
object.y = 2;
// TypeError: Cannot add property y;
//            object is not extensible
复制代码

Object.sealObject.preventExtensions 相似,但是它会把所有的属性标记为不可配置,这就意味着你不能删除它们,或改变他们的可枚举性,可配置性,可写性。

const object = { x: 1 };
Object.seal(object);
object.y = 2;
// TypeError: Cannot add property y;
//            object is not extensible
delete object.x;
// TypeError: Cannot delete property x
复制代码

Object.freezeObject.seal 相似,但是它将所有属性标记为不可写以防止属性值被修改。

const object = { x: 1 };
Object.freeze(object);
object.y = 2;
// TypeError: Cannot add property y;
//            object is not extensible
delete object.x;
// TypeError: Cannot delete property x
object.x = 3;
// TypeError: Cannot assign to read-only property x
复制代码

让我们来思考一个具体的例子,有两个都只有属性 y 的对象,并阻止第二个对象有任何的扩展。

const a = { x: 1 };
const b = { x: 2 };

Object.preventExtensions(b);
复制代码

就如我们所知的,从空的 shape 过渡到一个有属性 x (被标记为 Smi)的新 shape 上。当我们阻止 b 的扩展时,我们会过渡到标记为不可扩展的新 shape 上。这个新 shape 没有任何属性,仅仅作为一个标识。

17-shape-nonextensible
17-shape-nonextensible

注意,我们不能就地更新有 x 的 shape,因为对象 a 依然是可扩展的。

The React performance issue

让我们用以上学到的知识来解析下 the recent React issue #14365。简单重现这个 bug:

const o = { x: 1, y: 2 };
Object.preventExtensions(o);
o.y = 0.2;
复制代码

有一个拥有两个字段的对象,而且它们的属性特性 Representation 被标记为 Smi。我们阻止对象的进一步扩展,但最终我们还是强制改变第二字段的属性特性 Representation 的值(Double)。

就如之前学到的,大致流程如下:

18-repro-shape-setup
18-repro-shape-setup

每个属性的特性 Representation 都被标记为 Smi,并最终过渡到被标记为不可扩展的 shape 上。

我们需要将 y 的属性特性 Representation 标记为 Double,这意味着我们需要从引入 y 属性之前的 shape 开始。在这个例子中,就是引入 x 属性的那个 shape。但是, V8 会很困惑,因为当前的 shape 是不可扩展的,而找到的 shape 却是可扩展的。V8 不知道怎么去处理这个过渡树。因此,V8 不再试图搞清楚这些关系,而是创建了一个独立的 shape,这个 shape 和先前的过渡树没有任何关联,而且也不被任何其它对象共享。可以把它当作孤立的 shape:

https://user-gold-cdn.xitu.io/2019/10/2/16d8a4a447a973ff?w=960&h=540&f=svg&s=105117
19-orphaned-shape

你可以想象,如果有很多对象的话,这样会变得很糟糕,因为整个 shape 系统已经失去价值。

在 React 的案例中,当开始分析数据时,FiberNode 上的一些字段需要记录时间戳。

class FiberNode {
  constructor() {
    this.actualStartTime = 0;
    Object.preventExtensions(this);
  }
}

const node1 = new FiberNode();
const node2 = new FiberNode();
复制代码

这些字段(比如,actualStartTime)初始化值是 0 或 -1,因此属性特性 Representation 为 Smi。但是,之后由 performance.now() 生成的浮点型数值被保存在这些字段中,因此属性特性 Representation 被标记为 Double。除此之外,React 还阻止 FiberNode 实例扩展属性。

刚开始的状况如下:

20-fibernode-shape
20-fibernode-shape

如预期,两个实例共享着 shape 树。但是之后,一旦你存储了真实的时间戳,V8 就会无从下手:

21-orphan-islands
21-orphan-islands

V8 先后给 node1,node2 分别分配了独立的 shape,且它们之间没有任何关联。真实中的 React 应用有着数万个这样的 FiberNode。你可以想象,这种情况将会严重影响到 V8 的性能。

幸运的是,这个问题V8 v7.4 中解决了。研发人员找到了改变属性特性 Representation 的方法,V8 终于知道它该怎么做了:

22-fix
22-fix

两个 FiberNode 实例指向不可扩展的 shape,shape 中的 actualStartTime 被标记为 Smi。当 node1.actualStartTime 被分配新的值时,将会生成一条新的过渡链,而且之前的过渡链会被标记为废弃的。

23-fix-fibernode-shape-1
23-fix-fibernode-shape-1

可以注意到,现在的过渡链可以正确的过渡转移。

24-fix-fibernode-shape-2
24-fix-fibernode-shape-2

node2.actualStartTime 也被重新分配时,所有的链接都指向了新的 shape,过渡树中废弃的部分将会被垃圾回收机制清除。

React 团队将 FiberNode 所有关于时间的字段都改成了 Double 形式从而缓解这个问题。

class FiberNode {
  constructor() {
    // Force `Double` representation from the start.
    this.actualStartTime = Number.NaN;
    // Later, you can still initialize to the value you want:
    this.actualStartTime = 0;
    Object.preventExtensions(this);
  }
}

const node1 = new FiberNode();
const node2 = new FiberNode();
复制代码

由 React 具体的 Bug 引出了 V8 特有的问题,通常来说,开发者不必对某个版本的 JavaScript 引擎做优化。不过,当时事情向不好的方向发展时,我们也不会束手无策。

要知道 JavaScript 引擎在幕后做了很多事,尽可能的不要去混合类型。例如,给一个数字字段初始化为 null,这样做的话会使得一些优化化为泡影,而且可读性降低。

// Don’t do this!
class Point {
  x = null;
  y = null;
}

const p = new Point();
p.x = 0.1;
p.y = 402;
复制代码

换句话说,写可读性代码,性能自然会紧跟其后!

Take-aways

本文覆盖了一下几点:

  1. JavaScript 区分了 primitives 和 objects,而且 typeof 不靠谱。
  2. 即使是相同类型的值也会有不同的表达形式。
  3. JavaScript 引擎会为每个属性找到最优的表达形式。
  4. 讨论了 V8 处理 shape 的废弃,迁移和可扩展。

基于以上的知识,我们可以使用一些 JavaScript 编程技巧来提升性能:

  1. 以相同的方式初始化对象类型,这样 shape 系统会更高效。
  2. 为你的字段选择合理的值(「Representation」:Smi 或 非 Smi)。
关注下面的标签,发现更多相似文章
评论