JavaScript 程序员可以从C ++中学到什么

作者：Bret Cameron

翻译：疯狂的技术宅

原文：medium.com/@bretcamero…

如何通过了解类型、内存以及低级语言使你成为更好的程序员

时间的结束？图片来自 Jens Kreuter，由Bret Cameron修改。

像许多开发新手一样，JavaScript 是我学的第一门语言。它是一种 Web 前端编程语言 —— 感谢Node.js —— 它同时也是一种流行的后端工具。

我也相信，作为一种“更高级”的语言，JavaScript 是初学者的绝佳选择。你可以在任何 Web 浏览器上运行它，并且由于具有原型继承和动态类型等功能，学习者在编写和执行第一段代码之前克服的障碍更少。

但是 JavaScript 让初学者更容易上手的因素也让它难以被掌握。它能以看上去不直观的方式运行，并且当涉及到更多不透明的功能时，许多程序员更依赖于试错法，例如隐式类型强制转换或 this 关键字。知道这些功能比理解它们要容易得多。

“Any fool can know. The point is to understand.” — Albert Einstein

“Any fool can know. The point is to understand.” — Albert Einstein

因此要成为更高级的 JavaScript 开发人员，试着更深入地了解幕后发生的事情是有很大帮助的。归根结底，最精彩的地方是 V8 JavaScript 引擎：它是使用最广泛的 JavaScript 编译器（Google Chrome、Node.js等的基础之一），它是开源的，因此你可以准确地看到 JavaScript 是怎样在 C ++ 中执行的。

但是本文不是 V8 的指南。相反，它是有关像 C++ 这样的低级语言如何帮助我们提高对 JavaScript 等高级语言的理解的一篇文章。 C++ 不仅可以帮助我们理解底层的编译器代码，而且通过研究 C++ 程序员必须要做而 JavaScript 程序员不必做的事，可以更好地了解在 JavaScript 中提升效率的地方，以及为什么有时会引发问题。

特别是我们将会研究 C++ 中的数据类型和内存管理，以及这些知识如何帮助我们避免类型错误，并防止 JavaScript 中的内存泄漏。还会研究内存管理与时间溢出之间的关系。

JavaScript 中强制类型

在进入 C++ 之前，先让我们看看 JavaScript 是如何处理数据类型以及“类型强制”系统的一些陷阱的。

JavaScript 使用类型强制转化自动将一种数据类型转换为另外一种：字符串转为数字、数字转为字符串、数字或字符串转为布尔值等等。换句话说，如果你没有明确指定所需的类型，JavaScript 将根据一组规则进行猜测。有时这很管用，它可以帮助我们快速简洁地编写代码。但有时候可能是引发混乱的原因。

实际上即使这种行为从根本上来讲是可预测的，但某些自动推测也不那么直观，并且在很多大型项目的代码库中，很容易看到类型强制转换导致了意外错误的发生。例如以下是使用组合字符串和数字的进行运算的一些演示：

"10" - 4
// 6

"10" + 4
// "104"

"20" - "5"
// 15

"20" + "5"
// 205

"20" + + "5"
// 205

"foo" + "bar"
// "foobar"

"foo" + + "bar"
// "fooNaN"

"6" - 3 + 3
// 6

"6" + 3 - 3
// 60

在这些例子中， + 运算符造成了大量的混乱，它可以强制把字符串转为数字，也可以作为连接运算符组合两个或多个字符串。

最后一个例子可能是最令人困惑的。在 "6" + 3 — 3 中，如果首先处理 3 — 3 ，然后再进行字符串连接，那么 "6" + 0 通常会返回一个字符串，在这里返回的结果居然是一个数字！

虽然类型强制转换可以帮助开发人员更快速、简洁地编写代码，但是它使初学者思考得更少，从而也就不清楚为什么这样的转换系统可能会导致错误，特别是在更大、更复杂的代码库中。上面的结果对于经验丰富的 JavaScript 程序来说可能是完全合理的，但它们并不直观！

考虑到 JavaScript 类型强制系统的优点和缺点，现在让我们看看 C++ 是如何处理数据类型的。

C++ 中的类型和内存管理

C++ 之类的低级语言没有这种潜在缺陷，因为必须在定义时声明数据类型。虽然 JavaScript 也有三个关键字 var、 let 和 const 用于声明新变量，但在C ++中每个数据类型都有自己的关键字。

例如 C++ 中的 7 种基本数据类型是整型、浮点型、双精度浮点型，字符型，宽字符型，布尔型和无类型。用于定义它们的关键字分别是 int、float、double、bool、char、wchar_t 和 void。

下面的代码段包含了每种类型的示例声明，并添加了注释：

#include <iostream>
#include <string>
using namespace std;

int main()
{
 
  // BOOLEANS
  bool isChecked = true;
  
  // INTEGERS
  int age = 24;

  // FLOATS
  // In general, a float has 7 decimal digits of precision, while a double has 15
  float pi7 = 3.1415926;
  double pi15 = 3.141592653589793;
  
  // CHARACTERS
  // Regular characters can contain only values stored in the ISO Latin tables
  // Wide characters, however, can contain unicode values
  char englishGreeting[6] = {'H', 'e', 'l', 'l', 'o', '\0'};
  wchar_t mandarinGreeting[7] = { 'n', 'ǐ', ' ', 'h', 'ǎ', 'o', '\0' };
  
  // STRINGS
  // In C++, string is not a data type (as it is in JavaScript and many other languages) 
  // It is a class, and so we must write #include <string> at the top of the document
  string greeting = "Hello";
  
  // VOID
  // A common use of void is to define functions which don't return anything
  void printMessage() {
    cout << "Hello, world!";
  };
  
  return 0;
}

与 JavaScript 不同，C++ 为开发人员提供了大量内存管理的方法。在 C++ 中，每声明一个变量时，我们也会决定要保留多少内存。例如，普通的 char 通常只包含8位（1字节），这就将其用途限制为 ISO Latin 表的255个字符。相比之下，wchar_t 包含16或32位，虽然占用了更多内存，但允许我们能够访问更多种类的 Unicode 字符。

在整型中可以找到最多的种类，其中基本的 int 关键字可以与关键字 short，long 和 long long 以及 “signedness” 关键字 signed 和 unsigned 结合使用。。

基本的 int 类型的取值范围是系统体系建议的自然范围。在 64 位操作系统上通常是 32 位。这就意味着这样的一个有符号的变量的取值范围在 -2,147,483,648 和 2,147,483,647 之间，而无符号变量的取值范围是 0 到 4,294,967,295 之间。

如果你能够确认自己的变量取值范围比较小，可以使用 short int 来节省内存。或者如果你正在处理非常大的整数，你可以使用 unsigned long long int 来处理 64 位的数字，其取值上限为 2^64 - 1。

为什么内存至关重要：一个关于时间溢出的用例

使用 64 位变量（例如 long long int）可以让计算机表示未来约 2.92 亿年的日期。这似乎是没什么必要的，但它实际上解决了一个非常实际的问题。

按照惯例，计算中的大多数日期都是用 Unix 时间来表示的，该时间的起始日期是 1970 年 1 月 1 日午夜，精确到秒。如果将 Unix 时间存储在有符号的 32 位变量中，可记录的最大值为 2,147,483,647。虽然看起来很大，但考虑到它每一秒都在增长，实际上 20 亿并不能让我们用得太久。

实际上 32 位系统上记录的日期将在 2038 年 1 月 19 日 UTC（恰好是 03:14:07 ）达到最大值。当这种情况发生时，日期将会变为负的 2,147,483,647，这个时间是 1901 年 12 月 13 日。它被称为 2038 问题，并且它导致了许多标题的出现，例如“所有计算机将在 2038 年完蛋” —— 由英国小报 Metro 提供。

这个令人震惊的标题可能并非事实，但是当 2038 年到来时，这个问题可能会导致 32 位操作系统甚至是整个旧版本的编程语言出现问题。我第一次遇到这个问题时正在用 PHP，在 5.2 版本之前没有内置的方式能够记录超过 2038 年的日期。（JavaScript 使用了 64 位系统来处理日期，所以我们 JavaScript 程序员不用担心这个）

2038 问题证明了我们自己管理内存的潜在用处。在需要较小取值范围的地方可以节省内存。在需要更大取值范围的场合，可以确保我们的系统能够拥有足够的内存。

JavaScript 中的内存管理

“JavaScript 在创建对象时自动分配内存，并在不再使用时释放它（垃圾回收）。这种自动化处理可能会引起混乱：它可能会给程序员带来错误的暗示，即他们不需要担心内存管理问题。“ —— MDN

JavaScript被称为“自动垃圾回收”语言。它用 mark-and-sweep 算法来检查哪些内存是活动的，哪些是“垃圾”。然后收集器可以释放“垃圾”，将未使用的内存还给操作系统。

自动垃圾回收是高级语言的一个特征，它有助于释放内存——不需要通过程序员的明确指示就可以告诉它不再需要。有关 JavaScript 中垃圾回收机制的信息，请查看这篇文章和 MDN’s page on Memory Management。

垃圾回收是一个强大的自动内存管理系统，但它并非万无一失。特别是所谓的“不需要的引用”可能会导致内存泄漏，这意味着程序占用的内存比实际需要的多，从而降低了内存的效率。但是如果我们能够意识到内存泄漏的风险，就可以采取措施将其删除。

意外的使用全局变量是导致内存泄漏的一个常见原因。当我们在 JavaScript 代码中没有用关键字 var、let 或 const 定义变量时，那么它会自动被认为是一个全局变量。除非已定义了 foo，否则表达式 foo =“bar” 相当于 window.foo = "bar" 。

像 ESLint 这样的 linting 工具可以帮助你找出这样的错误，但是 JavaScript 内置的严格模式也可以将它们标记为错误，从而防止意外使用全局变量。要激活严格模式，只需在脚本或函数的开头加入"use strict";。有关从代码中去除内存泄漏风险的更多方法，请参阅这篇文章。

JavaScript 中的类型

还有一些方法可以指定变量类型并在 JavaScript 中创建自己的类型，这种方式让人想到低级语言。最流行和最全面的解决方案是 TypeScript，它是 JavaScript 的语法超集，为语言添加了静态类型选项。

在 TypeScript 上有很多不错的资源，足以说明它是能确保你代码可扩展性而且没有错误的好方法，它可以帮助我们避免本文在前面关于“强制类型”那一节中看到的那种不直观的结果。 TypeScript 的文件扩展名是 .ts，还有一个等效的 .jsx：.tsx。对初学者来说最好的一篇文章是5分钟入门 TypeScript 。

值得注意的是，还有一些针对不同 JavaScript 技术的类型注释解决方案。例如你可以将官方的 PropTypes node module 添加到你的 React 项目中。这使你可以记录传递给组件的 props 的预期数据类型以及设置默认值。特别是当与像 ESLint 这样的 linter 结合使用时，PropTypes 是基于 React 的设置的强大补充。

结论

总的来说，我希望本文有助于阐明 C++ 这样的低级语言和 JavaScript 这类高级语言之间的一些差异。

我也希望它能够为你提供一种工具，以 TypeScript 或 PropTypes 的形式将 C++ 中的一些好处带入 JavaScript，并可以影响和改进 JavaScript 中的内存管理。

如果你对 C++ 有深入的理解，并且想要了解更多关于 JavaScript 的实现方式，最好的去处可能是官方 V8 网站或者官方 Git repo。Happy coding！

原文：medium.com/@bretcamero…

欢迎关注公众号：前端先锋，获取更多前端干货。