[译]为什么 null 不好？

原文地址：why null is bad

原文作者：Yegor Bugayenko

译文出自：个人兴趣（非掘金翻译计划）

译者：高老庄里的猿

校对者：无，首次翻译，请读者们在评论中指正

先来看个 Java 中使用 null 作为返回值的简单例子：

public Employee getByName(String name) {
  int id = database.find(name);
  if (id == 0) {
    return null;
  }
  return new Employee(id);
}

该方法最大的问题是返回 null 代替了对象。在面向对象规范中使用 null 是个非常糟糕的做法，应该极力避免。有很多论据可以支持这一观点，包括 Tony Hoare 的演讲《Null References, The Billion Dollar Mistake》和 David West 的《Object Thinking》这本书。接下来我将所有的论据做一些整理并使用合适的面向对象结构代替 null 作为返回值。目前看来，至少有两种方法可以代替使用 null 。

1、使用空对象设计模式（最好定义一个常量）

public Employee getByName(String name) {
  int id = database.find(name);
  if (id == 0) {
    return Employee.NOBODY;
  }
  return Employee(id);
}

2、当不能返回一个对象时，可以抛出异常来让调用方 fail-fast（快速失败）

public Employee getByName(String name) {
  int id = database.find(name);
  if (id == 0) {
    throw new EmployeeNotFoundException(name);
  }
  return Employee(id);
}

现在来看看反对使用 null 的依据，除了上面提到的 Tony Hoares 的演讲和 David West 的书籍，我看过的还有 Robert Martin 的《Clean Code》、 Steve McConnell 的《Code Complete》、John Sonmez 的《Say “No” to “Null”》以及 StackOverflow 上的讨论《Is returning null bad design? 》。

特殊错误处理

每次将对象引用作为输入时都必须检查它是 null 的还是有效的，如果忘了检查，将会导致运行时 NPE（Null Pointer Exception）。这样你的代码逻辑会被多种检查和 if/then/else 分支所污染。看看下面的例子：

// 糟糕的设计，请勿复用
Employee employee = dept.getByName("Jeffrey");
if (employee == null) {
  System.out.println("can't find an employee");
  System.exit(-1);
} else {
  employee.transferTo(dept2);
}

这是 c 语言和其他很多面向过程编程语言处理异常所使用的方法，面向对象编程引入异常处理机制主要就是为了消除这些特殊的错误处理逻辑。在面向对象编程中，我们将异常以冒泡的方式不断的向上抛出直到应用层，这样我们的代码将变得更加小而美。

dept.getByName("Jeffrey").transferTo(dept2);

null 是面向过程编程的"封建余孽"，请使用 null 对象或者异常代替之。

语义的二义性

为了显示的将"函数会返回真正的对象或者 null "这层含义表达出来，getByName()应该命名为getByNameOrNullIfNotFound()。每个类似的函数都应该这样做，否则会给代码阅读者来带来歧义。

为了语义的准确性，值得为函数定义更长的名称。

为了消除歧义，函数尽量返回一个真正的对象、一个 null 对象或者抛出一个异常。

有些人会争辩说有时为了性能，不得不返回 null。比如 java Map 接口中的 get() 方法，当在 map 中找不到相应的条目时会返回 null，例如：

Employee employee = employees.get("Jeffrey");
if (employee == null) {
  throw new EmployeeNotFoundException();
}
return employee;

由于 Map 的 get() 方法返回 null ，上面代码只会在 map 中搜索一次。如果我们想重写 Map 的 get() 方法以让其在查找不到条目时抛出异常，代码应该这样写：

if (!employees.containsKey("Jeffrey")) { // first search
  throw new EmployeeNotFoundException();
}
return employees.get("Jeffrey"); // second search

很明显，这个方法比第一个方法慢两倍，怎么办呢？我觉得 Map 的接口设计存在缺陷（无意冒犯作者），它应该返回一个迭代器 Iterator 以便让我们代码可以像如下这样：

Iterator found = Map.search("Jeffrey");
if (!found.hasNext()) {
  throw new EmployeeNotFoundException();
}
return found.next();

BTW，这正是 C++ 标准库（STL）中 map::find() 方法的设计思路。

计算机思维 vs 对象思维

假如某人知道 Java 对象是一个指向某个数据结构的指针，并且知道 null 是一个空指针（在英特尔 x86 处理器中等于 0x00000000），那他应该能接受 if(employee == null) 这个语句。但是，如果以对象思维来进行思考，这个语句就没意义了。从一个对象的角度来看，我们的代码是这样的：

Hello, 请问是软件部吗？

是的。

麻烦让我和你们的 employee（员工） Jeffrey 聊聊。

请稍等...

Hello

你是 NULL ？

上面对话的最后一句看起来很奇怪，不是吗？相反，如果他们在接到我想与 Jeffrey 进行通话的需求后直接挂断电话会快速给我们制造个故障（异常）。这时我们可以尝试着再次拨过去或者直接告诉我们的主管无法联系到 Jeffrey 来完成更大的交易。

或者，他们可以让我们与另一个人交谈，他不是 Jeffrey，但如果我们需要“特定的” Jeffrey（null 对象）的话，他可以帮助我们解决大多数问题，也可以拒绝帮忙。

Slow Failing（慢失败）

与 failing fast（快速失败）相反，上述代码尝试缓慢死亡并杀死其他人。它向调用者隐藏了失败而不是让其知道出了问题需要马上进行异常处理。这个结论与上面"特殊错误处理"章节的讨论很接近。最好让代码尽可能脆弱，必要时让它崩溃。

要确保你的方法对调用方提供的操作数有着极高的要求，如果调用方提供的数据不够或者根本不符合方法主要的使用场景，抛出异常吧。或者返回一个 null 对象，该对象暴露一些常见行为，并对所有其他调用抛出异常，参考如下：

public Employee getByName(String name) {
  int id = database.find(name);
  Employee employee;
  if (id == 0) {
    employee = new Employee() {
      @Override
      public String name() {
        return "anonymous";
      }
      @Override
      public void transferTo(Department dept) {
        throw new AnonymousEmployeeException(
          "I can't be transferred, I'm anonymous"
        );
      }
    };
  } else {
    employee = Employee(id);
  }
  return employee;
}

可变的和不完整的对象

一般来说，强烈建议在设计对象时考虑到不变性。这意味着对象在实例化过程中就能获得所有必要的内容，并且在整个生命周期中永远不会更改其状态。 null 通常被用在延迟加载中以使对象不完整且可变。例如：

public class Department {
  private Employee found = null;
  public synchronized Employee manager() {
    if (this.found == null) {
      this.found = new Employee("Jeffrey");
    }
    return this.found;
  }
}

这种技术虽然应用广泛，但在面向对象编程中是一种反设计模式的。主要是因为它使一个 Employee 对象负责计算平台的性能问题，而这对 Employee 对象应该是透明的。

与其管理状态并公开业务相关的行为，不如让对象处理好其自身结果的缓存---这就是延迟加载的目的。缓存不是 employee 该在办公室里做的事，不是吗？

解决办法是不要像上面的例子那样，以这种原始的方式使用延迟加载。相反，将这个缓存问题移到应用的其他层。例如在 Java中可以使用面向切面编程技术。例如，jcabi-aspects 使用 @Cacheable 注解来缓存方法返回的值：

import com.jcabi.aspects.Cacheable;
public class Department {
  @Cacheable(forever = true)
  public Employee manager() {
    return new Employee("Jacky Brown");
  }
}

希望通过这篇文章的分析，能让你停止在代码中继续使用 null 作为返回值。