iOS面试之AutoreleasePool

原文链接

AutoreleasePool对于iOS开发者来说，可以说是"熟悉的陌生人"。熟悉是因为每个iOS程序都被包围在一个autoreleasepool中，陌生是因为整个autoreleasepool是黑盒的，开发者看不到autoreleasepool中发生了什么，而且项目开发中直接用到autoreleasepool的地方不多。本文结合Runtime源码，分析一下AutoreleasePool的内部实现。

iOS程序入口

我们都知道，iOS程序的入口是main.m文件中的main方法。在Xcode中新建一个iOS项目，Xcode会自动生成main.m文件。main.m文件中只有一个main方法，绝大多数情况下，不需要修改main.m中的代码。

一个典型的main函数：

int main(int argc, char * argv[]) {
    @autoreleasepool {
        return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
    }
}

可以看到，main函数的函数体是包含在一个autoreleasepool中的。可惜的是，通过command + 鼠标左键，并不能看到autoreleasepool的定义。不过我们可以使用clang,将main.m文件编译成C++代码，看看autoreleasepool发生了什么。

使用命令：

clang -rewrite-objc main.m

生成main.cpp文件。

生成的main.cpp文件很大，大概有10w行，不需要关注文件到底有多少行。将文件拖到最下面，看一下main函数变成了什么：

int main(int argc, char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
        NSLog((NSString *)&__NSConstantStringImpl__var_folders_09_mbt6ttpn7_39cpx9j6zg6h440000gp_T_main_f1e080_mi_0);
        return 0;

    }
}

整个函数的函数体被包围在了__AtAutoreleasePoool __autoreleasepool中。而且前面有关于@autoreleasepool的注释，因此可以猜测autoreleasepool被表示成了__AtAutoreleasePool。

在main.cpp中搜索一下，看看__AtAutoreleasePool是什么。

struct __AtAutoreleasePool {
  __AtAutoreleasePool() {atautoreleasepoolobj = objc_autoreleasePoolPush();}
  ~__AtAutoreleasePool() {objc_autoreleasePoolPop(atautoreleasepoolobj);}
  void * atautoreleasepoolobj;
};

__AtAutoreleasePool是一个结构体，结构体中包含构造函数和析构函数。构造函数中调用了

atautoreleasepoolobj = objc_autoreleasePoolPush();

析构函数中调用了

objc_autoreleasePoolPop(atautoreleasepoolobj);

于是，关注的重点就成了objc_autoreleasePoolPush和objc_autoreleasePoolPop函数。

objc_autoreleasePoolPush和objc_autoreleasePoolPop函数在Runtime源码中可以找到，位于NSObject.mm文件中。

AutoreleasePoolPage

看一下Runtime源码中objc_autoreleasePoolPush和objc_autoreleasePoolPop函数的实现。

void * objc_autoreleasePoolPush(void)
{
    // 调用了AutoreleasePoolPage中的push方法
    return AutoreleasePoolPage::push();
}

void objc_autoreleasePoolPop(void *ctxt)
{
    // 调用了AutoreleasePoolPage中的pop方法
    AutoreleasePoolPage::pop(ctxt);
}

通过源码可以看到分别调用了AutoreleasePoolPage的push方法和pop方法。

AutoreleasePoolPage的定义

AutoreleasePoolPage的定义位于NSObject.mm文件中：

// AutoreleasePoolPage的大小是4096字节
class AutoreleasePoolPage 
{
#   define EMPTY_POOL_PLACEHOLDER ((id*)1)

    // 哨兵对象
#   define POOL_BOUNDARY nil
    static pthread_key_t const key = AUTORELEASE_POOL_KEY;
    static uint8_t const SCRIBBLE = 0xA3;  // 0xA3A3A3A3 after releasing
    // AutoreleasePoolPage的大小，通过宏定义，可以看到是4096字节
    static size_t const SIZE =
#if PROTECT_AUTORELEASEPOOL
        PAGE_MAX_SIZE;  // must be multiple of vm page size
#else
        PAGE_MAX_SIZE;  // size and alignment, power of 2
#endif
    static size_t const COUNT = SIZE / sizeof(id);

    magic_t const magic;
    // 一个AutoreleasePoolPage中会存储多个对象
    // next指向的是下一个AutoreleasePoolPage中下一个为空的内存地址（新来的对象会存储到next处）
    id *next;
    // 保存了当前页所在的线程(一个AutoreleasePoolPage属于一个线程，一个线程中可以有多个AutoreleasePoolPage)
    pthread_t const thread;
    // AutoreleasePoolPage是以双向链表的形式连接
    // 前一个节点
    AutoreleasePoolPage * const parent;
    // 后一个节点
    AutoreleasePoolPage *child;
    uint32_t const depth;
    uint32_t hiwat;
}

除此之外，还定义了很多方法，方法的作用及实现下面会分析。

在上面的定义中，我已经加了些注释。通过注释可以得到：

一个AutoreleasePoolPage的大小是4096字节（和操作系统中一页的大小一致）。
parent指针和child指针特别有意思，指向的同样是AutoreleasePoolPage，如果对数据结构比较熟悉的话，看到类似的定义，应该可以联想到双向链表或者树结构。实际上也正是如此，下面我们会提到AutoreleasePoolPage组成的双向链表。
thread表示当前AutoreleasePoolPage所属的线程。
next指针指向了下一个空的地址。一个AutoreleasePoolPage中可以存储多个对象地址，新来的对象地址会存放到next处，然后next移动到下一个地址。这样的操作有没有联想到哪种数据结构？是不是和栈的top指针特别类似？

对AutoreleasePoolPage的定义有了基本的了解之后，来看一下push方法和pop方法。

AutoreleasePoolPage::push方法

AutoreleasePoolPage中的push方法，经过简化之后如下：

static inline void *push() 
{
    id *dest;
    // POOL_BOUNDARY其实就是nil
    dest = autoreleaseFast(POOL_BOUNDARY);
    return dest;
}

push方法中主要调用了autoreleaseFast方法，所传入的参数是POOL_BOUNDARY，也就是nil。看你一下autoreleaseFast方法的实现。

static inline id *autoreleaseFast(id obj)
{
    // hotPage就是当前正在使用的AutoreleasePoolPage
    AutoreleasePoolPage *page = hotPage();
    if (page && !page->full()) {
        // 有hotPage且hotPage不满，将对象添加到hotPage中
        return page->add(obj);
    } else if (page) {
        // 有hotPage但是hotPage已满
        // 使用autoreleaseFullPage初始化一个新页，并将对象添加到新的AutoreleasePoolPage中
        return autoreleaseFullPage(obj, page);
    } else {
        // 无hotPage
        // 使用autoreleaseNoPage创建一个hotPage,并将对象添加到新创建的page中
        return autoreleaseNoPage(obj);
    }
}

我在代码中已经加入了注释，再来看一下里面涉及到的一些方法。

hotPage方法

// 获取正在使用的AutoreleasePoolPage
static inline AutoreleasePoolPage *hotPage() 
{
    AutoreleasePoolPage *result = (AutoreleasePoolPage *)
        tls_get_direct(key);
    if ((id *)result == EMPTY_POOL_PLACEHOLDER) return nil;
    if (result) result->fastcheck();
    return result;
}

hotPage可以理解成当前正在使用的page。上面也提到了，AutoreleasePoolPage中有parent和child指针，实际上AutoreleasePool就是由一个个AutoreleasePoolPage组成的双向链表。这里得到的hotPage可以理解成链表最末尾的结点。

获取hotPage的方法是tls_get_direct(key)，key是AutoreleasePoolPage结构中定义的

static pthread_key_t const key = AUTORELEASE_POOL_KEY;

setHotPage方法

static inline void setHotPage(AutoreleasePoolPage *page) 
{
    if (page) page->fastcheck();
    tls_set_direct(key, (void *)page);
}

将某个page设置成hotPage。

full方法

// 是否已满
bool full() { 
    return next == end();
}

判断当前的AutoreleasePoolPage是否已满。判断标准是next等于AutoreleasePoolPage的尾地址。上面已经提到了，AutoreleasePoolPage的大小是4096字节，既然大小是固定的，那么肯定有满的一刻，full方法就是用来做这个得。

add方法

// 将对象添加到AutoreleasePoolPage中
id *add(id obj)
{
    id *ret = next;  // faster than `return next-1` because of aliasing
    // next = obj; next++;
    // 也就是将obj存放在next处，并将next指向下一个位置
    *next++ = obj;
    return ret;
}

add方法所做的操作也比较简单，就是将当前对象存放在next指向的位置，并且将next指向下一个位置。可以理解成一个栈，next指针类似于栈的top指针。

autoreleaseFullPage方法

// 新建一个AutoreleasePoolPage，并将obj添加到新的AutoreleasePoolPage中
// 参数page是新AutoreleasePoolPage的父节点
static __attribute__((noinline))
id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page)
{
    do {
        // 如果page->child存在，那么使用page->child
        if (page->child) page = page->child;
        // 否则的话，初始化一个新的AutoreleasePoolPage
        else page = new AutoreleasePoolPage(page);
    } while (page->full());
    // 将找到的合适的page设置成hotPage
    setHotPage(page);
    // 将对象添加到hotPage中
    return page->add(obj);
}

autoreleaseFullPage所做的操作有三步：

首先找到一个合适的AutoreleasePoolPage，这里合适的page指的是不满的page。具体找的过程是从传过来的参数page的child开始找，如果page->child存在，则判断page->child是否是合适的page；如果page->child不存在，则初始化一个新的AutoreleasePoolPage,这里使用的是AutoreleasePoolPage的构造函数，传入的page是新的AutoreleasePoolPage的父节点。
将找到的AutoreleasePoolPage对象设置成hotPage
调用add方法，将对象添加到找到的page中

autoreleaseNoPage方法

// AutoreleasePool中还没有AutoreleasePoolPage
static __attribute__((noinline))
id *autoreleaseNoPage(id obj)
{
    // 初始化一个AutoreleasePoolPage
    // 当前内存中不存在AutoreleasePoolPage,则从头开始构建AutoreleasePoolPage,也就是其parent为nil
    AutoreleasePoolPage *page = new AutoreleasePoolPage(nil);
    // 将初始化的AutoreleasePoolPage设置成hotPage
    setHotPage(page);
    
    // Push a boundary on behalf of the previously-placeholder'd pool.
    // 添加一个边界对象（nil）
    if (pushExtraBoundary) {
        page->add(POOL_BOUNDARY);
    }
    
    // Push the requested object or pool.
    // 将对象添加到AutoreleasePoolPage中
    return page->add(obj);
}

autoreleaseNoPage方法处理的是当前autoreleasePool中还没有autoreleasePoolPage的情况。既然没有，需要新建一个AutoreleasePoolPage,且该page的父指针指向空，然后将该page设置成hotPage。之后向该page中先是添加了POOL_BOUNDARY，然后在把对象obj添加到page中。

关于为什么需要添加POOL_BOUNDARY的原因，后面会说到。

现在已经把autoreleaseFast方法中涉及到的方法都弄明白了，再来看一下autoreleaseFast方法做的操作。

static inline id *autoreleaseFast(id obj)
{
    // hotPage就是当前正在使用的AutoreleasePoolPage
    AutoreleasePoolPage *page = hotPage();
    if (page && !page->full()) {
        // 有hotPage且hotPage不满，将对象添加到hotPage中
        return page->add(obj);
    } else if (page) {
        // 有hotPage但是hotPage已满
        // 使用autoreleaseFullPage初始化一个新页，并将对象添加到新的AutoreleasePoolPage中
        return autoreleaseFullPage(obj, page);
    } else {
        // 无hotPage
        // 使用autoreleaseNoPage创建一个hotPage,并将对象添加到新创建的page中
        return autoreleaseNoPage(obj);
    }
}

autoreleaseFast方法首先找到hotPage，也就是当前的page，之后分为三种情况：

如果hotPage存在，且hotPage还不满，则将对象添加到hotPage中
如果hotPage存在，但是hotPage已满，则调用autoreleaseFullPage方法 autoreleaseFullPage方法上面已经说了，做的操作就是从page开始找，找到一个不满的page，将找到的page设置成hotPage,并且将对象添加到找到的page中。
如果hotPage不存在，则调用autoreleaseNoPage方法 autoreleaseNoPage方法上面说了，做的操作就是新建一个AutoreleasePoolPage,并且将对象添加到新建的AutoreleasePoolPage中。

至此，AutoreleasePoolPage的push方法介绍完毕。

AutoreleasePoolPage::pop方法

AutoreleasePoolPage::pop方法的代码经过简化之后如下：

static inline void pop(void *token) 
{
    AutoreleasePoolPage *page;
    id *stop;
    page = pageForPointer(token);
    stop = (id *)token;
    page->releaseUntil(stop);
}

同理，还是先看一下里面调用到的方法的实现。不过，在介绍pop内部调用的方法之前，先来看一下pop方法中的参数到底是什么。

在文章开始处，我们是从clang重写之后的main.cpp文件引入到Runtime源码的，现在再回过去看一下main.cpp文件中的__AtAutoreleasePool结构体：

struct __AtAutoreleasePool {
  __AtAutoreleasePool() {atautoreleasepoolobj = objc_autoreleasePoolPush();}
  ~__AtAutoreleasePool() {objc_autoreleasePoolPop(atautoreleasepoolobj);}
  void * atautoreleasepoolobj;
};

objc_autoreleasePoolPop中的参数是atautoreleasepoolobj，而atautoreleasepoolobj是objc_autoreleasePoolPush方法返回的。也就是说，AutoreleasePoolPage中pop方法的参数是AutoreleasePoolPage中push方法返回的，比较拗口，可以多理解一下。那么，AutoreleasePoolPage中push方法返回的是什么呢？

上面已经介绍过push方法了，push方法内部分为了三种情况，无论哪种情况，最终都调用了add方法，并且返回了add方法的返回值。add方法的实现如下：

id *add(id obj)
{
    id *ret = next;  // faster than `return next-1` because of aliasing
    // next = obj; next++;
    // 也就是将obj存放在next处，并将next指向下一个位置
    *next++ = obj;
    return ret;
}

add方法返回的就是所要添加对象在AutoreleasePoolPage中的地址。

而在push方法中，添加的对象是哨兵对象POOL_BOUNDARY,所以，在pop方法中，参数也是哨兵对象POOL_BOUNDARY。

pageForPointer方法

pageForPointer的代码如下：

static AutoreleasePoolPage *pageForPointer(const void *p) 
{
    // 调用了pageForPointer方法
    return pageForPointer((uintptr_t)p);
}

// 根据内存地址，获取指针所在的AutoreleasePage的首地址
static AutoreleasePoolPage *pageForPointer(uintptr_t p) 
{
    AutoreleasePoolPage *result;
    // 偏移量
    uintptr_t offset = p % SIZE;
    result = (AutoreleasePoolPage *)(p - offset);
    result->fastcheck();
    return result;
}

pageForPointer方法的作用是根据指针位置，找到该指针位于哪个AutoreleasePoolPage，并返回找到的AutoreleasePoolPage(之前已经提到了，AutoreleasePool是由一个个AutoreleasePoolPage组成的双向链表，不止一个AutoreleasePoolPage)。

releaseUntil方法

releaseUntil方法的代码如下：

// 释放对象
// 这里需要注意的是，因为AutoreleasePool实际上就是由AutoreleasePoolPage组成的双向链表
// 因此，*stop可能不是在最新的AutoreleasePoolPage中，也就是下面的hotPage，这时需要从hotPage
// 开始，一直释放，直到stop，中间所经过的所有AutoreleasePoolPage,里面的对象都要释放
void releaseUntil(id *stop) 
{
    // 释放AutoreleasePoolPage中的对象，直到next指向stop
    while (this->next != stop) {
        // hotPage可以理解为当前正在使用的page
        AutoreleasePoolPage *page = hotPage();

        // fixme I think this `while` can be `if`, but I can't prove it
        // 如果page为空的话，将page指向上一个page
        // 注释写到猜测这里可以使用if，我感觉也可以使用if
        // 因为根据AutoreleasePoolPage的结构，理论上不可能存在连续两个page都为空
        while (page->empty()) {
            page = page->parent;
            setHotPage(page);
        }
        // obj = page->next; page->next--;
        id obj = *--page->next;
        memset((void*)page->next, SCRIBBLE, sizeof(*page->next));

        // POOL_BOUNDARY为nil，是哨兵对象
        if (obj != POOL_BOUNDARY) {
            // 释放obj对象
            objc_release(obj);
        }
    }
    // 重新设置hotPage
    setHotPage(this);
}

代码中我已经加了注释，releaseUntil做的操作就是持续释放AutoreleasePoolPage中的对象，直到next = stop。

回过头来再来看一下pop方法：

static inline void pop(void *token) 
{
    AutoreleasePoolPage *page;
    id *stop;
    page = pageForPointer(token);
    stop = (id *)token;
    page->releaseUntil(stop);
}

pop方法中主要做了两步：

根据token，也就是哨兵对象找到该哨兵对象所处的page
从hotPage开始，一直删除到第一步找到的page.next==stop（哨兵对象）的位置

至此，关于AutoreleasePoolPage以及其中的关键方法就全部介绍完毕了。如果到这里，关于AutoreleasePool、AutoreleasePoolPage、哨兵对象还有点蒙的话，不要着急，继续往下看。

AutoreleasePool和AutoreleasePoolPage的关系

实际上，Runtime中并没有AutoreleasePool结构的定义，AutoreleasePool是由AutoreleasePoolPage组成的双向链表，如下图：

在autoreleasepool的开始处，会调用AutoreleasePoolPage的push方法；在autoreleasepool的结束处，会调用AutoreleasePoolPage的pop方法。在AutoreleasePoolPage的push方法中，会往AutoreleasePoolPage中插入哨兵对象，之后的对象依次插入到AutoreleasePoolPage中。如下表示：

AutoreleasePoolPage::push(); // 这里会向AutoreleasePoolPage中插入哨兵对象
*** // 开发者自己写的代码，代码中的对象会依次插入到AutoreleasePoolPage中
***
AutoreleasePoolPage::pop(nil);

当AutoreleasePoolPage满之后，会新建一个AutoreleasePoolPage，继续将对象添加到新的AutoreleasePoolPage中。

通过上面的介绍，可以知道，AutoreleasePool由多个AutoreleasePoolPage组成，且AutoreleasePool的开始处必定是一个哨兵对象。到这里，哨兵对象的作用也就清楚了，哨兵对象是用来分隔不同的AutoreleasePool的。

当调用AutoreleasePoolPage::pop(nil)方法时，会从某个autoreleasepool开始，一直释放到参数哨兵对象所属的autoreleasepool。可以是同一个autoreleasepool，也可以不是同一个autoreleasepool,当不是同一个autoreleasepool时，可以理解成是嵌套autoreleasepool释放。

到这里，AutoreleasePool、AutoreleasePoolPage、哨兵对象之间的关系应该就理解了。

关于AutoreleasePool的一些面试题

AutoreleasePool在面试中出现的频率也非常高，接下来分享几道关于AutoreleasePool的面试题。

AutoreleasePool和线程的关系

确切地说，应该是AutoreleasePoolPage和线程的关系。AutoreleasePool是由AutoreleasePoolPage组成的双向链表，根据AutoreleasePoolPage的定义，每一个AutoreleasePoolPage都属于一个特定的线程。也就是说，一个线程可以有多个AutoreleasePoolPage，但是一个AutoreleasePoolPage只能属于一个线程。

AutoreleasePool和Runloop的关系

Runloop,即运行循环。从直观上看，RunLoop和AutoreleasePool似乎没什么关系，其实不然。在一个完整的RunLoop中，RunLoop开始的时候，会创建一个AutoreleasePool，在RunLoop运行期间，autorelease对象会加入到自动释放池中。在RunLoop结束之前，AutoreleasePool会被销毁，也就是调用AutoreleasePoolPage::pop方法，在该方法中，自动释放池中的所有对象会收到release消息。正常情况下，AutoreleasePool中的对象发送完release消息后，引用计数应该为0，会被释放，如果引用计数不为0，则发生了内存泄露。

AutoreleasePool中对象什么时候释放？

其实上面已经说过了，AutoreleasePool销毁时，AutoreleasePool中的所有对象都会发送release消息，对象会释放。那么，AutoreleasePool什么时候销毁呢？分两种情况：

一种情况就是上面提到的，当前RunLoop结束之前，AutoreleasePool会销毁。这种情况适用于系统自动生成的AutoreleasePool。
第二种情况是开发者自己写的AutoreleasePool，常见于for循环中，将循环体包在一个AutoreleasePool中。这种情况下，在AutoreleasePool作用域之后（也就是大括号），AutoreleasePool会销毁。