本文属笔记性质,主要针对自己理解不太透彻的地方进行记录。
推荐系统直接学习小码哥iOS底层原理班---MJ老师的课确实不错,强推一波。
OC对象本质
基于C与C++结构体实现
OC语言如何被编译器编译:
OC ==> C++ ==> 汇编 ==> 机器语言
而在C++中只有struct(结构体)
才能容纳不同类型的内容(比如不同属性
)。
将Objective-C代码转换为C\C++代码
clang -rewrite-objc OC源文件 -o 输出的CPP文件
将源文件转写成通用的cpp文件
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc OC源文件 -o 输出的CPP文件
通过Xcode将源文件转写成arm64架构下的iphoneos文件,文件内容比第一种要少
- 如果需要链接其他框架,使用-framework参数。比如-framework UIKit
NSObject的OC与C++定义
- 在OC中的定义
@interface NSObject <NSObject> {
Class isa;
}
- 转成C++之后的定义
struct NSObject_IMPL {
Class isa;
};
对于结构体来说,和数组一样。其第一个成员的地址,即为结构体对象的地址。 所以一个OC对象的地址,实际上就是其isa指针的地址。
而这个isa
是指向objc_class
结构体的指针
// 指针
typedef struct objc_class *Class;
而一个指针在64位系统中所占的内存为8字节
所以一个OC对象所占的内存至少为8字节
NSObject对象所占用内存的大小
上面的结论通过class_getInstanceSize
函数也可以佐证:
#import <objc/runtime.h>
/*
获得NSObject实例对象的
`成员变量`
所占用的大小 >> 8
*/
NSLog(@"%zd", class_getInstanceSize([NSObject class]));
//runtime源码中
size_t class_getInstanceSize(Class cls)
{
if (!cls) return 0;
return cls->alignedInstanceSize();
}
// Class's ivar size rounded up to a pointer-size boundary.
uint32_t alignedInstanceSize() {
return word_align(unalignedInstanceSize());
}
需要注意这个word_align
返回的是内存对齐后的大小,以unalignedInstanceSize
(为对齐的)大小作为参数。
而对于NSObject *obj
指针,我们有另一个函数可以查看其实际被分配的内存大小
#import <malloc/malloc.h>
// 获得obj指针所指向内存的大小 >> 16
NSLog(@"%zd", malloc_size((__bridge const void *)obj));
为什么8字节的结构体会被分配16字节
继续看runtime
+ (id)alloc {
return _objc_rootAlloc(self);
}
id _objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
if (slowpath(checkNil && !cls)) return nil;
#if __OBJC2__
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
// No alloc/allocWithZone implementation. Go straight to the allocator.
// fixme store hasCustomAWZ in the non-meta class and
// add it to canAllocFast's summary
if (fastpath(cls->canAllocFast())) {
// No ctors, raw isa, etc. Go straight to the metal.
bool dtor = cls->hasCxxDtor();
id obj = (id)calloc(1, cls->bits.fastInstanceSize());
if (slowpath(!obj)) return callBadAllocHandler(cls);
obj->initInstanceIsa(cls, dtor);
return obj;
}
else {
// Has ctor or raw isa or something. Use the slower path.
id obj = class_createInstance(cls, 0);
if (slowpath(!obj)) return callBadAllocHandler(cls);
return obj;
}
}
#endif
// No shortcuts available.
if (allocWithZone) return [cls allocWithZone:nil];
return [cls alloc];
}
// Replaced by ObjectAlloc
+ (id)allocWithZone:(struct _NSZone *)zone {
return _objc_rootAllocWithZone(self, (malloc_zone_t *)zone);
}
id _objc_rootAllocWithZone(Class cls, malloc_zone_t *zone)
{
id obj;
#if __OBJC2__
// allocWithZone under __OBJC2__ ignores the zone parameter
(void)zone;
obj = class_createInstance(cls, 0);
#else
if (!zone) {
obj = class_createInstance(cls, 0);
}
else {
obj = class_createInstanceFromZone(cls, 0, zone);
}
#endif
if (slowpath(!obj)) obj = callBadAllocHandler(cls);
return obj;
}
id class_createInstance(Class cls, size_t extraBytes)
{
return _class_createInstanceFromZone(cls, extraBytes, nil);
}
static __attribute__((always_inline))
id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)
{
if (!cls) return nil;
assert(cls->isRealized());
// Read class's info bits all at once for performance
bool hasCxxCtor = cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (!zone && fast) {
obj = (id)calloc(1, size);
if (!obj) return nil;
obj->initInstanceIsa(cls, hasCxxDtor);
}
else {
if (zone) {
obj = (id)malloc_zone_calloc ((malloc_zone_t *)zone, 1, size);
} else {
obj = (id)calloc(1, size);
}
if (!obj) return nil;
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (cxxConstruct && hasCxxCtor) {
obj = _objc_constructOrFree(obj, cls);
}
return obj;
}
size_t instanceSize(size_t extraBytes) {
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
if (size < 16) size = 16;
return size;
}
alloc函数最终会根据
instanceSize
返回的size
,然后使用calloc(1, size);
函数去分配内存。在
instanceSize
函数中,alignedInstanceSize
方法为成员变量所占内存大小(上面已经贴过一次).extraBytes
参数(据我所见)都为0。而
CoreFoundation
框架在instanceSize
函数中硬性规定不足16字节的内存地址会被补成16位字节。但实际上,
NSObject
对象只使用了8字节
用来存储isa
指针
Student对象的本质
@interface Student : NSObject
{
@public
int _no;
int _age;
}
@end
重写成C++之后
struct Student_IMPL {
struct NSObject_IMPL NSObject_IVARS;
int _no;
int _age;
};
struct NSObject_IMPL {
Class isa;
};
//其实就是
struct Student_IMPL {
Class isa; //8字节
int _no; //4字节
int _age; //4字节
};
所以一个
OC对象的本质
实际上是一个包含了所有父类成员变量
+自身成员变量
的结构体
Student的内存布局及大小
可以通过Debug->Debug workflow->View momory查看指定地址的结构来查证
对于Student实例对象所占内存地址的大小,我们同样可以通过malloc_size
函数来确定。
结果是16。8字节父类的isa指针、4字节_age的int、4字节_no的int。
当然如果有兴趣可以用memory write (stu地址+8偏移量) 8
的方式,通过直接修改内存的方式对成员变量_no
的值进行修改。
内存对齐原则下的OC对象内存分配
alignedInstanceSize()函数的内存对齐
alignedInstanceSize()
函数会按照所有成员变量中内存最长的一个做内存对齐。比如
@interface Animal: NSObject
{
int weight;
int height;
int age;
}
实际上只需要8+4+4+4=20
个字节长度即可,但是内存对其之后会返回8*3=24
malloc()/calloc()函数的内存对齐
在对象实际创建时,先以alignedInstanceSize()
返回的大小作为参考。
然后calloc
在实际分配内存时为了内存对齐,最终将会根据bucket
进行分配。这个bucket
是16的整数倍。
#define NANO_MAX_SIZE 256 /* Buckets sized {16, 32, 48, 64, 80, 96, 112, ...} */
所以Animal
的实例对象实际上会被分配32个字节长度的内存地址。
sizeOf 与 class_getInstanceSize
返回一个参数对象所占的内存大小
sizeOf
sizeOf
是运算符,在程序编译阶段将会直接替换成参数类型所占内存具体的常数值。
由于在编译阶段替换,所以有以下这种特性:
MJPerson *p = [[MJPerson alloc] init];
NSLog(@"%zd", sizeof(p)); // 8
p
在编译时将会被认为成指针,返回8字节的指针内存长度。而不是MJPerson
类型的内存长度。
class_getInstanceSize
class_getInstanceSize
是一个方法,在程序运行阶段将会进行计算。
他可以在运行阶段计算某个类所需内存大小
class_getInstanceSize([p class]) //24
objc_class
runtime.h
OC2.0以前的类结构体。在2.0之后只剩下头文件,并且已经标记成了
OBJC2_UNAVAILABLE
的弃用状态。
struct objc_class {
Class _Nonnull isa OBJC_ISA_AVAILABILITY;
#if !__OBJC2__
Class _Nullable super_class OBJC2_UNAVAILABLE;
const char * _Nonnull name OBJC2_UNAVAILABLE;
long version OBJC2_UNAVAILABLE;
long info OBJC2_UNAVAILABLE;
long instance_size OBJC2_UNAVAILABLE;
struct objc_ivar_list * _Nullable ivars OBJC2_UNAVAILABLE;
struct objc_method_list * _Nullable * _Nullable methodLists OBJC2_UNAVAILABLE;
struct objc_cache * _Nonnull cache OBJC2_UNAVAILABLE;
struct objc_protocol_list * _Nullable protocols OBJC2_UNAVAILABLE;
#endif
} OBJC2_UNAVAILABLE;
objc_runtime_new.h
最新的runtime源码中,优化了类的结构,内部分工更加明确。
在一级结构体中,只保留了
isa
、superclass
、cache
三个常用的成员其余信息均转移到了
class_data_bits_t
这个二级结构体上
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // 方法缓存
class_data_bits_t bits; // 具体的类信息
class_rw_t *data() {
return bits.data();
}
void setData(class_rw_t *newData) {
bits.setData(newData);
}
...
}
在
class_data_bits_t
(类信息列表)内部,还保存着class_rw_t
(可读写信息列表),这些信息是可以动态修改的
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods; //方法
property_array_t properties; //属性
protocol_array_t protocols; //协议
Class firstSubclass;
Class nextSiblingClass;
char *demangledName;
}
在
class_rw_t
(可读写信息列表)内部,还保存着class_ro_t
(不可变信息列表),保存着类加载进内存时就需要确定的信息
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize; //实例对象所占内存大小
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name; //类名
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars; //成员变量
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
method_list_t *baseMethods() const {
return baseMethodList;
}
};