Seata分布式事务TA模式源码解读

3,425 阅读13分钟

前言

前几天,在家里研究了下阿里巴巴开源的分布式事务中间件Seata,并记录了一下过程。

SpringBoot+Dubbo+Seata分布式事务实战

不过光有实战不行,咱多少也得把原理搞搞清楚,不然出了问题不知咋解决岂不是很尴尬。

一、原理

首先,设想一个传统的单体应用,通过 3 个 模块,在同一个数据源上更新数据来完成一项业务。

很自然的,整个业务过程的数据一致性由本地事务来保证。

随着业务需求和架构的变化,单体应用被拆分为微服务。原来的3个模块被拆分为3个独立的服务,分别使用独立的数据。

业务过程将通过RPC的服务调用来完成。

那么这个时候,每一个服务内部的数据一致性仍由本地事务来保证。

而整个业务层面的全局数据一致性和完整性要如何保障呢?这就是微服务架构下面临的,典型的分布式事务需求。

1、原理和设计

Seata把一个分布式事务理解成一个包含了若干 分支事务全局事务全局事务 的职责是协调其下管辖的 分支事务 达成一致,要么一起成功提交,要么一起失败回滚。此外,通常 分支事务 本身就是一个满足 ACID 的 本地事务。

Seata定义了3个组件来协议分布式事务的处理过程。

  • Transaction Coordinator (TC): 事务协调器,维护全局事务的运行状态,负责协调并驱动全局事务的提交或回滚。
  • Transaction Manager (TM): 控制全局事务的边界,负责开启一个全局事务,并最终发起全局提交或全局回滚的决议。
  • Resource Manager (RM): 控制分支事务,负责分支注册、状态汇报,并接收事务协调器的指令,驱动分支(本地)事务的提交和回滚。

一个典型的分布式事务过程:

  1. TM 向 TC 申请开启一个全局事务,全局事务创建成功并生成一个全局唯一的 XID。
  2. XID 在微服务调用链路的上下文中传播。
  3. RM 向 TC 注册分支事务,将其纳入 XID 对应全局事务的管辖。
  4. TM 向 TC 发起针对 XID 的全局提交或回滚决议。
  5. TC 调度 XID 下管辖的全部分支事务完成提交或回滚请求。

2、AT模式

Seata有4种分布式事务解决方案,分别是 AT 模式、TCC 模式、Saga 模式和 XA 模式。<后两种实现还在官方计划版本中>

我们的示例项目中,所用到的就是AT模式。在 AT 模式下,用户只需关注自己的“业务 SQL”,用户的 “业务 SQL” 作为一阶段,Seata 框架会自动生成事务的二阶段提交和回滚操作。

  • 一阶段:

在一阶段,Seata 会拦截“业务 SQL”,首先解析 SQL 语义,找到“业务 SQL”要更新的业务数据,在业务数据被更新前,将其保存成“before image”,然后执行“业务 SQL”更新业务数据,在业务数据更新之后,再将其保存成“after image”,最后生成行锁。以上操作全部在一个数据库事务内完成,这样保证了一阶段操作的原子性。

  • 二阶段提交:

二阶段如果是提交的话,因为“业务 SQL”在一阶段已经提交至数据库,所以Seata 框架只需将一阶段保存的快照数据和行锁删掉,完成数据清理即可。

  • 二阶段回滚:

二阶段如果是回滚的话,Seata 就需要回滚一阶段已经执行的“业务 SQL”,还原业务数据。回滚方式便是用“before image”还原业务数据。

下面我们从源码中来看看这整个流程是怎么串起来的。

二、本地环境搭建

为了方便看源码,首先就得把调试环境搞起,方便Debug。

Seata 源码:github.com/seata/seata

目前的版本是0.7.0-SNAPSHOT,然后通过mvn install将项目打包到本地。

我们的SpringBoot+Seata测试项目就可以引入这个依赖。

<dependency>
	<groupId>io.seata</groupId>
	<artifactId>seata-all</artifactId>
	<version>0.7.0-SNAPSHOT</version>
</dependency>

为啥要这样干呢?因为Seata不同组件之间的通信都是Netty来完成的,在调试的时候,往往会因为超时而断开连接。

引入了本地版本,我们就可以把心跳检测时间加长或者索性去掉,随便搞~

1、服务端启动

找到io.seata.server.Server,直接运行main方法,就启动了Seata服务,so easy~

我们上面说Seata定义了三个组件,其中有一个叫TC的事务协调器,就是指这个服务端。

我们看看它具体干了些啥。

public class Server {
	
    public static void main(String[] args) throws IOException {
	
	//初始化参数解析器 
	ParameterParser parameterParser = new ParameterParser(args);
	
	//初始化RpcServer ,设置服务器参数
	RpcServer rpcServer = new RpcServer(WORKING_THREADS);
	rpcServer.setHost(parameterParser.getHost());
	rpcServer.setListenPort(parameterParser.getPort());
	UUIDGenerator.init(1);
	
	//从文件或者数据库中加载Session 
	SessionHolder.init(parameterParser.getStoreMode());
	
	//初始化默认的协调器
	DefaultCoordinator coordinator = new DefaultCoordinator(rpcServer);
	coordinator.init();
	rpcServer.setHandler(coordinator);
	
	//注册钩子程序 清理协调器相关资源
	ShutdownHook.getInstance().addDisposable(coordinator);

	//127.0.0.1 and 0.0.0.0 are not valid here.
	if (NetUtil.isValidIp(parameterParser.getHost(), false)) {
	    XID.setIpAddress(parameterParser.getHost());
	} else {
	    XID.setIpAddress(NetUtil.getLocalIp());
	}
	XID.setPort(rpcServer.getListenPort());
	//启动RPC服务
	rpcServer.init();
	System.exit(0);
    }
}

这里的RpcServer是通过Netty实现的一个RPC服务端,用来接收并处理TM和RM的消息。本文的重点不在服务端,所以我们先有一个大致的印象即可。

三、客户端配置

在项目中,我们配置了SeataConfiguration,其中的重点是配置全局事务扫描器和数据源代理。所以,我们先来看看为啥要配置它们,它们具体又做了什么事。

1、事务扫描器

@Bean
public GlobalTransactionScanner globalTransactionScanner() {
    return new GlobalTransactionScanner("springboot-order", "my_test_tx_group");
}

按照规矩,我们看一个类,先看它的结构。比如它是谁的儿子,从哪里来,欲往何处去?

public class GlobalTransactionScanner extends AbstractAutoProxyCreator
    implements InitializingBean, ApplicationContextAware,DisposableBean {
}

这里我们看到它是AbstractAutoProxyCreator的子类,又实现了InitializingBean接口。

这俩哥们都是Spring大家族的成员,一个用于Spring AOP生成代理;一个用于调用Bean的初始化方法。

  • InitializingBean

Bean的初始化方法有三种方式,按照先后顺序是,@PostConstruct、afterPropertiesSet、init-method

在这里,它的初始化方法中,主要就干了三件事。

private void initClient() {
    if (LOGGER.isInfoEnabled()) {
        LOGGER.info("Initializing Global Transaction Clients ... ");
    }
    //init TM 初始化事务管理器
    TMClient.init(applicationId, txServiceGroup);
    //init RM 初始化资源管理器
    RMClient.init(applicationId, txServiceGroup);
    //注册钩子程序,用于TM、RM的资源清理
    registerSpringShutdownHook();
}

到目前为止,Seata定义的三个组件都已经浮出水面了。

TMClient.init主要是初始化事务管理器的客户端,建立与RPC服务端的连接,同时向事务协调器注册。

RMClient.init也是一样过程,初始化资源管理器,建立与RPC服务端的连接,同时向事务协调器注册。

同时,它们都是通过定时任务来完成连接的,所以断线之后可以自动重连。

timerExecutor.scheduleAtFixedRate(new Runnable() {
	@Override
	public void run() {
	    clientChannelManager.reconnect(getTransactionServiceGroup());
	}
}, 5, 5, TimeUnit.SECONDS);

最后,注册钩子程序,用于清理这两个组件中的资源。

  • AbstractAutoProxyCreator

它实际上是一个Bean的后置处理器,在Bean初始化之后,调用postProcessAfterInitialization方法。

public Object postProcessAfterInitialization(@Nullable Object bean, String beanName) {
    if (bean != null) {
    	Object cacheKey = this.getCacheKey(bean.getClass(), beanName);
    	if (this.earlyProxyReferences.remove(cacheKey) != bean) {
    	    return this.wrapIfNecessary(bean, beanName, cacheKey);
    	}
    }
    return bean;
}

然后在GlobalTransactionScanner.wrapIfNecessary()里它干了些什么呢?

就是检查Bean的方法上是否包含GlobalTransactionalGlobalLock注解,然后生成代理类。

protected Object wrapIfNecessary(Object bean, String beanName, Object cacheKey){
    if (disableGlobalTransaction) {
    	return bean;
    }
    //已经生成了代理,直接返回
    if (PROXYED_SET.contains(beanName)) {
	    return bean;
    }
    interceptor = null;
	
    //检查是不是TCC的代理
    if (TCCBeanParserUtils.isTccAutoProxy(bean, beanName, applicationContext)) {
    	//TCC interceptor, proxy bean of sofa:reference/dubbo:reference, and LocalTCC
    	interceptor = new TccActionInterceptor(TCCBeanParserUtils.getRemotingDesc(beanName));
    } else {
    	Class<?> serviceInterface = SpringProxyUtils.findTargetClass(bean);
    	Class<?>[] interfacesIfJdk = SpringProxyUtils.findInterfaces(bean);
    	//判断类方法上是否包含GlobalTransactional注解和GlobalLock注解
    	if (!existsAnnotation(new Class[] {serviceInterface})
    		&& !existsAnnotation(interfacesIfJdk)) {
    		return bean;
    	}
    	//创建拦截器
    	if (interceptor == null) {
    	    interceptor = new GlobalTransactionalInterceptor(failureHandlerHook);
    	}
    }
    //如果不是AOP代理,则创建代理;如果是代理,则将拦截器加入到Advisor
    if (!AopUtils.isAopProxy(bean)) {
    	bean = super.wrapIfNecessary(bean, beanName, cacheKey);
    } else {
    	AdvisedSupport advised = SpringProxyUtils.getAdvisedSupport(bean);
    	Advisor[] advisor = buildAdvisors(beanName, getAdvicesAndAdvisorsForBean(null, null, null));
    	for (Advisor avr : advisor) {
    		advised.addAdvisor(0, avr);
    	}
    }
    PROXYED_SET.add(beanName);
    return bean;
}

至此,我们已经确定了一件事。我们ServiceImpl实现类上带有GlobalTransactional注解的方法,会生成一个代理类。

在调用方法时,实际会调用的就是代理类的拦截器方法invoke()

public class GlobalTransactionalInterceptor implements MethodInterceptor {
	
    @Override
    public Object invoke(final MethodInvocation methodInvocation) throws Throwable {
    	
    	//获取目标类
    	Class<?> targetClass = AopUtils.getTargetClass(methodInvocation.getThis());
    	//获取调用的方法
    	Method specificMethod = ClassUtils.getMostSpecificMethod(methodInvocation.getMethod(), targetClass);
    	final Method method = BridgeMethodResolver.findBridgedMethod(specificMethod);
    	//获取方法上的注解
    	final GlobalTransactional globalTransactionalAnnotation = getAnnotation(method, GlobalTransactional.class);
    	final GlobalLock globalLockAnnotation = getAnnotation(method, GlobalLock.class);
    	//处理全局事务
    	if (globalTransactionalAnnotation != null) {
    	    return handleGlobalTransaction(methodInvocation, globalTransactionalAnnotation);
    	} else if (globalLockAnnotation != null) {
    	    return handleGlobalLock(methodInvocation);
    	} else {
    	    return methodInvocation.proceed();
    	}
    }
}

可以看到,这里是开始处理全局事务的地方。这里我们先不深究,接着往下看。

2、数据源代理

除了上面创建方法的代理,还要创建数据源的代理;然后把这个代理对象设置到SqlSessionFactory

@Bean
public DataSourceProxy dataSourceProxy(DataSource dataSource) {
    return new DataSourceProxy(dataSource);
}

@Bean
public SqlSessionFactory sqlSessionFactoryBean(DataSourceProxy dataSourceProxy) throws Exception {
    SqlSessionFactoryBean sqlSessionFactoryBean = new SqlSessionFactoryBean();
    sqlSessionFactoryBean.setDataSource(dataSourceProxy);
    sqlSessionFactoryBean.setTransactionFactory(new JdbcTransactionFactory());
    return sqlSessionFactoryBean.getObject();
}

这里的重点是创建了DataSourceProxy,并把它设置到Mybatis中的SqlSessionFactory

我们知道,在Mybatis执行方法的时候,最终要创建PreparedStatement对象,然后执行ps.execute()返回SQL结果。

这里有两点我们需要注意:

  • PreparedStatement的创建

PreparedStatement对象是从Connection对象创建而来的,也许我们都写过:

PreparedStatement pstmt = conn.prepareStatement(insert ........)
  • Connection的创建

Connection又是从哪里来的呢?这个我们不必迟疑,当然从数据源中才能拿到一个连接。

不过我们已经把数据源DataSource对象已经被替换成了Seata中的DataSourceProxy对象。

所以,Connection和PreparedStatement在创建的时候,都被搞成了Seata中的代理对象。

不信你看嘛:

public class DataSourceProxy extends AbstractDataSourceProxy implements Resource {
    public ConnectionProxy getConnection() throws SQLException {
    	Connection targetConnection = targetDataSource.getConnection();
    	return new ConnectionProxy(this, targetConnection);
    }
}

然后调用AbstractDataSourceProxy来创建PreparedStatement

public abstract class AbstractConnectionProxy implements Connection {
	
    @Override
    public PreparedStatement prepareStatement(String sql) throws SQLException {
        PreparedStatement targetPreparedStatement = getTargetConnection().prepareStatement(sql);
        return new PreparedStatementProxy(this, targetPreparedStatement, sql);
    }
}

看到这里,我们应该明白一件事。

在执行ps.execute()的时候,则会调用到PreparedStatementProxy.execute()

理清了配置文件后面的逻辑,也许就掌握了它的脉络,再看代码的时候,可以知道从哪里下手。

四、方法的执行

上面已经说到,ServiceImpl已经是一个代理类,所以我们直接看GlobalTransactionalInterceptor.invoke()

它会调用到TransactionalTemplate.execute()TransactionalTemplate是业务逻辑和全局事务的模板。

public class TransactionalTemplate {

    public Object execute(TransactionalExecutor business) throws Throwable {
	
    	// 1. 创建一个全局事务
    	GlobalTransaction tx = GlobalTransactionContext.getCurrentOrCreate();
    	// 1.1 获取事务的属性  比如超时时间、事务名称
    	TransactionInfo txInfo = business.getTransactionInfo();
    	if (txInfo == null) {
    	    throw new ShouldNeverHappenException("transactionInfo does not exist");
    	}
    	try {
    	    // 2. 开始事务
    	    beginTransaction(txInfo, tx);
    	    Object rs = null;
    	    try {
    	    	// 执行业务逻辑
    	    	rs = business.execute();
    	    } catch (Throwable ex) {
    	    	// 3.回滚
    	    	completeTransactionAfterThrowing(txInfo,tx,ex);
    	    	throw ex;
    	    }
    	    // 4. 提交
    	    commitTransaction(tx);
    	    return rs;
    	} finally {
    	    //5. 清理资源
    	    triggerAfterCompletion();
    	    cleanUp();
    	}
    }
}

这里的代码很清晰,事务的流程也一目了然。

  1. 创建全局事务,并设置事务属性
  2. 开启一个事务
  3. 执行业务逻辑
  4. 如果发生异常,则回滚事务;否则提交事务
  5. 清理资源

下面我们看看具体它是怎么做的。

1、开启事务

从客户端的角度来看,开启事务就是告诉服务器说:我要开启一个全局事务了,请事务协调器TC先生分配一个全局事务ID给我。

TC先生会根据应用名称、事务分组、事务名称等创建全局Session,并生成一个全局事务XID。

然后客户端记录当前的事务状态为Begin ,并将XID绑定到当前线程。

2、执行业务逻辑

开启事务之后,开始执行我们自己的业务逻辑。这就涉及到了数据库操作,上面我们说到Seata已经将PreparedStatement对象做了代理。所以在执行的时候将会调用到PreparedStatementProxy.execute()

public class PreparedStatementProxy{
	
    public boolean execute() throws SQLException {
        return ExecuteTemplate.execute(this, new StatementCallback<Boolean, PreparedStatement>() {
            @Override
            public Boolean execute(PreparedStatement statement, Object... args) throws SQLException {
                return statement.execute();
            }
        });
    }
}

在这里它会先根据SQL的类型生成不同的执行器。比如是一个INSERT INTO语句,那么就是InsertExecutor执行器。

然后判断是不是自动提交的,执行相应方法。那么接着看executeAutoCommitFalse()

public abstract class AbstractDMLBaseExecutor{
	
    protected T executeAutoCommitFalse(Object[] args) throws Throwable {
    	TableRecords beforeImage = beforeImage();
    	T result = statementCallback.execute(statementProxy.getTargetStatement(), args);
    	TableRecords afterImage = afterImage(beforeImage);
    	prepareUndoLog(beforeImage, afterImage);
    	return result;
    }
}

这里就是AT模式一阶段所做的事,拦截业务SQL,在数据保存前将其保存为beforeImage;然后执行业务SQL,在数据更新后再将其保存为afterImage。这些操作全部在一个本地事务中完成,保证了一阶段操作的原子性。

我们以INSERT INTO为例,看看它是怎么做的。

  • beforeImage

由于是新增操作,所以在执行之前,这条记录还没有,beforeImage只是一个空表记录。

  • 业务SQL

执行原有的SQL语句,比如INSERT INTO ORDER(ID,NAME)VALUE(?,?)

  • afterImage

它要做的事就是,把刚刚添加的那条记录从数据库中再查出来。

protected TableRecords afterImage(TableRecords beforeImage) throws SQLException {
	
    //查找主键ID的值
    List<Object> pkValues = containsPK() ? getPkValuesByColumn() : getPkValuesByAuto();
    //根据主键ID查找记录
    TableRecords afterImage = getTableRecords(pkValues);
    return afterImage;
}

然后将beforeImageafterImage构建成UndoLog对象,保存到数据库。重要的是,这些操作都是在同一个本地事务中进行的。我们看它的sqlList也能看出来。

最后,我们看一下UndoLog在数据库中的记录是长这样的:

{
	"@class": "io.seata.rm.datasource.undo.BranchUndoLog",
	"xid": "192.168.216.1:8091:2016493467",
	"branchId": 2016493468,
	"sqlUndoLogs": ["java.util.ArrayList", [{
		"@class": "io.seata.rm.datasource.undo.SQLUndoLog",
		"sqlType": "INSERT",
		"tableName": "t_order",
		"beforeImage": {
			"@class": "io.seata.rm.datasource.sql.struct.TableRecords$EmptyTableRecords",
			"tableName": "t_order",
			"rows": ["java.util.ArrayList", []]
		},
		"afterImage": {
			"@class": "io.seata.rm.datasource.sql.struct.TableRecords",
			"tableName": "t_order",
			"rows": ["java.util.ArrayList", [{
				"@class": "io.seata.rm.datasource.sql.struct.Row",
				"fields": ["java.util.ArrayList", [{
					"@class": "io.seata.rm.datasource.sql.struct.Field",
					"name": "id",
					"keyType": "PrimaryKey",
					"type": 4,
					"value": 116
				}, {
					"@class": "io.seata.rm.datasource.sql.struct.Field",
					"name": "order_no",
					"keyType": "NULL",
					"type": 12,
					"value": "c233d8fb-5e71-4fc1-bc95-6f3d86312db6"
				}, {
					"@class": "io.seata.rm.datasource.sql.struct.Field",
					"name": "user_id",
					"keyType": "NULL",
					"type": 12,
					"value": "200548"
				}, {
					"@class": "io.seata.rm.datasource.sql.struct.Field",
					"name": "commodity_code",
					"keyType": "NULL",
					"type": 12,
					"value": "HYD5620"
				}, {
					"@class": "io.seata.rm.datasource.sql.struct.Field",
					"name": "count",
					"keyType": "NULL",
					"type": 4,
					"value": 10
				}, {
					"@class": "io.seata.rm.datasource.sql.struct.Field",
					"name": "amount",
					"keyType": "NULL",
					"type": 8,
					"value": 5000.0
				}]]
			}]]
		}
	}]]
}

3、提交

如果执行业务没有异常,就进入二阶段提交。客户端向服务器发送Commit事件,同时将XID解绑。

服务器端回复确认提交后,客户端将本地UndoLog数据清除。

这里重要在AsyncWorker.init()方法,它会启动一个定时任务来执行doBranchCommits,来清除Log数据。

4、回滚

如果发生异常,则进行二阶段回滚。

先通过xid和branchId 找到UnDoLog这条记录,然后在解析里面的数据生成反向SQL,将刚才的执行结果给撤销。

这块代码较长,大家自行参考UndoLogManager.undo()AbstractUndoExecutor.executeOn()方法。

5、如何关联Dubbo

只有一个事务管理器TM才会开启全局事务,那么其他服务参与者是如何自动纳入到全局事务中去的呢?

首先,Seata给Dubbo搞了个Filter过滤器叫做TransactionPropagationFilter

它会在Dubbo RPC上下文中设置XID,这样在其他服务中也可以获取这个XID。

然后,我们知道,Seata已经代理了PreparedStatement。在执行数据操作的时候,就有个判断。

if (!RootContext.inGlobalTransaction() && !RootContext.requireGlobalLock()) {
    //如果不包含XID,就执行原始方法
    return statementCallback.execute(statementProxy.getTargetStatement(), args);
}

这里的意思就是,如果当前线程不包含XID,就执行原始方法;如果包含呢,就继续往下执行事务方法。

五、总结

本文大概阐述了Seata TA模式下,客户端的工作原理。还有一部分Seata服务端的逻辑,本文并没有深入涉及。

原因在于笔者还没有完全的吃透这部分内容,没办法通俗的写出来,等以后再补~

如若文中有不准确的地方,也希望朋友们不吝赐教,谢谢。