阅读 265

MongoDB 事务 —— 基础入门篇

MongoDB 单文档原生支持原子性,也具备事务的特性,但是我们说起事务,通常是指在多文档中的实现,因此,MongoDB 在 4.0 版本支持了多文档事务,4.0 对应于复制集的多表、多行,后续又在 4.2 版本支持了分片集的多表、多行事务操作。

事务四大特性

  • 原子性(Atomicity):事务必须是原子工作单元,对于其数据修改,要么全执行,要么全不执行。类似于 Redis 中我通常使用 Lua 脚本来实现多条命令操作的原子性。

  • 一致性(Consistency):事务在完成时,必须使所有的数据都保持一致状态。

  • 隔离性(Isolation):由并发事务所做的修改必须与任何其他并发事务所作的修改隔离(简而言之:一个事务执行过程中不应受其它事务影响)。

  • 持久性(Durability):事务完成之后,对于系统的影响是永久性的。

Read Concern/Write Concern/Read Preference

在事务操作中会分别使用到 readConcern、writeConcern、readPreference 这几个选项,用于控制 Session 的行为,下面分别予以介绍。

事务和 Write Concern

事务使用事务级别的 writeConcern 来提交写操作,决定一个事务的写入成功与否要看 writeConcern 选项设置了几个节点,默认情况下为 1。

几个选项值:

  • w:0 设置为 0 无需关注写入成功与否。
  • w:1 ~ 任意节点数 自定义节点数设置,复制集中不得大于最大节点数。默认情况下为 1,表示写入到 Primary 节点就开始往客户端发送确认写入成功。
  • w:"majority" 大多数节点成功原则,例如一个复制集 3 个节点,2 个节点成功就认为本次写入成功。
  • w:"all" 所以节点都成功,才认为写入成功。
  • j:true 默认情况 j:false,写操作到达内存算作完成。如果设置为 j:true,写操作只有到达 journal 文件才算成功。
  • wtimeout: 写入超时实践

设置示例:

writeConcern: {
    w:"majority" // 大多数原则
    j:true,
    wtimeout: 5000,
}
复制代码

JavaScript 使用示例:

db.user.insert({name: "Jack"}, {writeConcern: {w: "majority"}})
复制代码

建议

对于重要数据可以应用 w:"majority" 设置,普通数据 w:1 设置则可以保证性能最佳,w 设置的节点数越多,等待的延迟也就越大,如果 w 等于总节点数,一旦其中某个节点出现故障就会导致整个写入失败,也是有风险的。

docs.mongodb.com/manual/refe…

事务和 Read Preference

在一个事务操作中使用事务级别的 readPreference 来决定读取时从哪个节点读取。可方便的实现读写分离、就近读取策略。

可选值以下 5 个:

  • primary 只从主节点读取,默认值。
  • primaryPreferred 优先选择主节点,不可用时选择从节点
  • secondary 只在从节点读取
  • secondaryPreferred 优先在从节点读取,从节点不可用时选择主节点。
  • nearest 选择附近节点

场景选择

  • primary/primaryPreferred:适合于数据实时性要求较高的场景,例如,订单创建完毕直接跳转到订单详情,如果选择从节点读取,可能会造成主节点数据写入之后,从节点还未复制的情况,因为复制过程是一个异步的操作。
  • secondary/secondaryPreferred:适应用于数据实时性要求不高的场景,例如,报表数据、历史订单。还可以减轻对主节点的压力。

使用示例

  • 链接字符串配置:
mongodb://mongodb0.example.com:27017,mongodb1.example.com:27017,mongodb2.example.com:27017/admin?replicaSet=myRepl&readPreference=secondary
复制代码
  • Mongo Shell:
db.collection.find({}).readPref( "secondary")
复制代码

测试时可借助 db.fsyncUnlock() 对从节点锁定,仅主节点写入数据。

docs.mongodb.com/manual/core…

事务和 Read Concern

MongoDB 3.2 引入了 readConcern 来决定读取的策略,但是与 readPreference 不同,readPreference 决定从哪个节点读取,readConcern 决定该节点的哪些数据是可读的。主要保证事务中的隔离性,避免脏读。

可选值

  • available:读取所有可用的数据。
  • local:仅读取当前分片的数据。
  • majority:读取在大多数节点上提交完成的数据。
  • snapshot:读取最近快照中的数据。

更新配置项

在启动 Mongod 实例时,指定 --enableMajorityReadConcern 选项或在配置文件中配置

enableMajorityReadConcern=true
复制代码

重新启动实例,Mongo shell 登陆实例,使用 db._adminCommand( {getCmdLineOpts: 1}) 查看配置,可以看到在复制集中会多出一个配置,说明配置成功。

{
...
"parsed" : {
    "replication" : {
        "enableMajorityReadConcern" : true, // 变化之处
        "oplogSizeMB" : 1024,
        "replSet" : "May"
    },
},
}
复制代码

使用示例

db.user.find().readConcern("majority")
复制代码

readConcern 总结

MongoDB 的 readConcern 默认情况下是脏读,例如,用户在主节点读取一条数据之后,该节点未将数据同步至其它从节点,就因为异常挂掉了,待主节点恢复之后,将未同步至其它节点的数据进行回滚,就出现了脏读。

readConcern 级别的 majority 可以保证读到的数据已经落入到大多数节点。所以说保证了事务的隔离性,所谓隔离性也是指事务内的操作,事务外是看不见的。

readConcern 参考

读写分离实践

一个典型的应用场景是用户写入订单数据(数据写入 Primary),立即调用查询接口,由于采用读写分离模式,链接字符串设置 readPreference=secondaryPreferred 订单写入主节点之后并不能保证数据立即同步到从节点,若此时直接由从节点读取数据, 偶尔会出现订单数据无法找到,用户就会感觉很奇怪,明明下了订单,却又查找不到,造成一些异常订单。

图片描述

一种导致下单之后再次查找丢失订单的的写法如下:

db.order.insert({"id": "123456789"})
db.order.find({"id": "123456789"}).readPref("secondaryPreferred")
复制代码

解决方法一:

设置 readPreference=primary,将复制集的节点读取由从节点转换为主节点。

这种方式一个缺点是数据量大了之后会增加主节点的压力,也就没有了主从分离的模式。

解决方法二:

使用 writeConcern、readConcern 组合来解决,即保证读写分离模式,也保证了数据的一致性

// 写入时保证大多数节点写入成功
db.order.insert({"id": "123456789"}, {writeConern: {w: "majority"}})

// 读取时保证这条数据已在大多数节点存在
db.order.find({"id": "123456789"}).readPref("secondaryPreferred").readConcern("majority")
复制代码

本文是对 MogoDB 事务的一个初步了解,Read Concern/Write Concern/Read Preference 这些在后续事务实践中都会应用,希望大家可以事先进行一个了解,在接下来的一篇文章中,我会介绍 MongoDB 的事务应该如何应用,同时结合 Node.js 进行实践说明,欢迎关注!

Reference

关注下面的标签,发现更多相似文章
评论