ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
[TOC] ## 什么是MVCC 全称Multi-Version Concurrency Control,即`多版本并发控制`,主要是为了提高数据库的`并发性能`。以下文章都是围绕InnoDB引擎来讲,因为myIsam不支持事务。 同一行数据平时发生读写请求时,会`上锁阻塞`住。但mvcc用更好的方式去处理读—写请求,做到在发生读—写请求冲突时`不用加锁`。 这个读是指的`快照读`,而不是`当前读`,当前读是一种加锁操作,是`悲观锁`。 那它到底是怎么做到读—写`不用加锁`的,`快照读`和`当前读`又是什么鬼,跟着你们的`贴心老哥`,继续往下看。 ![](https://p6-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d05911f83aa34acea5ea2ff47cc42232~tplv-k3u1fbpfcp-zoom-1.image) ## 当前读、快照读都是什么鬼 什么是MySQL InnoDB下的当前读和快照读? ### 当前读 它读取的数据库记录,都是`当前最新`的`版本`,会对当前读取的数据进行`加锁`,防止其他事务修改数据。是`悲观锁`的一种操作。 如下操作都是当前读: * select lock in share mode (共享锁) * select for update (排他锁) * update (排他锁) * insert (排他锁) * delete (排他锁) * 串行化事务隔离级别 ### 快照读 快照读的实现是基于`多版本`并发控制,即MVCC,既然是多版本,那么快照读读到的数据不一定是当前最新的数据,有可能是之前`历史版本`的数据。 如下操作是快照读: * 不加锁的select操作(注:事务级别不是串行化) ### 快照读与mvcc的关系 `MVCCC`是“维持一个数据的多个版本,使读写操作没有冲突”的一个`抽象概念`。 这个概念需要具体功能去实现,这个具体实现就是`快照读`。(具体实现下面讲) 听完`贴心老哥`的讲解,是不是瞬间`茅厕顿开`。 ![](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/5c5fa9c5a396422294a508b7a009e0d5~tplv-k3u1fbpfcp-zoom-1.image) ## 数据库并发场景 * `读-读`:不存在任何问题,也不需要并发控制 * `读-写`:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复读 * `写-写`:有线程安全问题,可能会存在更新丢失问题,比如第一类更新丢失,第二类更新丢失 ## MVCC解决并发哪些问题? mvcc用来解决读—写冲突的无锁并发控制,就是为事务分配`单向增长`的`时间戳`。为每个数据修改保存一个`版本`,版本与事务时间戳`相关联`。 读操作`只读取`该事务`开始前`的`数据库快照`。 **解决问题如下:** * `并发读-写时`:可以做到读操作不阻塞写操作,同时写操作也不会阻塞读操作。 * 解决`脏读`、`幻读`、`不可重复读`等事务隔离问题,但不能解决上面的`写-写 更新丢失`问题。 **因此有了下面提高并发性能的`组合拳`:** * `MVCC + 悲观锁`:MVCC解决读写冲突,悲观锁解决写写冲突 * `MVCC + 乐观锁`:MVCC解决读写冲突,乐观锁解决写写冲突 ## MVCC的实现原理 它的实现原理主要是`版本链`,`undo日志` ,`Read View` 来实现的 ### 版本链 我们数据库中的每行数据,除了我们肉眼看见的数据,还有几个`隐藏字段`,得开`天眼`才能看到。分别是`db_trx_id`、`db_roll_pointer`、`db_row_id`。 * db\_trx\_id 6byte,最近修改(修改/插入)`事务ID`:记录`创建`这条记录/`最后一次修改`该记录的`事务ID`。 * db\_roll\_pointer(版本链关键) 7byte,`回滚指针`,指向`这条记录`的`上一个版本`(存储于rollback segment里) * db\_row\_id 6byte,隐含的`自增ID`(隐藏主键),如果数据表`没有主键`,InnoDB会自动以db\_row\_id产生一个`聚簇索引`。 * 实际还有一个`删除flag`隐藏字段, 记录被`更新`或`删除`并不代表真的删除,而是`删除flag`变了 ![](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/4810faee12844b31ad9f44d8012fe188~tplv-k3u1fbpfcp-zoom-1.image) 如上图,`db_row_id`是数据库默认为该行记录生成的`唯一隐式主键`,`db_trx_id`是当前操作该记录的`事务ID`,而`db_roll_pointer`是一个`回滚指针`,用于配合`undo日志`,指向上一个`旧版本`。 每次对数据库记录进行改动,都会记录一条`undo日志`,每条undo日志也都有一个`roll_pointer`属性(INSERT操作对应的undo日志没有该属性,因为该记录并没有更早的版本),可以将这些`undo日志都连起来`,`串成一个链表`,所以现在的情况就像下图一样: ![](https://p9-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d2fa1c7ffdf241a09a790a34b4b8c817~tplv-k3u1fbpfcp-zoom-1.image) 对该记录每次更新后,都会将旧值放到一条undo日志中,就算是该记录的一个旧版本,随着更新次数的增多,所有的版本都会被`roll_pointer`属性连接成一个`链表`,我们把这个链表称之为`版本链`,版本链的头节点就是当前记录最新的值。另外,每个版本中还包含生成该版本时对应的事务id,这个信息很重要,在根据ReadView判断版本可见性的时候会用到。 ### undo日志 Undo log 主要用于`记录`数据被`修改之前`的日志,在表信息修改之前先会把数据拷贝到`undo log`里。 当`事务`进行`回滚时`可以通过undo log 里的日志进行`数据还原`。 **Undo log 的用途** * 保证`事务`进行`rollback`时的`原子性和一致性`,当事务进行`回滚`的时候可以用undo log的数据进行`恢复`。 * 用于MVCC`快照读`的数据,在MVCC多版本控制中,通过读取`undo log`的`历史版本数据`可以实现`不同事务版本号`都拥有自己`独立的快照数据版本`。 **undo log主要分为两种:** * insert undo log 代表事务在insert新记录时产生的undo log , 只在事务回滚时需要,并且在事务提交后可以被立即丢弃 * update undo log(主要) 事务在进行update或delete时产生的undo log ; 不仅在事务回滚时需要,在快照读时也需要; 所以不能随便删除,只有在快速读或事务回滚不涉及该日志时,对应的日志才会被purge线程统一清除 ### Read View(读视图) 事务进行`快照读`操作的时候生产的`读视图`(Read View),在该事务执行的快照读的那一刻,会生成数据库系统当前的一个`快照`。 记录并维护系统当前`活跃事务的ID`(没有commit,当每个事务开启时,都会被分配一个ID, 这个ID是递增的,所以越新的事务,ID值越大),是系统中当前不应该被`本事务`看到的`其他事务id列表`。 Read View主要是用来做`可见性`判断的, 即当我们`某个事务`执行`快照读`的时候,对该记录创建一个Read View读视图,把它比作条件用来判断`当前事务`能够看到`哪个版本`的数据,既可能是当前`最新`的数据,也有可能是该行记录的undo log里面的`某个版本`的数据。 **Read View几个属性** * `trx_ids`: 当前系统活跃(`未提交`)事务版本号集合。 * `low_limit_id`: 创建当前read view 时“当前系统`最大事务版本号`+1”。 * `up_limit_id`: 创建当前read view 时“系统正处于活跃事务`最小版本号`” * `creator_trx_id`: 创建当前read view的事务版本号; ### Read View可见性判断条件 ![](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/5a55a3e31e644bc0ae3d8e73a7176e0d~tplv-k3u1fbpfcp-zoom-1.image) * `db_trx_id` < `up_limit_id` || `db_trx_id` == `creator_trx_id`(显示) 如果数据事务ID小于read view中的`最小活跃事务ID`,则可以肯定该数据是在`当前事务启之前`就已经`存在`了的,所以可以`显示`。 或者数据的`事务ID`等于`creator_trx_id` ,那么说明这个数据就是当前事务`自己生成的`,自己生成的数据自己当然能看见,所以这种情况下此数据也是可以`显示`的。 * `db_trx_id` >= `low_limit_id`(不显示) 如果数据事务ID大于read view 中的当前系统的`最大事务ID`,则说明该数据是在当前read view 创建`之后才产生`的,所以数据`不显示`。如果小于则进入下一个判断 * `db_trx_id`是否在`活跃事务`(trx\_ids)中 * `不存在`:则说明read view产生的时候事务`已经commit`了,这种情况数据则可以`显示`。 * `已存在`:则代表我Read View生成时刻,你这个事务还在活跃,还没有Commit,你修改的数据,我当前事务也是看不见的。 ![](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/14afe47c1add435c907682ca07babf74~tplv-k3u1fbpfcp-zoom-1.image) ## MVCC和事务隔离级别 上面所讲的`Read View`用于支持`RC`(Read Committed,读提交)和`RR`(Repeatable Read,可重复读)`隔离级别`的`实现`。 ### RR、RC生成时机 * `RC`隔离级别下,是每个`快照读`都会`生成并获取最新`的`Read View`; * 而在`RR`隔离级别下,则是`同一个事务中`的`第一个快照读`才会创建`Read View`, `之后的`快照读获取的都是`同一个Read View`,之后的查询就`不会重复生成`了,所以一个事务的查询结果每次`都是一样的`。 ### 解决幻读问题 * `快照读`:通过MVCC来进行控制的,不用加锁。按照MVCC中规定的“语法”进行增删改查等操作,以避免幻读。 * `当前读`:通过next-key锁(行锁+gap锁)来解决问题的。 ### RC、RR级别下的InnoDB快照读区别 * 在RR级别下的某个事务的对某条记录的第一次快照读会创建一个快照及Read View, 将当前系统活跃的其他事务记录起来,此后在调用快照读的时候,还是使用的是同一个Read View,所以只要当前事务在其他事务提交更新之前使用过快照读,那么之后的快照读使用的都是同一个Read View,所以对之后的修改不可见; * 即RR级别下,快照读生成Read View时,Read View会记录此时所有其他活动事务的快照,这些事务的修改对于当前事务都是不可见的。而早于Read View创建的事务所做的修改均是可见 * 而在RC级别下的,事务中,每次快照读都会新生成一个快照和Read View, 这就是我们在RC级别下的事务中可以看到别的事务提交的更新的原因 作者:IT老哥 链接:https://juejin.cn/post/6871046354018238472 来源:掘金 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。