MySQL innodb引擎详解

作者：云栖社区时间 2016-09-26

《MySQL innodb引擎详解》要点：
本文介绍了MySQL innodb引擎详解，希望对您有用。如果有疑问，可以联系我们。

innodb是事物安全的MySQL存储引擎是oltp应用中核心表的首选存储引擎

MySQL第一个支持事物的存储引擎是BDB

MySQL第一个完整支持ACID事物是innodb

innodb的特点行锁设计支持MVCC 支持外键提供一致性非锁定读同时被设计用来最有效的利用以及使用内存和cpu

版本	功能
老版本innodb	支持ACID 行锁设计 MVCC
innodb 1.0.x	增加了compress和dynamic页格式
innodb 1.1.x	增加了Linux AIO 多回滚段
innodb 1.2.x	增加了全文索引支持在线索引添加

innodb 体系架构

innodb的存储引擎有多个内存块可以认为这些内存组成一个大的内存池

1 维护所有进程/线程需要访问的多个内部数据结构

2 缓存磁盘上的数据方便快速地读取同时在对磁盘文件的数据修改之前在这里缓存

3 重做日志(redo log)缓冲

MySQL innodb引擎详解

后台线程的主要作用是负责刷新池中的内存池中的数据保证缓冲池中的内存是最近的数据将已经修改的数据文件刷新到磁盘文件同时保证在数据库发生异常的情况下 innodb能恢复到正常运行状态

后台线程

innodb存储引擎是多线程的模型因此其中有多个不同的后台线程负责处理不同的任务

1 Master Thread

MT 是一个非常核心的后台线程住一套负责将缓冲池中的数据一部刷新到磁盘保证数据的一致性包括脏页的刷新合并插入缓冲(insert buffer) undo页的回收

2 io thread

在innodb存储引擎中大量使用了AIO(Async IO)来处理些IO请求这样可以极大提高数据库的性能而IO Thread的工作主要负责这些io请求的回调(call back)处理

在innodb 1.0版本之前有4个io thread 分别是 write read insert buffer和log io thread 但是在Linux平台下 io thread的数量不能进行调整但是在windows平台下可以通过参数innodb_file_io_threads来增大io thread

从innodb 1.0.x版本开始 read thread和 write thread分别增大到了4个并且不在使用innodb_file_file_io_threads参数而是分别使用 innodb_read_io_threads和innodb_write_io_threads

可以通过命令show engine innodb status来观察innodb中的IO Thread

show engine innodb status\G;

3 Purge Thread

事物被提交后其所使用的undolog可能不在需要因此需要PurgeThread来回收已经使用并分配的undo页

在innodb 1.1版本之前 purge操作仅在innodb存储引擎的master thread 中完成

而从innodb 1.1版本开始 purge操作可以独立到单独的线程中进行以此来减轻master thread 的工作从而提高cpu的使用率以及提升存储引擎的性能

用户可以再MySQL数据库的配置文件中添加如下命令来启用独立的Purge Thread

[mysql]

innodb_purge_threads=1

在innodb 1.1 版本中即使将innodb_purge_threads设为大于1 innodb存储引擎启动时也将其设为1 并在错误文件中出现如下类似的提示

在innodb 1.2版本开始 innodb支持多个purge thread 这样做的目的是为了进一步加快undo页的回收这样也能更进一步利用磁盘的随机读取性能用户可以设置4个purge thread

4 page cleaner thread

innodb 1.2.x 引入 page cleaner thread

作用:将之前版本中臧晔的刷新操作都放入到单独的线程中完成减轻原master thread的工作对于用户查询线程的阻塞

内存

1 缓冲池

innodb存储引擎给予磁盘存储的并将其中的激励按照页的方式进行管理一次可将其视为给予磁盘的数据系统(disk-base database) 由于cpu跟磁盘速度之间的鸿沟给予磁盘的数据库系统通常使用缓冲池技术来提高数据库的整体性能

缓冲池就是一块内存区域通过内存的速度来弥补磁盘的速度较慢对数据库性能的影响在数据库中进行读取页的操作首先将从磁盘读到页存放在缓冲池中这个过程称为将页FIX 在缓冲池中下一次在读相同的页时首先判断页是否在缓冲池中若在缓冲池中该页在缓冲池中被命中直接读取该页否则读取磁盘上的页

对于数据库中页的修改操作则首先修改在缓冲池中的页然后再以一定的频率刷新到磁盘上这里需要注意的是页从缓冲池刷新回磁盘的操作并不是在每次页发生更新时触发而是通过一种称为checkpoint的机制刷新回磁盘同样这也是为了提高数据库的整体性能

缓冲池的大小直接影响着数据库的整体性能

缓冲池缓存的数据页的类型有:索引页数据也 undo页插入缓冲(insert buffer) 自适应哈希索引(adaptive hash index) innodb存储锁信息(lock info) 数据字典信息(data dictionary)等缓冲池不只是缓存索引页和数据页他们只是占缓冲池很大的一部分而已

MySQL innodb引擎详解

innodb 1.0.x以后允许多个缓冲池实例每页根据哈希值平均分配到不同缓冲池里这样做的好处是减少数据库内部的资源竞争增加数据库的并发处理能力

show variables likes 'innodb_buffer_pool_instances'\G;

将这个参数改为大于1 的值就可以得到多个缓冲池实例再通过命令show engine innodb status\G;观察修改后系统的缓冲池状态

MySQL 5.6 可以通过information_schema架构下的表 innodb_buffer_pool_status来观察缓冲的状态

2 LRU List Free List Flush List

数据库中的缓冲池是通过LRU(latest recent used 最近最少使用)算法来进行管理的最频繁使用的页是在LRU列表的前端而最少使用的页在LRU列表的尾端即使用频发的页放在LRU列表的前端而最少使用的页在LRU列表的尾端当缓冲池不能存放新读取到的页时将首先释放LRU列表中尾端的页

在innodb存储引擎中缓冲池中页的大小默认为16KB 同样使用LRU算法对缓冲池进行管理稍有不同的是innodb存储引起对传统LRU算法做了一些优化在innodb的存储引擎中 LRU列表中还加入了midpoint位置即新读取的页并不会直接放到LRU连的首部而是放到midpoint位置这个算法在innodb存储引擎下称为 midpoint insertion strategy 默认该位置在LRU列表长度的5/8处

参数:innodb_old_blocks_pct控制

show variables like 'innodb_old_blocks_pct'\G;

采用midpoint的原因

某些sql操作可能会使缓冲池的页被刷新出来从而影响缓冲池的效率常见的这类操作为索引或数据的扫描操作这类操作需要访问表中的许多页甚至全部而这些页通常来说又仅在这次查询操作中需要并不是活跃的热点数据如果页被放到LRU首部那么非常可能将所需要的热点数据页从LRU列表一处而在下一次需要读取该页时 innodb存储引擎需要再次访问磁盘

innodb_old_blocks_time

用于表示页读取到mid未支护需要等待多久才会被加入到LRU列表的热端因此当需要执行上述所说的sql操作时可以通过下面方法使LRU列表中热点数据不被刷出

set global innodb_old_blocks_time=1000;

如果用户预估自己活跃的热点数据不止百分之63 那么执行SQL语句前可以修改innodb_old_blocks_pct 减少热点页被刷出来的概率

LRU列表管理已经读取的页但数据库刚启动的时候 LRU列表是空的即没有任何的页这时页都存放在Free列表中当需要从缓冲池中分页时首先从Free列表中查找是否有可用的空闲页若有则将该页从Free列表中删除放入到LRU列表中否则根据LRU算法淘汰LRU列表末尾的页将该内存空间分配给新的页当页从LRU列表的old部分加入到new部分时称此时发生的操作为page made young 而因为innodb_old_blocks_time的设置而导致页没有从old部分移动到new部分的操作称为page noe made young可以通过命令 show engine innodb status来观察LRU列表及Free列表的使用情况和运行状态这个状态显示的不是当前状态而是过去某个时间范围内 innodb存储引擎的状态 per second averages calculated from the last 24 seconds 表示过去的24小时

page made young 显示了LRU列表中页移动到前端的次数因为该服务器在运行阶段没有改变innodb_old_blocks_time的值因此not young为0 youngs/s non-youngs表示美妙这两类操作的次数

buffer pool hit rate 表示缓冲池的命中率值越接近1或等于1 说明缓冲池运行状态非常好一般不应该小于百分之九五若发生buffer pool hit rate的值小于百分之九五的情况需要检查是否由于全表扫描引起的LRU列表被污染的问题

innodb_buffer_pool_stats:观察缓冲池的运行状态 information_schema中的表

innodb_buffer_page_lru:观察lru列表中每个页的具体信息 information_schema中的表

innodb1.0.x 开始支持压缩页的功能可以讲16kb的页压缩为1kb 2kb 4kb 和8kb 但是由于压缩页的大小发生变化 lru列表也有了些许的改变对于非16kb的页通过unzip_LRU列表进行管理通过show engine innodbdb status可以观察

MySQL innodb引擎详解

这里 lru len 包含unzip_lru len 列

对于不同压缩大小的页管理方式:在unzip_LRU列表中对不同压缩也大小的页进行分别管理其次通过伙伴算法进行内存的分配加入对需要从缓冲池中申请页为4kb的大小过程如下

1 检查4kb的unzip_LRU列表检查是否有可用的空闲页;

2 若有则直接使用

3 否则检查8kb的unzip_LRU列表;

4 若能的到空闲页将页分成2 个4kb页存放到4kb的unzip_LRU列表

5 若不能够得到空闲页从LRU列表中申请一个16kb的页将页分为1个8kb的页 2个4kb的页分别存放到对应的unzip_LRU列表中

同样可以通过information_schema架构下的表innodb_buffer_page_lru来观察unzip_LRU列表中的页

LRU列表中的页被修改后称该页为脏页(dirty page) 即缓冲池中的页和磁盘上的页的数据产生了不一致这时数据库会通过checkpoint机制将脏页刷新回磁盘而flush列表中的页即为脏页列表脏页寄存在与LRU列表中也存在于flush列表中 LRU列表用来管理缓冲池页的可用性 Flush用来管理将页刷新回磁盘二者互不影响

3 重做日志缓存

innodb存储引擎首先将臭作日志信息先放入到这个缓冲区然后按一定频率将其刷新到重做日志文件

参数:innodb_log_buffer_size 默认8MB

将重做日志缓冲的内容刷新到外部磁盘的重做日志文件的情况:

1 master thread 每一秒将重做日志缓冲到重做日志文件

2 每个事物提交时会将重做日志缓冲刷新到重做日志文件

3 当重做日志缓冲池剩余空间小于二分之一时重做日志缓冲刷新到重做日志文件

4 额外的内存池

在innodb存储引擎对内存管理是通过一种称为内存堆(heap)的方式进行的

4 checkpoint技术

write ahead log 日志先写策略避免数据丢失通过重做日志来完成数据的恢复

宕机通过重做日志恢复的条件

1 缓冲池可以缓存数据库中所有的数据

随着数据库的日积月累的增大导致数据增到内存不足以缓存所有数据所以对生产环境应用中的数据库是很难保证的

2 重做日志可以无线增大

重做日志无线增大会对成本要求太高页不便于运维而且 DBA 或SA 不知道什么时候重做日志是否已经接近于磁盘可使用的空间的阀值而且让存储设备支持颗动态扩展页是需要一定的技巧和设备支持

3 宕机后的恢复时间时间越久恢复的代价就会越大

checkpoint的优点

1 缩短数据库的恢复时间

2 缓冲池不够用时将脏页刷新到磁盘

3 重做日志不可用刷新脏页

这样数据库宕机的时候就不需要所有的重做日志因为checkpoint之前的页都已经刷新到磁盘所以这时候只需要 checkpoint之后的重做日志进行恢复这样就大大缩短了恢复时间

当缓冲池不够用的时候就会根据 LRU算法会溢出最近最少使用的页若此页为脏页那么需要强制执行checkpoint 江脏页页就是页的新版本刷回磁盘

重做日志的循环使用

对于innodb存储引擎是通过LSN(log sequence number)来标记版本二LSN是8字节的数字单位是字节每个页都有lsn 重做日志页有LSN checkpoint页有LSN 可以根据 show engine innodb status来观察

checkpoint作用：将缓冲池中的脏页刷会磁盘但是每次刷多少页到磁盘从哪取脏页什么时候触发checkpoint都不同

checkpoint类型

1 sharp checkpoint

作用：数据库关闭时将所有脏页都刷新到磁盘这是默认工作方式

参数：innodb_fast_shutdown=1

2 fuzzy checkpoint

如果数据库正常运行的时候使用sharp checkpoint 那么数据库的可能性就会收到很大影响所以在innodb存储引擎内部使用 fuzzy checkpoint进行页的刷新 (只刷新一部分脏页而不是刷新所有的脏页回磁盘)

发生 fuzzy checkpoint情况

1 master threadcheckpoint

差不多以每秒或者每10秒的速度从缓冲池脏页列表刷新一定比例的页回磁盘 (异步查询线程不会阻塞)

2 flush_lru_list checkpoint

innodb 1.1x版本前需要检查LRU列表中是否有足够的(100)可用空间操作发生在用户查询线程中会阻塞查询没有 innodb存储引擎就会将lru列表尾端的页溢出如果这些页里面有脏页就需要checkpoint

innodb 1.2.x版本开始这个检查被放在了一个单独的page cleaner 线程中进行并且用户可以通过innod_lruscan depth控制列表中可用页的数量默认为1024

3 async/sync flush checkpoint

当重做日志不可用的情况下这时需要强制将一些页刷新会磁盘而此时脏页是从脏页列表中选取若将已经写入到重做日志的LSN 记为 redo_lsn 将已经刷新会磁盘最新页的lsn结尾checkpoint_lsn

checkpoint_age = redo_lsn - checkpoint_lsn

async_water_mark = 75% total_redo_log_file_size

async/sync flush checkpoint 是为了保证重做日志的循环使用的可用性

innodb 1.2x之前 async flush checkpoint会阻塞发现问题的用户查询线程 sync flush checkpoint会阻塞用户查询线程并等待脏页的刷新完成

MySQL官方版本并不能查看刷新也是从flush 列表还是LRU列表中进行checkpoint的也不知道因为重做日志而产生的async/sync flush的次数但是 innoSQL版本可以通过 show engine innodb status来观察

4 dirty page too much checkpoint

脏页太多导致innodb存储引擎强制进行checkpoint 其目的总的来说还是为了保证缓冲池中有足够多的页主要是为了保证缓冲池中有足够可用的页

参数innodb_max_dirty_pages_pct

5 master thread 工作方式

innodb 1.0.x 之前的master thread

master thread 具有最高的线程优先级别其内部由多个循环(loop)组成主循环 (loop) 后台循环(backgroup loop) 刷新循环(flush loop) 暂停循环(suspend loop) master thread就会在这些循环中切换

loop为主循环

loop循环通过thread sleep来实现在负载很大的情况下可能会有延迟

每秒一次的操作包括

1 日志缓冲刷新到磁盘即使这个事务还没有提交(总是)

2 合并插入缓冲(可能)

3 至多刷新100个innodb的缓冲池中的脏页到磁盘(可能)

4 如果当前没有用户活动则切换到 background loop(可能)

再大的事务提交的时间很短的原因:innodb存储引擎仍然每秒会将重做日志缓冲中的内容刷新到重做日志文件

合并插入缓冲也不是每秒都会发生的 innodb存储引擎会判断当前一秒内发生的io次数是否小于5次如果小于5次 innodb人为当前io压力很小可以执行合并插入缓冲的操作

buf_get_modified_ratio_pct跟百分之90的innodb_max_dirty_pages_pct相比较超过才会人为需要进行磁盘同步操作将100个脏页写入磁盘

每10秒的操作

1 刷新100个脏页到磁盘(可能)

2 合并之多5个插入缓冲(总是)

3 将日志缓冲刷新到磁盘(总是)

4 删除无用的undo页(总是)

5 刷新100或者10个脏页到磁盘(总是)

过程

1 判断10秒之内的磁盘的IO操作是否小于200

2 小于 innodb认为有足够的IO能力将100的脏页刷新到磁盘

3 innodb存储引擎会合并插入缓冲这次合并插入缓冲总会在这个剪短进行

4 innodb存储引擎会再进行一次奖入职缓冲刷新到磁盘的操作这和没秒一次发生的操作一样

5 innodb进一步执行full purge 即删除无用的undo页对表update delete这类操作时操作时原先的行被标记为删除但是因为一致性读(consistent read)的关系需要保留这些行版本的信息但是在full purge过程中 innodb存储引擎会判断当前事物系统已被删除的行是否可以删除比如有时候还有查询操作需要读取之前版本的undo信息如果可以删除 innodb会立即将其删除

6 buf_get_modified_ratio_pct >70% 则刷新100个脏页到磁盘 <70%刷新10%的脏页到磁盘

background loop 当当前没有用户活跃(数据库空闲)或者数据库关闭(shutdown)

进行的操作

1 删除无用的undo(总是)

2 合并20个插入缓冲(总是)

3 跳回到主循环(总是)

4 不断刷新100个页知道符合条件(可能跳转到flush loop中完成)

跳转到flush loop 后如果也没什么事情做了 innodb存储引擎会切换到suspend loop 将master thread挂起等待事件的发生若用户启用了(enable)innodb 却没有使用任何innodb的表那么master thread 一直挂起状态

innodb 1.2.x之前的master thread

参数 innodb_io_capacity 用来表示磁盘io的吞吐量默认是200 对于刷新到磁盘页的数量按照innodb_io_capacity的百分比控制

1 在合并插入缓冲时合并插入缓冲的数量为 innodb_io_capacity

2 在从缓冲区刷新脏页时刷新脏页的数量为innodb_io_capacity

用来解决写入密集的应用程序中产生大于20额插入缓冲的情况 master thread忙不来的问题

参数 innodb_max_dirty_pages_pct

维易PHP培训学院每天发布《MySQL innodb引擎详解》等实战技能，PHP、MYSQL、LINUX、APP、JS,CSS全面培养人才。

转载请注明本页网址：
http://www.vephp.com/jiaocheng/7082.html

标签：

PHP教程

WEB前端开发

数据库

WEB服务器

APP开发

LINUX学习

后端开发课程

前端开发课程

数据库课程

MySQL innodb引擎详解

同类教程排行

特辑教程