在早期的 MySQL 版本中,DDL 操作(如创建索引等)通常都需要对数据表加锁,操作过程中 DML 操作都会被阻塞,影响正常业务。MySQL 5.6 和 MariaDB 10.0 开始支持 Online DDL,可以在执行 DDL 操作的同时,不影响 DML 的正常执行,线上直接执行 DDL 操作对用户基本无感知(部分操作对性能有影响)。
不同版本的数据库对各种 DDL 语句的支持存在一定的差异,本文将会针对 MySQL 和 MariaDB 对 Online DDL 的支持情况做一个汇总,在需要执行 DDL 操作时,可以参考本文的 Online DDL 支持情况 部分。
本文将会持续修正和更新,最新内容请参考我的 GITHUB 上的 程序猿成长计划 项目,欢迎 Star,更多精彩内容请 follow me。
在 ALTER TABLE
语句中,支持通过 ALGORITHM
和 LOCK
语句来实现 Online DDL:
ALGORITHM
- 控制 DDL 操作如何执行,使用哪个算法LOCK
- 控制在执行 DDL 时允许对表加锁的级别ALTER TABLE tab ADD COLUMN c varchar(50), ALGORITHM=INPLACE, LOCK=NONE;
NOCOPY
算法支持:MariaDB 10.3.2+,MySQL 不支持该算法。
INSTANT
算法支持:MariaDB 10.3.2+,MySQL 8.0.12+。
算法使用规则:
COPY
,则 InnoDB 使用 COPY
算法。COPY
之外的其它算法,则 InnoDB 会按照算法效率,选择最高效的算法,最差的情况下采用用户指定的算法。比如用户指定了 ALOGRITHM = NOCOPY
,则 InnoDB 会从 (NOCOPY, INSTANT) 中选择支持的最高效的算法。MySQL 服务主要为 Server 层 和 存储引擎层 两部分组成,Server 层包含了 MySQL 大部分核心功能,所有的内置函数,跨存储引擎的功能如存储过程、触发器、视图等。存储引擎层负责数据的存储和读取,采用了插件式的架构模式。
COPY 算法 作用在 Server 层,其执行过程都是在 Server 层,因此所有存储引擎都支持使用该算法,执行过程如下图
INPLACE 算法 作用于存储引擎层,是 InnoDB 存储引擎特有的 DDL 算法,执行过程如下图所示
默认情况下,MySQL/MariaDB 在执行 DDL 期间会使用尽可能少的锁,如果必要,可以通过 LOCK 子句控制在执行 DDL 时允许对表加锁的级别。如果指定的操作所要求的限制级别不满足(EXCLUSIVE > SHARED > NONE),则语句执行失败并报错。
为了避免执行 DDL 时,由于锁表导致生产服务不可用,在执行表结构变更语句时,可以添加
LOCK=NONE
子句,如果语句需要获取共享锁或者排它锁,则会直接报错,这样就可以避免意外锁表,造成线上服务不可用了。
Online DDL 操作主要分为三个阶段:
阶段 1:初始化
在初始化阶段,服务器会根据存储引擎的能力,操作的语句和用户指定的 ALGORITHM
和 LOCK
选项来决定允许多大程度的并发。在这个阶段会创建一个 可升级的元数据共享锁( SU )来保护表定义。
阶段 2:执行
这个阶段会 准备 并 执行 DDL 语句,根据 阶段 1 评估的结果来决定是否将元数据锁升级为 排它锁 ( X ),如果需要升级为排它锁,则只在 DDL 的 准备阶段 短暂的添加排它锁。
阶段 3:提交表定义
在表定义的提交阶段,元数据锁会升级为排它锁来更新表的定义。独占排它锁的持续时间非常短。
元数据锁( MDL,Metadata Lock )主要用于 DDL 和 DML 操作之间的并发访问控制,保护表结构(表定义)的一致,保证读写的正确性。MDL 不需要显式的使用,在访问表时会自动加上。
由于上面三个阶段中对元数据锁的独占, Online DDL 过程必须等待已经持有元数据锁的并发事务提交或者回滚才能继续执行。
注意:当 Online DDL 操作正在等待元数据锁时,该元数据锁会处于挂起状态,后续的所有事务都会被阻塞。在 MariaDB 10.3 之后,可以通过添加
NO WAIT
或者WAIT n
来控制等待所得超时时间,超时立即失败。ALTER TABLE tbl_name [WAIT n|NOWAIT] ... CREATE ... INDEX ON tbl_name (index_col_name, ...) [WAIT n|NOWAIT] ... DROP INDEX ... [WAIT n|NOWAIT] DROP TABLE tbl_name [WAIT n|NOWAIT] ... LOCK TABLE ... [WAIT n|NOWAIT] OPTIMIZE TABLE tbl_name [WAIT n|NOWAIT] RENAME TABLE tbl_name [WAIT n|NOWAIT] ... SELECT ... FOR UPDATE [WAIT n|NOWAIT] SELECT ... LOCK IN SHARE MODE [WAIT n|NOWAIT] TRUNCATE TABLE tbl_name [WAIT n|NOWAIT]
Online DDL 操作的性能取决于是否发生了表的重建。在对大表执行 DDL 操作之前,为了避免影响正常业务操作,最好是先评估一下 DDL 语句的性能再选择如何操作。
rows affected
是否是 0。如果该值非 0,则意味着需要拷贝表数据,此时对 DDL 的上线需要慎重考虑,周密计划比如
修改某一列的默认值(快速,不会影响到表数据)
Query OK, 0 rows affected (0.07 sec)
添加索引(需要花费一些时间,但是 0 rows affected
说明没有发生表拷贝)
Query OK, 0 rows affected (21.42 sec)
修改列的数据类型(需要花费很长时间,并且重建表)
Query OK, 1671168 rows affected (1 min 35.54 sec)
由于在执行 Online DDL 过程中需要记录并发执行的 DML 操作发生的变更,然后在执行完 DDL 操作之后再应用这些变更,因此使用 Online DDL 操作花费的时间比不使用 Online 模式执行要更长一些。
INSTANT
算法支持:MariaDB 10.3.2+,MySQL 8.0.12+。NOCOPY
只支持 MariaDB 10.3.2 以上版本,不支持 MySQL,这里就暂且忽略了。
重点关注是否 重建表 和 支持并发 DML:不需要重建表,支持并发 DML 最佳。
说明:
说明:
NOT NULL
的 UNIQUE
索引作为主键,或者使用系统生成的 KEYINPLACE
模式比 COPY
模式要高效一些:不会产生 undo log 和 redo log,二级索引是有序的,所以可以按顺序加载,不需要使用变更缓冲区说明:
③ 并发 DML:当插入一个自增列时,不支持并发的 DML 操作,添加自增列时,大量的数据会被重新组织,代价高昂
③ 重建表:添加列时,MySQL 5.7 及之前版本需要重建表,MySQL 8.0 当 ALGORITHM=INPLACE
时,需要重建表,ALGORITHM=INSTANT
时不需要重建
③ INSTANT 算法:添加列时,使用 INSTANT
算法有下面这些限制
INSTANT
算法的操作合并为一条 ALTER TABLE
语句ROW_FORMAT=COMPRESSED
的表中FULLTEXT
的表中ALGORITHM=COPY
④ 删除列时,大量的数据需要被重新组织,代价高昂,在 MariaDB 10.4 之后,删除列支持 INSTANT 算法
⑤ 重命名列时,确保只改变列名,不改变数据类型,这样才能支持并发的 DML 操作
⑥ 扩展 VARCHAR 长度时,INPLACE 是有条件的,必须保证用于标识字符串长度的长度字节不变(这里说的都是字节,不是 VARCHAR 的字符长度,字节占用与采用的字符集有关,utf8
字符集下,一个字符占 3 个字节, utf8mb4
则 4 个字节)
因此,INPLACE 只支持 0-255 个字节之间或者 256 个字节到更大的长度之间的变更。VARCHAR 列长度减小是不支持 INPLACE 的。
⑦ 自增列值变更是修改的内存中的值,不是数据文件
⑧ ⑨ 设置列为 [NOT] NULL
时,大量的数据被重新组织,代价高昂
⑩ 修改 ENUM
和 SET
类型的列定义时,是否需要表拷贝取决于已有元素的个数和插入成员的位置
⑫ 在 MariaDB 10.4 之后,列排序支持 INSTANT 算法
⑬ 在 MariaDB 10.4.3 之后,InnoDB 支持使用 INSTANT 算法增加列的长度,但是也有一些限制,具体参考 Changing the Data Type of a Column
说明:
foreign_key_checks
选项被禁用的时候才支持 INPLACE
算法说明:
FULLTEXT
的字段,则不支持 INPLACETEMPORARY TABLE
上创建索引时会发生表拷贝ON...CASCADE
或者 ON...SET NULL
约束,则 ALERT TABLE
不支持字句 LOCK=NONE
本文将会持续修正和更新,最新内容请参考我的 GITHUB 上的 程序猿成长计划 项目,欢迎 Star,更多精彩内容请 follow me。