时间:2023-10-29来源:系统城装机大师作者:佚名
最近经常碰到mysql又死锁了导致业务报错。今天我们就来聊聊死锁以及怎么解决
mysql锁级别:页级、表级、行级
- 表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。
- 行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高。
- 页面锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发度一般
死锁是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去.此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。表级锁不会产生死锁.所以解决死锁主要还是针对于最常用的InnoDB。
死锁的关键在于:两个(或以上)的Session加锁的顺序不一致。
那么对应的解决死锁问题的关键就是:让不同的session加锁有次序
需求:将投资的钱拆成几份随机分配给借款人。
起初业务程序思路是这样的:
投资人投资后,将金额随机分为几份,然后随机从借款人表里面选几个,然后通过一条条select for update 去更新借款人表里面的余额等。
例如两个用户同时投资,A用户金额随机分为2份,分给借款人1,2
B用户金额随机分为2份,分给借款人2,1
由于加锁的顺序不一样,死锁当然很快就出现了。
对于这个问题的改进很简单,直接把所有分配到的借款人直接一次锁住就行了。
1 | Select * from xxx where id in (xx,xx,xx) for update |
在in里面的列表值mysql是会自动从小到大排序,加锁也是一条条从小到大加的锁
第一个会话:
注意:关闭掉自动提交set autocommit=0;
1 2 3 4 5 6 7 |
mysql> select * from goods where goods_id in (2,3) for update ; + ----+--------+------+---------------------+ | good_id | goods_name | price | + ----+--------+------+---------------------+ | 2 | bbbb | 1.00 | | 3 | vvv | 3.00 | + ----+--------+------+---------------------+ |
第二个会话:
1 | select * from goods where goods_id in (3,4,5) for update ; |
锁等待中……
在开发中,经常会做这类的判断需求:根据字段值查询(有索引),如果不存在,则插入;否则更新。
以id为主键为例,目前还没有id=22的行
注意:关闭掉自动提交set autocommit=0;
第一个会话:
1 | select * from goods where goods_id=22 for update ; |
第二个会话:
1 | select * from goods where goods_id=23 for update ; |
再在第一个会话:
1 | insert into goods values (22, 'ac' ,11.5); |
锁等待中……
再到第二个会话:
1 | insert into goods values (23, 'bc' ,23.0); |
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction
当对存在的行进行锁的时候(主键),mysql就只有行锁。
当对未存在的行进行锁的时候(即使条件为主键),mysql是会锁住一段范围
锁住的范围为:
(无穷小或小于表中锁住id的最大值,无穷大或大于表中锁住id的最小值)
如一:如果表中目前有已有的id为(11 , 12)
那么就锁住(12,无穷大)
如二:如果表中目前已有的id为(11 , 30)
那么就锁住(11,30)
对于这种死锁的解决办法是:
1 | insert into goods(xx,xx) on duplicate key update `xx`= 'XX' ; |
用mysql特有的语法来解决此问题。因为insert语句对于主键来说,插入的行不管有没有存在,都会只有行锁
正常情况下,死锁发生时,权重最小的连接将被kill并回滚。但是为了找出语句来优化,启用可启用死锁将死锁信息记录下来。
1 2 3 4 5 6 7 8 |
#step 1:窗口一 mysql> start transaction ; mysql> update aa set name = 'aaa' where id = 1; #step 2:窗口二 mysql> start transaction ; mysql> update bb set name = 'bbb' where id = 1; #step 3:窗口一 mysql> update bb set name = 'bbb' ; |
查看方式
1 2 3 4 5 6 7 8 |
#step 4:窗口三 #是否自动提交 mysql> show variables like 'autocommit' ; + ---------------+-------+ | Variable_name | Value | + ---------------+-------+ | autocommit | ON | + ---------------+-------+ |
1 2 3 4 5 6 7 8 9 10 11 |
#查看当前连接 mysql> show processlist; mysql> show full processlist; mysql> SELECT * FROM INFORMATION_SCHEMA.PROCESSLIST; + ----+------+-----------+------+---------+------+-------+------------------+ | Id | User | Host | db | Command | Time | State | Info | + ----+------+-----------+------+---------+------+-------+------------------+ | 4 | root | localhost | test | Sleep | 244 | | NULL | | 5 | root | localhost | test | Sleep | 111 | | NULL | | 6 | root | localhost | NULL | Query | 0 | init | show processlist | + ----+------+-----------+------+---------+------+-------+------------------+ |
这个命令中最关键的就是state列,mysql列出的状态主要有以下几种:
Checking table
正在检查数据表(这是自动的)。
Closing tables
正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。
Connect Out
复制从服务器正在连接主服务器。
Copying to tmp table on disk
由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。
Creating tmp table
正在创建临时表以存放部分查询结果。
deleting from main table
服务器正在执行多表删除中的第一部分,刚删除第一个表。
deleting from reference tables
服务器正在执行多表删除中的第二部分,正在删除其他表的记录。
Flushing tables
正在执行FLUSH TABLES,等待其他线程关闭数据表。
Killed
发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。
Locked
被其他查询锁住了。
Sending data
正在处理SELECT查询的记录,同时正在把结果发送给客户端。
Sorting for group
正在为GROUP BY做排序。
Sorting for order
正在为ORDER BY做排序。
Opening tables
这个过程应该会很快,除非受到其他因素的干扰。例如,在执ALTER TABLE或LOCK TABLE语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。
Removing duplicates
正在执行一个SELECT DISTINCT方式的查询,但是MySQL无法在前一个阶段优化掉那些重复的记录。因此,MySQL需要再次去掉重复的记录,然后再把结果发送给客户端。
Reopen table
获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。
Repair by sorting
修复指令正在排序以创建索引。
Repair with keycache
修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。
Searching rows for update
正在讲符合条件的记录找出来以备更新。它必须在UPDATE要修改相关的记录之前就完成了。
Sleeping
正在等待客户端发送新请求.
System lock
正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。
Upgrading lock
INSERT DELAYED正在尝试取得一个锁表以插入新记录。
Updating
正在搜索匹配的记录,并且修改它们。
User Lock
正在等待GET_LOCK()。
Waiting for tables
该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:FLUSH TABLES tbl_name, ALTER TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。
Waiting for handler insert
INSERT DELAYED已经处理完了所有待处理的插入操作,正在等待新的请求。
1 2 3 4 5 6 7 8 |
#查看当前正在被锁的事务(锁请求超时后则查不到) mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS; + ------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+ | lock_id | lock_trx_id | lock_mode | lock_type | lock_table | lock_index | lock_space | lock_page | lock_rec | lock_data | + ------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+ | 130718495:65:3:4 | 130718495 | X | RECORD | `test`.`bb` | GEN_CLUST_INDEX | 65 | 3 | 4 | 0x000000000300 | | 130718496:65:3:4 | 130718496 | X | RECORD | `test`.`bb` | GEN_CLUST_INDEX | 65 | 3 | 4 | 0x000000000300 | + ------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+ |
1 2 3 4 5 6 7 |
#查看当前等待锁的事务(锁请求超时后则查不到) mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS; + -------------------+-------------------+-----------------+------------------+ | requesting_trx_id | requested_lock_id | blocking_trx_id | blocking_lock_id | + -------------------+-------------------+-----------------+------------------+ | 130718499 | 130718499:65:3:4 | 130718500 | 130718500:65:3:4 | + -------------------+-------------------+-----------------+------------------+ |
1 2 |
#查看当前未提交的事务(如果死锁等待超时,事务可能还没有关闭) mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX; |
主要看箭头指向的这几个字段,如果有阻塞数据(不为0的就是阻塞的),找到后在根据下图这个字段:try_mysql_thread_id 作为这条数据的主键id执行这个sql进行删除: kill id ;(杀死对应id的进程).假设这里try_mysql_thread_id=14的这条数据是锁了。我们执行 kill 14删除就不再锁表了。
1 2 3 4 5 6 7 |
#查看正在被访问的表 mysql> show OPEN TABLES where In_use > 0; + ----------+-------+--------+-------------+ | Database | Table | In_use | Name_locked | + ----------+-------+--------+-------------+ | test | bb | 1 | 0 | + ----------+-------+--------+-------------+ |
1 2 3 4 5 6 7 |
#step 3:窗口一 (若第三步中锁请求太久,则出现锁超时而终止执行) mysql> update bb set name = 'bbb' ; ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction # "窗口一" 锁请求超时前,执行第五步,使死锁产生,则该连接 "窗口二" 执行终止, "窗口一" 顺利执行 #step 5:窗口二 mysql> update aa set name = 'aa' ; ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction |
1 | mysql> SHOW ENGINE INNODB STATUS; |
1 2 3 4 5 6 7 |
#死锁记录只记录最近一个死锁信息,若要将每个死锁信息都保存到错误日志,启用以下参数: mysql> show variables like 'innodb_print_all_deadlocks' ; + ----------------------------+-------+ | Variable_name | Value | + ----------------------------+-------+ | innodb_print_all_deadlocks | OFF | + ----------------------------+-------+ |
1 2 3 4 5 6 7 8 9 10 11 |
#上面 【step 3:窗口一】若一直请求不到资源,默认50秒则出现锁等待超时。 mysql> show variables like 'innodb_lock_wait_timeout' ; + --------------------------+-------+ | Variable_name | Value | + --------------------------+-------+ | innodb_lock_wait_timeout | 50 | + --------------------------+-------+ ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction #设置全局变量 锁等待超时为60秒(新的连接生效) #mysql> set session innodb_lock_wait_timeout=50; mysql> set global innodb_lock_wait_timeout=60; |
1 2 3 4 5 6 7 |
#上面测试中,当事务中的某个语句超时只回滚该语句,事务的完整性属于被破坏了。为了回滚这个事务,启用以下参数: mysql> show variables like 'innodb_rollback_on_timeout' ; + ----------------------------+-------+ | Variable_name | Value | + ----------------------------+-------+ | innodb_rollback_on_timeout | OFF | + ----------------------------+-------+ |
最终参数设置如下:(重启服务重新连接测试)
1 2 3 4 5 |
[mysqld] log-error =/var/log/mysqld3306.log innodb_lock_wait_timeout=60 #锁请求超时时间(秒) innodb_rollback_on_timeout = 1 #事务中某个语句锁请求超时将回滚真个事务 innodb_print_all_deadlocks = 1 #死锁都保存到错误日志 |
表示连接休眠,如果太多,可以手动删除
1 2 3 |
#若手动删除堵塞会话,删除 Command= 'Sleep' 、无State、无Info、trx_weight 权重最小的。 show processlist; SELECT trx_mysql_thread_id,trx_state,trx_started,trx_weight FROM INFORMATION_SCHEMA.INNODB_TRX; |
上面是小编总结的mysql死锁相关的内容,尤其是死锁检查处理,是比较实用的,小伙伴们可以参考。
2023-10-30
windows上的mysql服务突然消失提示10061 Unkonwn error问题及解决方案2023-10-30
MySQL非常重要的日志bin log详解2023-10-30
详解MySQL事务日志redo log一、单表查询 1、排序 2、聚合函数 3、分组 4、limit 二、SQL约束 1、主键约束 2、非空约束 3、唯一约束 4、外键约束 5、默认值 三、多表查询 1、内连接 1)隐式内连接: 2)显式内连接: 2、外连接 1)左外连接 2)右外连接 四...
2023-10-30
Mysql删除表重复数据 表里存在唯一主键 没有主键时删除重复数据 Mysql删除表中重复数据并保留一条 准备一张表 用的是mysql8 大家自行更改 创建表并添加四条相同的数据...
2023-10-30