锁等待超时需先查INNODB_TRX定位LOCK WAIT事务,再通过INNODB_LOCK_WAITS找到阻塞源,用PROCESSLIST确认SQL,最后KILL线程终止;预防需优化索引、缩小事务粒度、避免长事务及不一致加锁顺序。
锁等待超时(Lock wait timeout excee)本质是某个事务在等另一把未释放的锁,等太久就报错。第一步不是重启或杀进程,而是先看清谁在等、谁在占——用
dedINFORMATION_SCHEMA.INNODB_TRX 和 INFORMATION_SCHEMA.INNODB_LOCK_WAITS 查实时状态。
SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX ORDER BY TRX_STARTED; 能看到所有活跃事务,重点关注 TRX_STATE = 'LOCK WAIT' 的行,记下它的 TRX_ID 和 TRX_MYSQL_THREAD_ID
INNODB_LOCK_WAITS 关联 blocking_trx_id,就能定位到“卡住别人”的那个事务 IDSELECT * FROM INFORMATION_SCHEMA.PROCESSLIST WHERE ID = ? 找出对应线程的 INFO(即 SQL),确认它执行了什么语句、卡在哪一步确认是某个长事务或未提交事务(比如忘了 COMMIT 或 ROLLBACK)在持锁不放,最直接的解法就是手动终结它。注意:这不是“杀连接”,而是杀事务对应的线程,避免影响其他正常查询。
KILL [thread_id] 终止,例如:KILL 12345;
KILL CONNECTION 除非明确要断开整个客户端连接;KILL 默认就是终止该线程的当前操作(含回滚未完成事务)KILL QUERY [thread_id] 只中断当前语句,不杀事务,适合调试阶段试探性使用Sleep 状态但 TRX_STATE 仍是 ACTIVE,大概率是应用端没正确关闭事务,需同步检查代码逻辑很多锁等待问题不是突发的,而是长期积累的设计隐患。两个高频原因:事务包得太宽、WHERE 条件没走索引导致全表扫描加锁。
WHERE 中的字段有有效索引,否则 InnoDB 会升级为表级意向锁甚至行锁扩散——用 EXPLAIN 看 type 是否为 range/ref,避免 ALL
SELECT ... FOR UPDATE 后长时间不更新,尤其不要在循环里反复加锁却不提交innodb_lock_wait_timeout(默认 50 秒),太短掩盖问题,太长拖垮业务响应;线上建议设为 30–60 秒并配合监控告警有些锁等待不是单点故障,而是模式化竞争,比如秒杀场景的库存扣减、订单号生成器、计数器更新。这类问题光看单次锁等待日志看不出规律,得结合慢日志和业务行为分析。
UPDATE 模板(如 UPDATE goods SET stock = stock - 1 WHERE id = ?),且 Rows_examined 远大于 1 → 说明索引失效或存在间隙锁竞争(1,2),事务 B 更新 (2,1)),极易触发死锁;可通过 SHOW ENGINE INNODB STATUS\G 中的 LATEST DETECTED DEADLOCK 区域验证SELECT ... FOR UPDATE 时,务必按主键/唯一索引顺序访问,避免人为制造锁顺序不一致真正难处理的不是单次超时,而是那种每小时固定时段密集发生的锁等待——那往往意味着业务逻辑和数据库访问模式存在结构性冲突,得从接口设计或分库分表层面动刀,而不是只调参数或杀线程。