Kafka 队列积压应该怎么排查

133次阅读

排查 Kafka 积压，第一步不是急着扩容，而是先判断问题到底出在生产太快、消费太慢，还是分区和资源分布不均。

最直观的是 Consumer Lag。如果 Lag 持续上升，说明当前消费速度跟不上生产速度；如果只在少数分区升高，往往是分区倾斜或单消费者异常。

生产端看是否突然放量、批量参数是否异常；Broker 侧看磁盘 IO、网络和分区副本状态；消费端看线程数、批量拉取配置、下游数据库或接口是否拖慢处理。

如果真正瓶颈在慢 SQL、远程调用超时或消息处理逻辑本身，再加消费者也只是把问题放大。先定位慢点，再决定扩容还是调优，效率更高。

Kafka 积压是结果，不是原因；要按生产端、Broker、消费端三段拆开看，才能找到真正堵住的位置。

正文完

发表至：数据与中间件

2026年4月14日

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

Cursor 和 Claude 是什么关系，可以这样理解

保证金率怎么理解，用一个全仓例子说明

评论（没有评论）

文章搜索

随机文章

先看核心指标