nginx Keepalive

86次阅读

没有评论

你说得非常准确！看来你关注的是 Nginx 内部的 keepalive 配置，而不是高可用集群工具 Keepalived 软件。这两者虽然名字很像，但完全是两个维度的技术：

Keepalived (软件)：解决的是服务器挂没挂的问题（高可用/VIP 漂移）。
Nginx keepalive (指令)：解决的是连接复用效率的问题（长连接/性能优化）。

既然你提到了客户端到 Nginx，以及 Nginx 到后端（Upstream）的连接池，我们可以从这两个链路来看看它是如何压榨性能的：

这是最常见的场景。默认情况下，HTTP/1.1 协议支持长连接。

原理：浏览器请求一个网页后，TCP 连接不会立即断开，而是保持一段时间，用来继续请求该页面上的图片、JS 等资源。
核心配置：
- keepalive_timeout 65;：客户端连接保持 65 秒，超时没新请求就断开。
- keepalive_requests 100;：一个 TCP 连接最多承载 100 个请求，超过后强制断开重连，防止内存泄漏。
收益：减少了每个小资源请求都要进行的 TCP 三次握手 耗时。

这是高并发场景下优化最明显的地方。如果 Nginx 作为反向代理，默认情况下它对后端（如 Tomcat, PHP-FPM, Python）的每个请求都会发起新的 TCP 连接。

痛点：在高 QPS 场景下，Nginx 所在的服务器会产生海量的 TIME_WAIT 状态连接，导致端口耗尽，响应变慢。
原理：Nginx 在 upstream 块中维护一个空闲连接池。请求处理完后，TCP 连接不关闭，而是放入池子给下一个请求复用。

关键配置：

Nginx

upstream backend_server {
    server 127.0.0.1:8080;
    keepalive 32; # 关键：连接池中保留的最大空闲连接数
}

收益：
- 降低延迟：省去了发往后端服务器的握手时间。
- 保护后端：避免后端服务因为频繁创建/销毁线程而崩溃。

我们可以用数据对比一下两种模式的损耗：

维度	短连接 (Short-lived)	长连接 (Keepalive)
网络开销	每个请求 3 次握手 + 4 次挥手	多请求共用一套握手/挥手
CPU 消耗	高（频繁处理系统调用和内核协议栈）	低（仅处理数据传输）
端口占用	极快（容易触发 `Cannot assign requested address`）	稳定（连接数受限于池大小）
延迟 (Latency)	高（多出 RTT 往返时间）	低（直接发送 HTTP 数据包）

在配置 upstream keepalive 时，如果你用的是 HTTP/1.1，必须在 location 块中添加两行配置，否则长连接不会生效：

Nginx

location / {
    proxy_http_version 1.1;         # 必须显式指定 1.1
    proxy_set_header Connection ""; # 清除客户端传来的 Close 头
    proxy_pass http://backend_server;
}

你目前是在为现有的系统做性能压测优化吗？如果你遇到了 TIME_WAIT 过高的问题，我可以帮你看看具体的内核参数该怎么配合 Nginx 调整。

正文完

发表至：技术

2026年3月26日

0