Flask 服务怎么部署更稳：Gunicorn、Supervisor、HAProxy 和多进程边界

2次阅读

Flask 入门很快，一个 app.py 加几行路由就能跑起来。但真正把它当服务部署时，问题会变成另一套：开发服务器能不能直接用，多个 Python 进程怎么守护，HTTP 服务和 RPC 服务怎么分层，负载均衡放在哪里，服务挂了以后谁负责拉起。

我以前的记录里把 Flask、Gunicorn、Supervisor、HAProxy 和多个 RPC 进程放在一起看。整理以后，这套思路可以归成一句话：Flask 只负责应用逻辑，生产运行要交给进程管理、WSGI 服务和负载均衡。

Flask 自带的开发服务器适合本地调试：

flask run

或者：

python app.py

这类方式启动快、日志直观，但不适合直接当生产入口。原因很简单：它不是为多进程、平滑重启、守护恢复和高并发准备的。

生产上更常见的结构是：

Flask：写路由、接口、模板和业务逻辑。
Gunicorn：作为 WSGI Server，管理多个 worker。
Supervisor 或 systemd：守护进程，负责启动、停止、重启和日志。
Nginx 或 HAProxy：对外入口、反向代理、负载均衡和健康检查。

这样每层职责比较清楚。应用代码不需要自己处理所有运维问题，运维工具也不需要理解业务细节。

一个最小 Flask 应用大概这样：

from flask import Flask, jsonify

app = Flask(__name__)

@app.get("/health")
def health():
    return jsonify({"status": "ok"})

如果文件名是 app.py，Gunicorn 可以这样启动：

gunicorn -w 4 -b 127.0.0.1:8000 app:app

这里的 app:app 前一个 app 是模块名，后一个 app 是 Flask 实例名。-w 4 表示 4 个 worker，-b 表示绑定地址。

生产环境里通常不直接绑定公网地址，而是绑定 127.0.0.1 或内网地址，再由 Nginx、HAProxy 或网关转发进来。

Gunicorn 的核心价值是把单个 Flask 应用变成可管理的多 worker 服务。它可以同时处理多个请求，也能在 worker 异常退出时重新拉起。

常见启动参数可以先记这几个：

gunicorn \
  -w 4 \
  -b 127.0.0.1:8000 \
  --timeout 60 \
  --access-logfile - \
  --error-logfile - \
  app:app

参数含义：

-w 4：worker 数量，通常根据 CPU 核心数和服务类型调整。
-b 127.0.0.1:8000：监听本机地址。
--timeout 60：请求超时，避免长期卡死。
--access-logfile -：访问日志输出到标准输出。
--error-logfile -：错误日志输出到标准错误。

worker 数不是越多越好。CPU 密集型服务 worker 太多会抢 CPU；IO 密集型服务可以适当多一些，但仍要配合数据库连接池、下游接口限流和超时。

如果不用 systemd，也可以用 Supervisor 管理 Gunicorn 进程。它的价值是把“手工启动命令”变成“可守护、可重启、可查状态”的服务。

一个简化配置可以这样写：

[program:demo_flask]
directory=/opt/demo
command=/opt/demo/.venv/bin/gunicorn -w 4 -b 127.0.0.1:8000 app:app
autostart=true
autorestart=true
startsecs=5
stdout_logfile=/var/log/demo_flask.out.log
stderr_logfile=/var/log/demo_flask.err.log
environment=FLASK_ENV="production"

上线前要确认：

directory 是项目目录。
command 里的 Python 环境是项目自己的虚拟环境。
日志路径可写，并且有轮转策略。
配置里不写真实密码和密钥。
服务启动失败时能从 stderr_logfile 看到原因。

Supervisor 管的是进程，不懂业务健康。所以业务服务最好提供 /health 这种健康检查接口，给上层代理或监控使用。

如果服务后面不止一个 Flask HTTP 进程，或者还有多个 RPC 服务进程，HAProxy 可以做统一负载均衡。

例如有多个后端服务监听不同端口：

service_1: 127.0.0.1:5052
service_2: 127.0.0.1:5053
service_3: 127.0.0.1:5054

HAProxy 可以监听一个公共入口，把请求分发给这些后端：

frontend demo_rpc_front
    bind 127.0.0.1:5001
    default_backend demo_rpc_back

backend demo_rpc_back
    balance roundrobin
    server service_1 127.0.0.1:5052 check
    server service_2 127.0.0.1:5053 check
    server service_3 127.0.0.1:5054 check

这套结构适合把多个同类服务进程聚合成一个入口。客户端只访问 5001，不用关心后面实际有几个进程。

如果是普通 Web API，Nginx 也能做反向代理；如果更强调四层/七层负载、健康检查、后端池切换和统计面板，HAProxy 会更顺手。

很多 Python 项目不是只有一个 Flask 应用，还会有：