DeepSeek V4 峰谷定价怎么看：平时不涨，高峰翻倍，批量任务尽量错峰

5次阅读

DeepSeek V4 正式版计划 7 月中旬上线，同时会引入 API 峰谷定价。刚看到这个消息时，很容易第一反应是“是不是又涨价了”。但对照当前官方价格看下来，更准确的说法是：**平时价格基本不变，高峰时段价格翻倍。**

这类调整不像是单纯涨价，更像是 GPU 资源紧张之后的调度策略：白天企业调用、开发调试、在线产品请求集中，算力压力最大；夜间和非工作高峰相对空闲，就继续保持低价。

按目前看到的方案，DeepSeek V4 分成 deepseek-v4-pro 和 deepseek-v4-flash 两档。高峰时段定义为北京时间每日：

09:00-12:00
14:00-18:00

价格变化可以简单这样记：

deepseek-v4-flash 平时价格不变，高峰时段翻倍。
deepseek-v4-pro 平时价格不变，高峰时段翻倍。
缓存命中输入依旧非常便宜。
真正影响成本的是缓存未命中输入和输出 token。

具体到常用计费项：

v4-flash 输入缓存命中：平时 0.02 元/百万 token，高峰 0.04 元。
v4-flash 输入缓存未命中：平时 1 元/百万 token，高峰 2 元。
v4-flash 输出：平时 2 元/百万 token，高峰 4 元。
v4-pro 输入缓存命中：平时 0.025 元/百万 token，高峰 0.05 元。
v4-pro 输入缓存未命中：平时 3 元/百万 token，高峰 6 元。
v4-pro 输出：平时 6 元/百万 token，高峰 12 元。

所以结论很直接：如果你的调用发生在非高峰，成本基本不变；如果集中在工作日白天高峰，就按 2 倍预算算。

假设一次任务是 1 万 token 输入、1 万 token 输出，并且输入缓存未命中。

用 v4-flash：

平时：输入约 0.01 元，输出约 0.02 元，合计约 0.03 元。
高峰：输入约 0.02 元，输出约 0.04 元，合计约 0.06 元。

用 v4-pro：

平时：输入约 0.03 元，输出约 0.06 元，合计约 0.09 元。
高峰：输入约 0.06 元，输出约 0.12 元，合计约 0.18 元。

单次看还是不贵，但如果是高频实时调用，或者每天批量跑很多文章、评论、新闻、行情解读，高峰翻倍就会明显影响月账单。

如果是实时聊天、在线客服、用户白天点击后马上要结果，这类请求很难完全错峰。成本就要按高峰价估算，尤其是输出 token 多的场景。

如果是文章摘要、新闻提取、币圈资讯关键货币识别、标签生成、SEO 摘要、批量改写，这类任务通常不需要马上返回，就很适合放到非高峰。

我自己的直觉是：

实时产品功能：优先用 flash，必要时再切 pro。
批量分析任务：尽量夜间或中午低峰跑。
长文总结任务：控制输出长度，不要让模型随便写很长。
固定系统提示词：尽量复用，争取缓存命中。
结构化提取：让模型只返回 JSON 或短字段，别输出大段解释。

对“提取文章里的关键货币”这种任务来说，成本仍然很低。真正贵的是把一堆文章都让模型长篇分析、长篇输出，再集中放在白天高峰跑。

这背后大概率还是算力资源问题。大模型 API 的成本不是只有模型本身，还有 GPU、显存、调度、并发、缓存、网络和稳定性。

当用户都集中在白天调用时，平台要么排队，要么扩容，要么做限流，要么用价格引导一部分任务错峰。峰谷定价就是一种比较市场化的方式：

急用的人白天用，付更高价格。
不急的任务夜间跑，继续享受低价。
平台把算力压力从高峰挪到低峰。
服务稳定性可能比一味低价更容易保障。

这和云服务器、CDN、对象存储、甚至电价里的峰谷思路很像：不是每一分钟的资源成本都一样。

如果项目里已经接了 DeepSeek API，可以考虑在调度层加一点成本意识。

第一，给任务分类：

实时任务：用户等待结果，例如问答、客服、在线分析。
准实时任务：几分钟内完成即可，例如文章入库后生成摘要。
离线任务：夜里跑也行，例如批量重算标签、历史文章分析、数据清洗。

第二，给模型分层：

简单提取：优先 flash。
复杂推理：再用 pro。
失败重试：不要无限重试，尤其不要在高峰时段重试风暴。

第三，控制输出：

只返回 JSON，不要解释。
每个字段不超过 30 个字。
只输出最重要的 5 个关键词。
无法判断时返回空数组。

很多 API 成本不是输入贵，而是输出被模型写长了。能短就短，能结构化就结构化。

第四，做错峰队列：

高峰时段只跑实时任务。
非高峰处理批量摘要、文章标签、历史数据重算。
对失败任务设置退避重试，不要立刻循环打 API。
在任务表里记录 token、模型、耗时和实际费用，方便后面算账。

如果只是个人项目、小工具、币圈资讯提取、文章摘要，DeepSeek 仍然很便宜。10 元额度用很久并不夸张，尤其是你把批量任务放到非高峰。

如果要做商业产品，就不能只看“单次很便宜”。应该提前估算：

每天多少用户。
每个用户平均调用几次。
每次输入输出大概多少 token。
是否集中在白天高峰。
是否有批量任务可以错峰。
是否可以用 flash 覆盖大部分请求。

一句话总结：**这次更像是高峰资源涨价，不是平时全面涨价。** 对能错峰的批处理任务影响不大；对白天实时调用多的产品，需要把预算按高峰 2 倍重新估一下。

DeepSeek API 模型与价格

正文完

AI 技术笔记

发表至：智能与MLOps

近一天内

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

PokePay 能不能用于 GPT 订阅，开卡前先确认

Cursor 里的 usage 和 context 分别是什么意思

TRAE SOLO 是什么，可以先把它理解成哪类能力

AI 里的规则、指令、Skill、Agent、MCP 有什么区别

Next.js 15.1.8 Middleware 鉴权绕过漏洞：后台系统如何止血和排查

DeepSeek V4 峰谷定价怎么看：平时不涨，高峰翻倍，批量任务尽量错峰

价格变化的核心

举个实际小账

对不同场景的影响

为什么会变成峰谷定价

开发侧可以怎么适配

我的使用建议

参考资料

免费 AI API 怎么选：真无 Key、本地模型和 Java 接入建议

Redis 分片和集群怎么选：主从、哨兵、代理分片和 Redis Cluster

Chrome 安装 React Developer Tools：Components 和 Profiler 面板怎么打开

Kubernetes 网络怎么理解：Pod、Service、ClusterIP、NodeIP 和 Ingress

Tailwind CSS 模板怎么选：UI Kit、落地页和 Vue/Next 博客模板怎么取舍