提示缓存
通过自动提示缓存降低重复提示前缀的成本。当多次发送相同提示前缀时,缓存部分享 90% 折扣。
工作原理
提示缓存自动检测重复的提示前缀(如系统指令、少样本示例、长上下文)。命中缓存时,缓存前缀按基础价格的 0.10 倍计费。缓存条目 TTL 为 5 分钟,每次匹配请求时自动刷新。
定价
| Cache Tier | TTL | Write | Cache Hit |
|---|---|---|---|
| 标准缓存(5 分钟 TTL) | 5 min | 写入:基础价格 1.25 倍 | 缓存命中:基础价格 0.10 倍 |
扩展缓存(60 分钟 TTL)已在路线图中。将提供 1.50 倍写入加价,缓存命中 0.10 倍。如果这对您的用例至关重要,请联系我们。
代码示例
cURL
# 带缓存控制的请求
curl https://api.pandaworld.space/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-your-api-key" \
-d {
"model": "deepseek-v4-flash",
"messages": [
{"role": "system", "content": "你是有用的助手……"},
{"role": "user", "content": "你好!"}
]
}
# 系统提示前缀会自动缓存
# 缓存命中在响应头中显示:x-cache-hit: true路线图
60 分钟 TTL 的扩展提示缓存正在开发中。这将为 Agent 循环和重复自动化任务提供更长的缓存持久性,写入加价 1.50 倍。关注我们的状态页面以获取更新。