提示缓存

通过自动提示缓存降低重复提示前缀的成本。当多次发送相同提示前缀时,缓存部分享 90% 折扣。

工作原理

提示缓存自动检测重复的提示前缀(如系统指令、少样本示例、长上下文)。命中缓存时,缓存前缀按基础价格的 0.10 倍计费。缓存条目 TTL 为 5 分钟,每次匹配请求时自动刷新。

定价

Cache TierTTLWriteCache Hit
标准缓存(5 分钟 TTL)5 min写入:基础价格 1.25 倍缓存命中:基础价格 0.10 倍

扩展缓存(60 分钟 TTL)已在路线图中。将提供 1.50 倍写入加价,缓存命中 0.10 倍。如果这对您的用例至关重要,请联系我们。

代码示例

cURL
# 带缓存控制的请求
curl https://api.pandaworld.space/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-api-key" \
  -d {
    "model": "deepseek-v4-flash",
    "messages": [
      {"role": "system", "content": "你是有用的助手……"},
      {"role": "user", "content": "你好!"}
    ]
  }

# 系统提示前缀会自动缓存
# 缓存命中在响应头中显示:x-cache-hit: true

路线图

60 分钟 TTL 的扩展提示缓存正在开发中。这将为 Agent 循环和重复自动化任务提供更长的缓存持久性,写入加价 1.50 倍。关注我们的状态页面以获取更新。