⚠️ DeepSeek-R1 即将停用

deepseek-reasoner 接口将于 2026年7月24日 停用。请迁移至 deepseek-v4-flash 并启用思考模式。新定价为 ¥1.30/¥5.80(每百万 tokens),比 R1 便宜最高 75%。

迁移方式:将模型名称从 deepseek-reasoner 改为 deepseek-v4-flash,并在请求中添加 thinking: {"type": "enabled"}。

模型与定价

熊猫世界 通过单一的 OpenAI 兼容端点提供中国顶级大模型的访问。按量付费,无月度承诺。以下价格为透明定价,所有价格以人民币计。

定价表

所有价格以人民币计。文本模型采用非对称 Input/Output 定价 — Input 更便宜以吸引开发者,Output 保持合理利润。图像/视频模型按次计价。每周更新。

对话模型

模型 ID提供商上游端点上游 Input (¥/百万 Tokens)上游 Output (¥/百万 Tokens)PW Input (¥/百万 Tokens)PW Output (¥/百万 Tokens)上下文
minimax-m2.5MiniMaxapi.minimax.chat¥1.10¥8.30¥1.45¥10.80205K
deepseek-reasoner深度求索api.deepseek.com¥1.00¥2.00¥5.80¥23.0064K
deepseek-v4-flash深度求索api.deepseek.com¥1.00¥2.00¥1.30¥4.301M
deepseek-v4-pro深度求索api.deepseek.com¥12.50¥25.00¥15.80¥49.001M
qwen3-max阿里云dashscope.aliyuncs.com¥14.40¥54.00¥20.20¥57.60128K
qwen-3.5-plus阿里云dashscope.aliyuncs.com¥5.80¥21.60¥7.20¥23.001M
qwen-flash阿里云dashscope.aliyuncs.com¥0.72¥2.20¥0.86¥3.251M
qwen3-32b阿里云dashscope.aliyuncs.com¥5.00¥10.00¥6.50¥20.20128K

所有请求均通过我们的网关路由。上游端点是上述模型提供商的直接 API 域名,我们公开此信息以确保完全透明。

文生图模型

模型 ID提供商上游价格熊猫世界价格最大分辨率
wan-2.7-image阿里云¥0.22¥0.362048×2048
kolors快手¥0.14¥0.291024×1024

视频生成模型

价格为每秒生成视频的价格,最终费用取决于视频时长。

模型 ID提供商上游价格熊猫世界价格最大时长
wan-2.7-video阿里云¥0.50/秒¥0.72/秒最长15秒

批量处理 — 五折优惠

所有模型批量(异步)处理享标准价格五折优惠。批量任务通常在 1–6 小时内完成,最长处理时间不超过 24 小时。无最小批次限制——任何规模均可使用,建议 50 条以上以获得最大吞吐收益。

与美国提供商成本对比

与可比的美国提供商模型对比(Input 价格)。竞争对手价格截至 2026 年 5 月。

模型熊猫世界(Input)美国竞争对手节省
DeepSeek-V4-Flash$0.18GPT-4.1(¥14.40)91%
MiniMax M2.5$0.20Claude Sonnet 4.6(¥21.60)93%
DeepSeek-R1$0.80o1(¥105.00)95%
Qwen3.5-Plus$1.00GPT-5(¥57.60)87.5%
Qwen3-Max$2.80Claude 3.5 Sonnet(¥70.00)72%
Qwen-Flash$0.12Claude Haiku 4.5(¥7.20)88%

加价透明说明

我们坚持完全透明。上游提供商价格与熊猫世界价格之间的差额用于覆盖:

  • 全球边缘基础设施 — 新加坡、美西、东京多节点代理服务器,确保全球低延迟访问
  • OpenAI 兼容层 — 我们维护和更新兼容层,您无需操心
  • 账单与分析 — 用量追踪、成本分析、多模型统一账单
  • 技术支持 — 全天候技术支持和监控
  • 支付处理费用 — Lemon Squeezy 和外汇兑换成本

模型选择指南

DeepSeek 模型

deepseek-v4-flash (V4-Flash): 最新一代模型,284B MoE,支持1M Token上下文。速度、能力与成本的完美平衡。大多数用例的默认选择。

deepseek-reasoner (DeepSeek-R1): 已弃用 — 将于2026年7月24日停用。请改用 deepseek-v4-flash 并启用思考模式。在 API 请求中添加 "thinking": {"type": "enabled"},可获得相同或更好的推理质量,成本降低 75%。

deepseek-v4-pro (V4-Pro): 旗舰 1.6T MoE 模型,支持 1M Token 上下文。DeepSeek 系列中质量最高,适合复杂任务和智能体工作流。

MiniMax 模型

minimax-m2.5 (M2.5): 前沿级 230B MoE 模型。SWE-Bench 排名第一,编程、Agent 任务和函数调用能力极强。比 Claude Opus 4 便宜 20 倍。构建 AI 应用的首选。

Qwen 模型

qwen-3.5-plus: 最新旗舰模型,支持 1M Token 上下文。英文和多语言能力出色。非常适合 RAG、文档处理和复杂推理任务。

qwen3-max: 最大、能力最强的 Qwen 模型。最适合中文任务和长上下文应用(最高 128K Tokens)。

qwen-flash: 超轻量模型,价格最低。适合高容量生产负载、批量处理和成本敏感场景。

qwen3-32b: 更高效的 32B 变体。大多数生产负载性价比较为平衡。

文生图模型

wan-2.7-image (通义万相 2.7): 阿里云最新文生图模型。支持多语言文字渲染、风格迁移,最高 2048×2048 分辨率。每张仅 ¥0.40,推理速度快。

kolors (可图 Kolors): 快手开源文生图模型。质量不错,价格更低。适合批量图片生成和成本敏感项目。

视频生成模型

wan-2.7-video (通义万相 2.7): 阿里云开源视频模型,7 种生成模式,包括文生视频、图生视频、视频编辑等功能。质量与价格的平衡之选。

定价说明

  • 按总 Tokens 计费(输入 + 输出合并计算)
  • Token 计数遵循各模型提供商的 Tokenizer
  • 因提供商故障导致错误的请求不收费
  • 价格可能变动;如有变更我们将通过电子邮件通知
  • 量大优惠 — 企业定价请联系我们
  • 提示缓存:标准缓存(5 分钟 TTL)写入 1.25 倍、缓存命中 0.10 倍基础价格。扩展缓存(60 分钟 TTL)即将推出。