⚠️ DeepSeek-R1 即将停用

deepseek-reasoner 接口将于 2026年7月24日停用。请迁移至 deepseek-v4-flash 并启用思考模式。新定价为 ¥1.30/¥5.80（每百万 tokens），比 R1 便宜最高 75%。

迁移方式：将模型名称从 deepseek-reasoner 改为 deepseek-v4-flash，并在请求中添加 thinking: {"type": "enabled"}。

模型与定价

熊猫世界通过单一的 OpenAI 兼容端点提供中国顶级大模型的访问。按量付费，无月度承诺。以下价格为透明定价，所有价格以人民币计。

定价表

所有价格以人民币计。文本模型采用非对称 Input/Output 定价 — Input 更便宜以吸引开发者，Output 保持合理利润。图像/视频模型按次计价。每周更新。

对话模型

模型 ID	提供商	上游端点	上游 Input (¥/百万 Tokens)	上游 Output (¥/百万 Tokens)	PW Input (¥/百万 Tokens)	PW Output (¥/百万 Tokens)	上下文
`minimax-m2.5`	MiniMax	`api.minimax.chat`	¥1.10	¥8.30	¥1.45	¥10.80	205K
`deepseek-reasoner`	深度求索	`api.deepseek.com`	¥1.00	¥2.00	¥5.80	¥23.00	64K
`deepseek-v4-flash`	深度求索	`api.deepseek.com`	¥1.00	¥2.00	¥1.30	¥4.30	1M
`deepseek-v4-pro`	深度求索	`api.deepseek.com`	¥12.50	¥25.00	¥15.80	¥49.00	1M
`qwen3-max`	阿里云	`dashscope.aliyuncs.com`	¥14.40	¥54.00	¥20.20	¥57.60	128K
`qwen-3.5-plus`	阿里云	`dashscope.aliyuncs.com`	¥5.80	¥21.60	¥7.20	¥23.00	1M
`qwen-flash`	阿里云	`dashscope.aliyuncs.com`	¥0.72	¥2.20	¥0.86	¥3.25	1M
`qwen3-32b`	阿里云	`dashscope.aliyuncs.com`	¥5.00	¥10.00	¥6.50	¥20.20	128K

所有请求均通过我们的网关路由。上游端点是上述模型提供商的直接 API 域名，我们公开此信息以确保完全透明。

文生图模型

模型 ID	提供商	上游价格	熊猫世界价格	最大分辨率
`wan-2.7-image`	阿里云	¥0.22	¥0.36	2048×2048
`kolors`	快手	¥0.14	¥0.29	1024×1024

视频生成模型

价格为每秒生成视频的价格，最终费用取决于视频时长。

模型 ID	提供商	上游价格	熊猫世界价格	最大时长
`wan-2.7-video`	阿里云	¥0.50/秒	¥0.72/秒	最长15秒

批量处理 — 五折优惠

所有模型批量（异步）处理享标准价格五折优惠。批量任务通常在 1–6 小时内完成，最长处理时间不超过 24 小时。无最小批次限制——任何规模均可使用，建议 50 条以上以获得最大吞吐收益。

与美国提供商成本对比

与可比的美国提供商模型对比（Input 价格）。竞争对手价格截至 2026 年 5 月。

模型	熊猫世界（Input）	美国竞争对手	节省
DeepSeek-V4-Flash	$0.18	GPT-4.1（¥14.40）	91%
MiniMax M2.5	$0.20	Claude Sonnet 4.6（¥21.60）	93%
DeepSeek-R1	$0.80	o1（¥105.00）	95%
Qwen3.5-Plus	$1.00	GPT-5（¥57.60）	87.5%
Qwen3-Max	$2.80	Claude 3.5 Sonnet（¥70.00）	72%
Qwen-Flash	$0.12	Claude Haiku 4.5（¥7.20）	88%

加价透明说明

我们坚持完全透明。上游提供商价格与熊猫世界价格之间的差额用于覆盖：

全球边缘基础设施 — 新加坡、美西、东京多节点代理服务器，确保全球低延迟访问
OpenAI 兼容层 — 我们维护和更新兼容层，您无需操心
账单与分析 — 用量追踪、成本分析、多模型统一账单
技术支持 — 全天候技术支持和监控
支付处理费用 — Lemon Squeezy 和外汇兑换成本

模型选择指南

DeepSeek 模型

deepseek-v4-flash （V4-Flash）: 最新一代模型，284B MoE，支持1M Token上下文。速度、能力与成本的完美平衡。大多数用例的默认选择。

deepseek-reasoner （DeepSeek-R1）: 已弃用 — 将于2026年7月24日停用。请改用 deepseek-v4-flash 并启用思考模式。在 API 请求中添加 "thinking": {"type": "enabled"}，可获得相同或更好的推理质量，成本降低 75%。

deepseek-v4-pro （V4-Pro）: 旗舰 1.6T MoE 模型，支持 1M Token 上下文。DeepSeek 系列中质量最高，适合复杂任务和智能体工作流。

MiniMax 模型

minimax-m2.5 （M2.5）: 前沿级 230B MoE 模型。SWE-Bench 排名第一，编程、Agent 任务和函数调用能力极强。比 Claude Opus 4 便宜 20 倍。构建 AI 应用的首选。

Qwen 模型

qwen-3.5-plus: 最新旗舰模型，支持 1M Token 上下文。英文和多语言能力出色。非常适合 RAG、文档处理和复杂推理任务。

qwen3-max: 最大、能力最强的 Qwen 模型。最适合中文任务和长上下文应用（最高 128K Tokens）。

qwen-flash: 超轻量模型，价格最低。适合高容量生产负载、批量处理和成本敏感场景。

qwen3-32b: 更高效的 32B 变体。大多数生产负载性价比较为平衡。

文生图模型

wan-2.7-image （通义万相 2.7）: 阿里云最新文生图模型。支持多语言文字渲染、风格迁移，最高 2048×2048 分辨率。每张仅 ¥0.40，推理速度快。

kolors （可图 Kolors）: 快手开源文生图模型。质量不错，价格更低。适合批量图片生成和成本敏感项目。

视频生成模型

wan-2.7-video （通义万相 2.7）: 阿里云开源视频模型，7 种生成模式，包括文生视频、图生视频、视频编辑等功能。质量与价格的平衡之选。

定价说明

按总 Tokens 计费（输入 + 输出合并计算）
Token 计数遵循各模型提供商的 Tokenizer
因提供商故障导致错误的请求不收费
价格可能变动；如有变更我们将通过电子邮件通知
量大优惠 — 企业定价请联系我们
提示缓存：标准缓存（5 分钟 TTL）写入 1.25 倍、缓存命中 0.10 倍基础价格。扩展缓存（60 分钟 TTL）即将推出。