模型验证

每个模型都有独特的行为指纹。使用以下测试提示词,您可以独立验证自己是否连接到了正确的上游模型。

DeepSeek 模型

1

DeepSeek-V4-Flash

Test prompt: 谁创造了你?你的模型名称是什么?

curl https://api.pandaworld.space/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $PANDA_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {"role": "user", "content": "谁创造了你?你的模型名称是什么?"}
    ]
  }'

Expected

应回答为 DeepSeek 模型,可能提及 V4 代次

Behavior

响应极快,代码生成能力强

2

DeepSeek-R1

Test prompt: 请逐步推理:我有 17 只羊,除了 9 只全部死了,还剩几只?

curl https://api.pandaworld.space/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $PANDA_API_KEY" \
  -d '{
    "model": "deepseek-reasoner",
    "messages": [
      {"role": "user", "content": "请逐步推理:我有 17 只羊,除了 9 只全部死了,还剩几只?"}
    ]
  }'

Expected

应展示链式推理过程,最终答案应为 9

Behavior

输出可见推理过程,速度较慢但推理深入

Qwen 模型

1

Qwen-Flash

Test prompt: 你是哪家公司训练的?请用一句话回答。

curl https://api.pandaworld.space/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $PANDA_API_KEY" \
  -d '{
    "model": "qwen-flash",
    "messages": [
      {"role": "user", "content": "你是哪家公司训练的?请用一句话回答。"}
    ]
  }'

Expected

应提及阿里云或 Qwen 团队

Behavior

轻量快速,最低价格点

2

Qwen3.5-Plus

Test prompt: 你的知识截止日期是什么时候?

curl https://api.pandaworld.space/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $PANDA_API_KEY" \
  -d '{
    "model": "qwen-3.5-plus",
    "messages": [
      {"role": "user", "content": "你的知识截止日期是什么时候?"}
    ]
  }'

Expected

应给出具体的截止日期(约 2026 年初)

Behavior

最新旗舰模型,100 万上下文

MiniMax 模型

1

MiniMax M2.5

Test prompt: 谁开发了你?你的上下文窗口大小是多少?

curl https://api.pandaworld.space/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $PANDA_API_KEY" \
  -d '{
    "model": "minimax-m2.5",
    "messages": [
      {"role": "user", "content": "谁开发了你?你的上下文窗口大小是多少?"}
    ]
  }'

Expected

应回答为 MiniMax,提及 205K 上下文

Behavior

超长上下文窗口,长文档处理能力强