设备: HAC95FF5C74757 | 样本数: 48 | 3模型对比 | 测试时间: 2026-04-19T07:44 | 服务器: RTX 5090 32GB
| 模型 | 成功/总数 | 总耗时 | Tok/s ↑ | 质量分 ↑ | JSON OK ↑ | 建议数 | 丰富度 | 响应长度 |
|---|---|---|---|---|---|---|---|---|
| [A] 3.5-APEX Qwen3.5-35B-A3B-APEX-I-Quality.gguf |
48/48 | 145.98s | 156.3 | 5.2/10 | 94% | 1.3 | 9.1 | 1324 |
| [B] 3.5-Opus4.6 Qwen3.5-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled.Q4_K_M.gguf |
48/48 | 117.46s | 162.7 | 4.2/10 | 96% | 1.2 | 8.5 | 984 |
| [C] 3.6-APEX Qwen3.6-35B-A3B-APEX-I-Quality.gguf |
48/48 | 101.78s | 158.5 | 7.8/10 | 100% | 1.3 | 8.9 | 801 |
Generated by model_ab_test.py | RTX 5090 32GB | 2026-04-19T07:44