AI 中转站 红黑榜

持续监测各 API 中转站的模型真实性、稳定性、延迟与价格。直接询问 + 多角度金丝雀题鉴别是否掺水,按模型分榜,公开透明。

{{ board.length }}
在监站点
{{ countLevel('good') }}
真实可信
{{ countLevel('bad') }}
疑似掺水

📊 按模型排行

选择模型查看各中转站的掺水率、稳定性、延迟与价格 · 数据每分钟刷新 · 点击行看详情 运行状态(近24h,每格1小时): 正常 部分失败 故障 无数据
{{ tabAlias(m.name) }}{{ m.station_count }}
#中转站掺水鉴别掺水率 7天稳定性运行状态首字延迟 平均响应价格(入/出 每百万)
{{ i+1 }} {{ r.name }} {{ r.badge }} {{ r.verdict_label }} {{ r.suspected_vendor }} {{ r.watering_rate }}% 未检测 {{ pct(r.success_rate_7d) }} {{ r.avg_ttft_ms ? r.avg_ttft_ms+'ms' : '-' }} {{ r.avg_total_ms ? r.avg_total_ms+'ms' : '-' }}
该模型暂无已发布的监控站点。
⚠ 风险提示:榜单数据由自动探测生成,仅供参考,不构成采购建议。“掺水率”指该站此模型在近 7 天身份鉴别中被判为疑似掺水的比例,基于模型自述与金丝雀题,存在误差。建议小额试用、按量充值,勿大额囤积。

❓ 常见问题

什么是 API 中转站“掺水”?

中转站把你按某模型(如 Claude)名义发出的请求,偷偷路由到更便宜的模型、量化/蒸馏版本,或砍掉上下文、能力,从而以次充好赚差价。水镜通过直接询问模型身份 + 多角度金丝雀题来识别这种行为。

“掺水率”和“掺水鉴别”怎么来的?

系统定期用英文向该模型发问并结合思考过程,按厂商关键词打分,得出“疑似真 / 可疑 / 疑似掺水”结论。掺水率=近 7 天内被判为可疑或掺水的检测占比。自述类信号存在误判(如开源模型常因训练数据自称 GPT),结论仅供参考。

稳定性和延迟是怎么测的?

系统按设定周期向每个被监控模型发起真实的流式对话请求,记录成功率、首字延迟(TTFT)与整体响应耗时。7 天稳定性反映长期可靠度,24 小时反映近期状态。

价格是实时的吗?

对支持的中转站(one-api / new-api 系),价格从其 /api/pricing 接口定期自动同步并换算为每百万 token 单价;其余为人工维护。以中转站实际计费为准。