水镜

AI 中转站红黑榜

持续监测各 API 中转站的模型真实性、稳定性、延迟与价格。直接询问 + 多角度金丝雀题鉴别是否掺水，按模型分榜，公开透明。

在监站点

真实可信

疑似掺水

📊 按模型排行

选择模型查看各中转站的掺水率、稳定性、延迟与价格 · 数据每分钟刷新 · 点击行看详情运行状态(近24h，每格1小时): 正常部分失败故障无数据

#	中转站	掺水鉴别	掺水率	7天稳定性	运行状态	往返延迟	首字延迟	平均响应	价格(入/出每百万)
{{ i+1 }}	{{ r.name }} {{ r.badge }}	{{ r.verdict_label }} {{ r.suspected_vendor }}	{{ r.watering_rate }}% {{ r.verdict_level==='checking' ? '检测中' : '未检测' }}	{{ pct(r.success_rate_7d) }}		{{ r.avg_roundtrip_ms ? r.avg_roundtrip_ms+'ms' : '-' }}	{{ r.avg_ttft_ms ? r.avg_ttft_ms+'ms' : '-' }}	{{ r.avg_total_ms ? r.avg_total_ms+'ms' : '-' }}

加载中…

数据加载失败，请稍后重试。

该模型暂无已发布的监控站点。

⚠ 风险提示：榜单数据由自动探测生成，仅供参考，不构成采购建议。“掺水率”指该站此模型在近 7 天身份鉴别中被判为疑似掺水的比例，基于模型自述与金丝雀题，存在误差。建议小额试用、按量充值，勿大额囤积。

什么是 API 中转站“掺水”？

中转站把你按某模型（如 Claude）名义发出的请求，偷偷路由到更便宜的模型、量化/蒸馏版本，或砍掉上下文、能力，从而以次充好赚差价。水镜通过直接询问模型身份 + 多角度金丝雀题来识别这种行为。

“掺水率”和“掺水鉴别”怎么来的？

系统定期用英文向该模型发问并结合思考过程，按厂商关键词打分，得出“疑似真 / 可疑 / 疑似掺水”结论。掺水率＝近 7 天内被判为可疑或掺水的检测占比。自述类信号存在误判（如开源模型常因训练数据自称 GPT），结论仅供参考。

稳定性和延迟是怎么测的？

稳定性用不消耗 token 的方式高频探测：定期调用各站的 /v1/models 接口，验证可达性、鉴权与模型是否在售，并记录成功率与往返延迟。这样高频监控也不会烧用户的额度。7 天稳定性反映长期可靠度，24 小时反映近期状态。

首字延迟（TTFT）与吐字速度等真实生成指标，则由较低频的掺水鉴别探测顺带采集（鉴别本身会真实调用模型），因此刷新频率较慢。

价格是实时的吗？

对支持的中转站（one-api / new-api 系），价格从其 /api/pricing 接口定期自动同步并换算为每百万 token 单价；其余为人工维护。以中转站实际计费为准。

{{ detail.badge }} {{ detail.verdict.label }} 官网 ↗

模型	掺水鉴别	24h稳定性	运行状态	往返延迟	首字延迟	平均响应	tokens/s	价格(入/出每百万)
{{ alias(m.model) }} {{ m.model }}	{{ m.verdict.label }} 未检测 {{ m.verdict.suspected_vendor }}	{{ pct(m.success_rate) }}		{{ m.avg_roundtrip_ms ? m.avg_roundtrip_ms+'ms' : '-' }}	{{ m.avg_ttft_ms ? m.avg_ttft_ms+'ms' : '-' }}	{{ m.avg_total_ms ? m.avg_total_ms+'ms' : '-' }}	{{ m.avg_tps ?? '-' }}

该站暂无公开监控数据。