
Vals AI
专注于大型语言模型 LLM 评估和基准测试的平台,旨在提高生成式 AI 的性能和可靠性

XSCT Bench
场景化大模型测评平台,针对实际应用场景进行模型能力评估

OpenRouter Rankings
OpenRouter 平台模型排名,反映各大型语言模型在真实使用场景中的表现

Arena.ai
美国加州大学伯克利分校推出的 AI 模型评估平台,以盲测方式进行模型排名

Artificial Analysis
专注于 AI 语言模型和 API 提供商的独立分析平台,提供模型性能和成本对比

PinchBench
专门评估大模型在真实 Agent 自动化任务中能力的排行榜,帮助开发者选择最适合的模型

阶跃星辰 API
阶跃星辰开放平台,专注通用人工智能 AGI,国内"AI 六小龙"之一

百度文心 API
百度文心一言 API,精准覆盖公文写作、学术论文、创意策划、代码编程等丰富场景

腾讯混元 API
腾讯研发的大语言模型 API,具备强大中文创作和复杂逻辑推理能力

讯飞星火 API
科大讯飞新一代认知智能大模型 API,拥有跨领域知识和语言理解能力