工具档案
OpenCompass (司南)
上海AI Lab出品,中文模型评测最权威
免费
访问官网 →
中文模型评测最权威,覆盖最全
多维度综合评测,不只看单项
上海AI Lab背景,学术公信力强
部分厂商可能针对评测集刷分
评测维度多但权重分配不够透明
国际模型覆盖不如LMSYS
7.8
编辑评分
产品简介
OpenCompass(司南)由上海AI Lab主导开发,是国内最权威的大模型综合评测平台。覆盖语言、推理、知识、代码、数学等多维度,特别在中文模型评测方面具有不可替代性。每月发布榜单,支持开源模型和商业模型对比。被国内AI厂商广泛引用作为发布新模型的参考基准。
用户反馈摘要
样本不足,多是官方规则说明
用户认可
用户顾虑
- 真实体验反馈很少
- 公开讨论几乎都来自官方规则说明
优点
- 中文模型评测最权威,覆盖最全
- 多维度综合评测,不只看单项
- 上海AI Lab背景,学术公信力强
- 按月更新,跟踪及时
不足
- 部分厂商可能针对评测集刷分
- 评测维度多但权重分配不够透明
- 国际模型覆盖不如LMSYS
核心功能
多维度综合评测 中文专项评测 月度榜单更新 开源+商业模型覆盖 对战榜单