工具档案

OpenCompass (司南)

上海AI Lab出品,中文模型评测最权威

中文模型评测最权威,覆盖最全
多维度综合评测,不只看单项
上海AI Lab背景,学术公信力强
部分厂商可能针对评测集刷分
评测维度多但权重分配不够透明
国际模型覆盖不如LMSYS
7.8
编辑评分

产品简介

OpenCompass(司南)由上海AI Lab主导开发,是国内最权威的大模型综合评测平台。覆盖语言、推理、知识、代码、数学等多维度,特别在中文模型评测方面具有不可替代性。每月发布榜单,支持开源模型和商业模型对比。被国内AI厂商广泛引用作为发布新模型的参考基准。

用户反馈摘要

样本不足,多是官方规则说明

知乎+小红书 · 2026-03
用户认可
用户顾虑
  • 真实体验反馈很少
  • 公开讨论几乎都来自官方规则说明

优点

  • 中文模型评测最权威,覆盖最全
  • 多维度综合评测,不只看单项
  • 上海AI Lab背景,学术公信力强
  • 按月更新,跟踪及时

不足

  • 部分厂商可能针对评测集刷分
  • 评测维度多但权重分配不够透明
  • 国际模型覆盖不如LMSYS

核心功能

多维度综合评测 中文专项评测 月度榜单更新 开源+商业模型覆盖 对战榜单

工具档案

编辑评分
7.8/10
所属赛道
AI榜单与媒体
价格模式
免费
更新时间
2026-03-09

标签

中文 学术 综合
访问 OpenCompass (司南) 官网

同赛道其他产品