工具档案
Claude Opus 4.6
Anthropic旗舰模型,Agent编码与软件工程领域最强。
Agent编码和软件工程基准全球最强
OSWorld计算机操作72.7%(远超GPT-5的38%)
自适应思考模式,推理深度灵活调整
API价格最高($15/$75),成本敏感场景不适合
AIME数学基准略逊于GPT-5
闭源模型,无法本地部署
9.3
编辑评分
产品简介
Claude Opus 4.6是Anthropic于2026年2月5日发布的旗舰模型,在Agent编码和软件工程基准上取得最高分(OSWorld 72.7%)。支持100万token上下文窗口和12.8万token最大输出。自适应思考模式可根据任务复杂度调整推理深度。Claude Pro订阅$20/月,API输入$15/百万token、输出$75/百万token。同期发布的Sonnet 4.6以1/5价格达到接近Opus水平。
用户反馈摘要
Agent太猛,但账单太疼
用户认可
- 多篇实测都把 Agent 能力放在第一位,甚至认为比 GPT-5.2 更胜一筹
- 首轮就能搭出清晰 Agent 架构、16 Agent 写 C 编译器的案例很抓人
用户顾虑
- 同类测评提到它常常要多花 20% 到 130% 的 token
- “贵到离谱”“真的用不起了”是最常见负面反馈
优点
- Agent编码和软件工程基准全球最强
- OSWorld计算机操作72.7%(远超GPT-5的38%)
- 自适应思考模式,推理深度灵活调整
- 128K最大输出,适合长文本生成
不足
- API价格最高($15/$75),成本敏感场景不适合
- AIME数学基准略逊于GPT-5
- 闭源模型,无法本地部署
- 免费版额度非常有限
核心功能
Agent编码(SWE-bench顶级) 计算机操作(Computer Use) 自适应思考模式 100万token上下文 128K超长输出 多模态理解
背景信息
- 融资
- Anthropic(Google、亚马逊投资)
- 技术
- Claude 4.6架构
工具档案
- 编辑评分
- 9.3/10
- 所属赛道
- 大模型对比
- 价格模式
- 免费增值
- 更新时间
- 2026-02
标签
大模型 编码 Agent Anthropic Claude