你不知道的 Cursor系列(四):Claude 4.5发布!Cursor 宣布加量不加价支持!

引言
人工智能在软件开发领域的应用正在经历一场前所未有的变革。Anthropic
最新发布的 Claude Sonnet 4.5
不仅是目前世界上最强大的编程模型,更是在推理、数学和复杂任务处理方面取得了重大突破。与此同时,主流 AI
编程工具 Cursor
已经全面支持这一最新模型,为开发者带来了更加强大的编程助手体验。
关于 你不知道的Cursor 是一个系列,更多 Cursor
使用技巧也可关注公众号 AI近距离,也可加我微信 ai239Ni 拉你Cursor技术交流进群
系列历史文章
- 1. 如何使用Cursor同时开发多项目?
- 2. 你用 Cursor 写公司的代码安全吗?
- 3全网最全 Cursor 配置指南:从入门到高效工作流!建议收藏
- 4.你不知道的Cursor系列:使用 Cursor 不会这个超牛 MCP 还没用过吧!
- 5.你不知道的Cursor系列:再也不用死记硬背 Linux/Git等 命令,终端 Cmd+K 来帮你!
- 6.聊聊 Cursor 1.6 更新了什么有用的功能?
Claude Sonnet 4.5 核心特性


1. 世界级的编程能力
Claude Sonnet 4.5
在编程领域的表现令人瞩目:
- SWE-bench Verified 评测冠军:在真实世界软件编码能力测试中取得了 77.2% 的成绩(标准配置),使用高计算配置更是达到了惊人的 82.0%
SWE-bench是一个国际上非常重要的权威测试,这个测试专门模拟解决真实世界里的软件工程问题
- 超长任务专注力:能够在复杂的多步骤任务中保持超过 30 小时的专注度
- 卓越的代码理解:在多步推理和代码库理解方面有显著提升,能够处理跨代码库的复杂任务
2. 计算机操作能力的飞跃
在 OSWorld
基准测试(测试 AI 模型在真实计算机任务上的表现)中:
Claude Sonnet 4.5
达到 61.4% 的领先成绩- 相比
4
个月前的Sonnet 4
(42.2%),提升了近 20 个百分点 - 能够直接在浏览器中工作,导航网站、填充电子表格并完成任务
3. 推理与数学能力增强
- AIME 数学竞赛:展现出色的数学推理能力
- MMMLU 多语言理解:平均支持
14
种非英语语言,显示出强大的跨语言能力 - 领域专业知识:在金融、法律、医学和
STEM
领域表现出显著提升的专业知识和推理能力
4. 最对齐的前沿模型
Claude Sonnet 4.5
不仅能力强大,更是 Anthropic
发布的最对齐的前沿模型:
- 减少不良行为:大幅降低了阿谀奉承、欺骗、权力追求和鼓励妄想思维等问题行为
- 防御提示注入攻击:在代理和计算机使用能力方面,对提示注入攻击的防御有了显著进展
- ASL-3 安全保护:遵循
Anthropic
的责任扩展政策,配备了检测潜在危险输入和输出的分类器
Cursor 对 Claude Sonnet 4.5 的支持
集成优势
根据 Cursor
CEO Michael Truell 的评价:
"我们看到 Claude Sonnet 4.5 展现出最先进的编程性能,在更长时间任务上有显著改进。这再次证明了为什么许多使用 Cursor 的开发者选择 Claude 来解决最复杂的问题。"
实际应用场景
使用 Cursor + Claude Sonnet 4.5
的开发者可以获得:
- 复杂架构设计:处理数月的复杂架构工作,同时在大型代码库中保持连贯性
- 代码库级别理解:学习代码库模式,提供精确的实现方案
- 从调试到架构的全流程:深入的上下文理解,转变开发速度
- 更低的错误率:在代码编辑任务上,错误率从
9%
降至 0%(Lovable 公司内部基准测试)
如何在 Cursor 中使用
在 Cursor
中,你现在可以直接选择使用 claude-sonnet-4-5
模型:
-
打开 Cursor 设置
-
在 AI Models 选项中选择 Claude Sonnet 4.5

- agent使用时候选择 Claude Sonnet4.5,开始享受更强大的 AI 编程助手

产品生态系统升级
本次升级,不只是模型,还有一系列产品升级, Anthropic
这次不只是发布了一个新模型。他们还升级了一整套工具,让 AI
变得更好用。
Claude Code 增强
- 增加了检查点“Checkpoints”功能:保存进度并允许即时回滚到之前的状态
- 终端界面刷新:更加流畅的交互体验
- 发布原生 VS Code 扩展:开发者可以在自己熟悉的编辑器里,更方便地使用
Claude
,无缝集成到开发工作流 - 上下文编辑和内存工具:允许代理运行更长时间并处理更大的复杂度
Claude Agent SDK
Anthropic
开放了构建 Claude Code
所使用的基础设施:
- 内存管理:代理如何在长时间运行任务中管理内存
- 权限系统:平衡自主性与用户控制
- 子代理协调:协调多个子代理朝着共同目标工作
开发者现在可以使用相同的基础设施来构建自己的 AI
代理。
其他应用集成
Claude Sonnet 4.5
已经被多个知名产品采用:
- GitHub Copilot:显著改进多步推理和代码理解
- Cognition(Devin):规划性能提升
18%
,端到端评估得分提升12%
- Canva:帮助
2.4
亿用户在设计中发挥更大作用 - Figma Make:使原型设计更易于提示和迭代
技术细节
定价与可用性
一次加量不加价的更新,完美!!!
- API 调用:使用
claude-sonnet-4-5
- 定价:与
Claude Sonnet 4
保持一致,$3/百万输入 tokens,$15/百万输出 tokens - 可用性:已在所有平台上可用(Claude 应用、API、Claude Code)
性能基准
评测项目 | Claude Sonnet 4.5 | 说明 |
---|---|---|
SWE-bench Verified | 77.2% (标准) / 82.0% (高计算) | 真实软件编码能力 |
OSWorld | 61.4% | 真实计算机任务 |
Terminal-Bench | 领先 | 终端操作能力 |
AIME | 顶尖 | 数学推理 |
MMMLU | 优秀(14种语言) | 多语言理解 |
推理配置
- 标准配置:
200K thinking budget
- 高级配置:
1M
上下文配置(达到78.2%
) - 并行工具执行:通过并行执行多个
bash
命令等方式最大化每个上下文窗口的操作
行业影响与用户反馈
金融领域
Vals AI 评价:
"对于复杂的金融分析——风险、结构化产品、投资组合筛选——Claude Sonnet 4.5 配合思考功能能够提供投资级别的见解,需要更少的人工审查。"
法律领域
Thomson Reuters(CoCounsel)评价:
"Claude Sonnet 4.5 在最复杂的诉讼任务上达到了最先进水平,例如分析完整的简报周期并进行研究以综合优秀的法官意见初稿。"
网络安全
CrowdStrike 评价:
"Claude Sonnet 4.5 在红队测试方面展现出强大潜力,生成创造性的攻击场景,加速我们对攻击者策略的研究。"
实践建议
适用场景
- 复杂代码库重构:需要跨越多个文件和模块的大型重构任务
- 架构设计:从零开始设计系统架构,保持 30+ 小时的连贯性
- 代码审查与优化:深入理解代码逻辑,提供优化建议
- 文档生成:根据代码自动生成高质量技术文档
- 多语言项目:利用其出色的多语言能力处理国际化项目
最佳实践
- 充分利用上下文:
Claude Sonnet 4.5
支持大型上下文窗口,可以提供更多代码库信息 - 使用检查点功能:在
Claude Code
中设置检查点,方便回滚和实验 - 编写清晰的提示:虽然模型很强大,但清晰的需求描述仍然能带来更好的结果
- 结合工具使用:利用其工具调用能力,整合测试、部署等开发流程
展望未来
Claude Sonnet 4.5
的发布标志着 AI
辅助编程进入了一个新的阶段。它不仅仅是一个代码生成器,而是一个能够:
- 理解复杂业务逻辑
- 在大型代码库中保持连贯性
- 自主处理长时间任务
- 与各种开发工具无缝集成
的智能开发伙伴。
随着 Cursor
等主流开发工具的全面支持,以及 Claude Agent SDK
的开放,我们有理由相信,AI
将在软件开发的每个环节发挥越来越重要的作用。
关于你不知道的Cursor是一个系列,更多 Cursor
使用技巧也可关注公众号 AI近距离,也可加我微信 ai239Ni 拉你Cursor技术交流进群
系列历史文章
- 1. 如何使用Cursor同时开发多项目?
- 2. 你用 Cursor 写公司的代码安全吗?
- 3全网最全 Cursor 配置指南:从入门到高效工作流!建议收藏
- 4.你不知道的Cursor系列:使用 Cursor 不会这个超牛 MCP 还没用过吧!
- 5.你不知道的Cursor系列:再也不用死记硬背 Linux/Git等 命令,终端 Cmd+K 来帮你!
- 6.聊聊 Cursor 1.6 更新了什么有用的功能?
结语
Claude Sonnet 4.5
代表了当前 AI
编程助手的最高水平。无论你是使用 Cursor
的个人开发者,还是寻求提升团队生产力的企业,这个模型都值得尝试。
立即在你的开发工具中切换到 Claude Sonnet 4.5
,体验下一代 AI
编程助手的强大能力吧!