你不知道的 Cursor系列(四):Claude 4.5发布!Cursor 宣布加量不加价支持!

CursorClaudeClaude 4.5
External image

引言

人工智能在软件开发领域的应用正在经历一场前所未有的变革。Anthropic 最新发布的 Claude Sonnet 4.5 不仅是目前世界上最强大的编程模型,更是在推理、数学和复杂任务处理方面取得了重大突破。与此同时,主流 AI 编程工具 Cursor 已经全面支持这一最新模型,为开发者带来了更加强大的编程助手体验。

更多精彩Cursor开发技巧博客地址

关于 你不知道的Cursor 是一个系列,更多 Cursor 使用技巧也可关注公众号 AI近距离,也可加我微信 ai239Ni 拉你Cursor技术交流进群 系列历史文章

Claude Sonnet 4.5 核心特性

External image
External image

1. 世界级的编程能力

Claude Sonnet 4.5 在编程领域的表现令人瞩目:

  • SWE-bench Verified 评测冠军:在真实世界软件编码能力测试中取得了 77.2% 的成绩(标准配置),使用高计算配置更是达到了惊人的 82.0%

SWE-bench是一个国际上非常重要的权威测试,这个测试专门模拟解决真实世界里的软件工程问题

  • 超长任务专注力:能够在复杂的多步骤任务中保持超过 30 小时的专注度
  • 卓越的代码理解:在多步推理和代码库理解方面有显著提升,能够处理跨代码库的复杂任务

2. 计算机操作能力的飞跃

OSWorld 基准测试(测试 AI 模型在真实计算机任务上的表现)中:

  • Claude Sonnet 4.5 达到 61.4% 的领先成绩
  • 相比 4 个月前的 Sonnet 4(42.2%),提升了近 20 个百分点
  • 能够直接在浏览器中工作,导航网站、填充电子表格并完成任务

3. 推理与数学能力增强

  • AIME 数学竞赛:展现出色的数学推理能力
  • MMMLU 多语言理解:平均支持 14 种非英语语言,显示出强大的跨语言能力
  • 领域专业知识:在金融、法律、医学和 STEM 领域表现出显著提升的专业知识和推理能力

4. 最对齐的前沿模型

Claude Sonnet 4.5 不仅能力强大,更是 Anthropic 发布的最对齐的前沿模型:

  • 减少不良行为:大幅降低了阿谀奉承、欺骗、权力追求和鼓励妄想思维等问题行为
  • 防御提示注入攻击:在代理和计算机使用能力方面,对提示注入攻击的防御有了显著进展
  • ASL-3 安全保护:遵循 Anthropic 的责任扩展政策,配备了检测潜在危险输入和输出的分类器

Cursor 对 Claude Sonnet 4.5 的支持

集成优势

根据 Cursor CEO Michael Truell 的评价:

"我们看到 Claude Sonnet 4.5 展现出最先进的编程性能,在更长时间任务上有显著改进。这再次证明了为什么许多使用 Cursor 的开发者选择 Claude 来解决最复杂的问题。"

实际应用场景

使用 Cursor + Claude Sonnet 4.5 的开发者可以获得:

  1. 复杂架构设计:处理数月的复杂架构工作,同时在大型代码库中保持连贯性
  2. 代码库级别理解:学习代码库模式,提供精确的实现方案
  3. 从调试到架构的全流程:深入的上下文理解,转变开发速度
  4. 更低的错误率:在代码编辑任务上,错误率从 9% 降至 0%(Lovable 公司内部基准测试)

如何在 Cursor 中使用

Cursor 中,你现在可以直接选择使用 claude-sonnet-4-5 模型:

  1. 打开 Cursor 设置

  2. 在 AI Models 选项中选择 Claude Sonnet 4.5

External image
  1. agent使用时候选择 Claude Sonnet4.5,开始享受更强大的 AI 编程助手
External image

产品生态系统升级

本次升级,不只是模型,还有一系列产品升级, Anthropic 这次不只是发布了一个新模型。他们还升级了一整套工具,让 AI 变得更好用。

Claude Code 增强

  • 增加了检查点“Checkpoints”功能:保存进度并允许即时回滚到之前的状态
  • 终端界面刷新:更加流畅的交互体验
  • 发布原生 VS Code 扩展:开发者可以在自己熟悉的编辑器里,更方便地使用 Claude,无缝集成到开发工作流
  • 上下文编辑和内存工具:允许代理运行更长时间并处理更大的复杂度

Claude Agent SDK

Anthropic 开放了构建 Claude Code 所使用的基础设施:

  • 内存管理:代理如何在长时间运行任务中管理内存
  • 权限系统:平衡自主性与用户控制
  • 子代理协调:协调多个子代理朝着共同目标工作

开发者现在可以使用相同的基础设施来构建自己的 AI 代理。

其他应用集成

Claude Sonnet 4.5 已经被多个知名产品采用:

  • GitHub Copilot:显著改进多步推理和代码理解
  • Cognition(Devin):规划性能提升 18%,端到端评估得分提升 12%
  • Canva:帮助 2.4 亿用户在设计中发挥更大作用
  • Figma Make:使原型设计更易于提示和迭代

技术细节

定价与可用性

一次加量不加价的更新,完美!!!

  • API 调用:使用 claude-sonnet-4-5
  • 定价:与 Claude Sonnet 4 保持一致,$3/百万输入 tokens,$15/百万输出 tokens
  • 可用性:已在所有平台上可用(Claude 应用、API、Claude Code)

性能基准

评测项目Claude Sonnet 4.5说明
SWE-bench Verified77.2% (标准) / 82.0% (高计算)真实软件编码能力
OSWorld61.4%真实计算机任务
Terminal-Bench领先终端操作能力
AIME顶尖数学推理
MMMLU优秀(14种语言)多语言理解

推理配置

  • 标准配置200K thinking budget
  • 高级配置1M 上下文配置(达到 78.2%
  • 并行工具执行:通过并行执行多个 bash 命令等方式最大化每个上下文窗口的操作

行业影响与用户反馈

金融领域

Vals AI 评价:

"对于复杂的金融分析——风险、结构化产品、投资组合筛选——Claude Sonnet 4.5 配合思考功能能够提供投资级别的见解,需要更少的人工审查。"

法律领域

Thomson Reuters(CoCounsel)评价:

"Claude Sonnet 4.5 在最复杂的诉讼任务上达到了最先进水平,例如分析完整的简报周期并进行研究以综合优秀的法官意见初稿。"

网络安全

CrowdStrike 评价:

"Claude Sonnet 4.5 在红队测试方面展现出强大潜力,生成创造性的攻击场景,加速我们对攻击者策略的研究。"

实践建议

适用场景

  1. 复杂代码库重构:需要跨越多个文件和模块的大型重构任务
  2. 架构设计:从零开始设计系统架构,保持 30+ 小时的连贯性
  3. 代码审查与优化:深入理解代码逻辑,提供优化建议
  4. 文档生成:根据代码自动生成高质量技术文档
  5. 多语言项目:利用其出色的多语言能力处理国际化项目

最佳实践

  1. 充分利用上下文Claude Sonnet 4.5 支持大型上下文窗口,可以提供更多代码库信息
  2. 使用检查点功能:在 Claude Code 中设置检查点,方便回滚和实验
  3. 编写清晰的提示:虽然模型很强大,但清晰的需求描述仍然能带来更好的结果
  4. 结合工具使用:利用其工具调用能力,整合测试、部署等开发流程

展望未来

Claude Sonnet 4.5 的发布标志着 AI 辅助编程进入了一个新的阶段。它不仅仅是一个代码生成器,而是一个能够:

  • 理解复杂业务逻辑
  • 在大型代码库中保持连贯性
  • 自主处理长时间任务
  • 与各种开发工具无缝集成

的智能开发伙伴。

随着 Cursor 等主流开发工具的全面支持,以及 Claude Agent SDK 的开放,我们有理由相信,AI 将在软件开发的每个环节发挥越来越重要的作用。

更多精彩Cursor开发技巧博客地址

关于你不知道的Cursor是一个系列,更多 Cursor 使用技巧也可关注公众号 AI近距离,也可加我微信 ai239Ni 拉你Cursor技术交流进群 系列历史文章

结语

Claude Sonnet 4.5 代表了当前 AI 编程助手的最高水平。无论你是使用 Cursor 的个人开发者,还是寻求提升团队生产力的企业,这个模型都值得尝试。

立即在你的开发工具中切换到 Claude Sonnet 4.5,体验下一代 AI 编程助手的强大能力吧!

参考资料