各位老铁们,大家好,今天由我来为大家分享人类发布最强的代码型号Claude 4,以及的相关问题知识,希望对大家有所帮助。如果可以帮助到大家,还望关注收藏下本站,您的支持是我们最大的动力,谢谢大家了哈,下面我们开始吧!
在5月23日清晨,Anthropic推出了新一代语言模型,Claude Opus 4和Claude Sonnet 4,在第一次开发人员会议“与Claude的代码”会议上,在结构化推理,软件工程和自主代理行为等领域取得了重大进展。
现场没有灯光秀或精美的口号,首席执行官达里奥·阿莫迪(Dario Amodei)的关键是:
我们没有教AI编写代码,而是让它开始独立完成项目。
Claude 4在背景中完成了前所未有的任务演示:接收模糊目标将其自动拆卸到子任务中自动调用工具写入多模块代码启动自我测试。
克劳德(Claude)不再是被问到问题的模型,而是可以与目标,分配资源和交付的代理商。
(1)克劳德4
这两个新型号,Claude Opus 4和Claude Sonnet 4,进一步丰富了Claude 4家族。
这些模型可以分析大规模数据集,执行长周期任务并处理复杂的操作。
两种模型均针对编程任务进行了优化,适用于编写和编辑代码。
评估表明,有4个比3.7的10个百分点成为新国王。
此外,这两个模型都具有混合推理功能(二元模式),为短延迟的简短对话任务提供快速模式,以及用于需要深层推理和多个代理行为的复杂任务的扩展思维模式。
前者是针对公司用户的,而后者是针对个人的。
如何使用它?
付费用户只能使用Opus 4,而免费用户只能使用十四行诗4。

在拟人API上,每百万个输入/产出代币定价:
Opus 4是$ 15/$ 75十四行诗4是$ 3/$ 15
(2)Claude Opus 4
Claude Opus 4被定位为迄今为止拟人化的最强大模型,旨在处理复杂的推理过程和软件开发方案。
测试数据表明该模型是
SWE基础基准测试(解决实际GitHub问题)的准确率达到72.5;终端基台测试(多步终端代码生成任务)中的准确率达到43.2。
更引人注目的是,Opus 4在软件环境中表现出强烈的自主行为,这要归功于:
改善内存管理,更广泛的环境保留,更强大的内部计划机制
根据Rakuten测试数据,它可以连续执行近7个小时的代码生成和任务执行,为AI创造世界记录,远远超过了上一代Claude 3 Opus(少于1小时)。
(3)克劳德十四行诗4
平衡性能和成本的普遍选择
克劳德十四行诗4取代了上一代克劳德3.5十四行诗,以更稳定的体系结构提高速度和质量,同时并没有显着提高计算成本。该模型针对中期部署进行了优化,适用于需要成本和性能权衡的场景。尽管其推理能力不如Opus 4好,但SONNet 4继承了许多架构升级,支持多文件代码导航,中间工具使用和结构化文本处理,并执行更好的延迟。它成为Claude.ai的自由用户的默认模型,并通过API为轻型开发工具,用户助理和分析流程提供服务。
(4)新功能
新功能:

工具使用中的扩展思考(Extended Thinking):边思考边使用工具(比如网络搜索),同时根据任务需求在推理和工具使用之间自由切换
注意:直接在原型页面中添加一个提示单词并发布到公共网络,并且所有提示单词均被省略。
大量升级记忆能力
当Claude访问本地文件权限时,Opus 4会自动创建和维护“内存文件”,提取和保存关键信息,并在长期任务中保持连续性。
该官员甚至展示了克劳德在玩《精灵宝可梦》时所做的导航注释:
并行工具执行
多种工具同时运行,效率可以启动。
例如,让克劳德(Claude)生成清晰处理的任务,然后根据迅速单词要求将它们分解为四个并行任务,并分析任务依赖项以确定并行策略。
“自我约束”
这是一个不引人注目的功能,而是极为重要的:大型模型“知道不应该做什么”。
拟人化将Claude 4的安全水平定义为ASL-3,这是行为的最高内部标准之一。具体表现:
不要轻易进行快捷方式,不要随机猜测答案以完成任务;不要试图逃避过程,不要提供敏感的代码或可疑建议;在遇到逻辑冲突时,您将提醒用户,而不是为借口做出一个看似合理的答案。在拟人的评估中,克劳德4的“行为偏见”在代理方案中比十四行诗低65
该模型不仅变得更聪明,而且更值得信赖。很容易变得聪明,但是很难值得信赖。
克劳德代码

这次,Claude代码同时发布。
支持的功能:
VS代码和Jetbrains本质上集成了GitHub操作后端任务实时文件编辑显示可以使用可扩展的SDK显示,并集成GitHub,该github可以直接在PR中@Claude代码来维修CI代码。
(5)影响
Anthropic说:AI模型不是要消除工作,而是一种使日常工作自动化的工具。
但是,这有点不可思议。大型模型越强,裁员就越多。
Marktechpost Media认为,在Claude 4系列发布后,它将进一步改变AI的使用方式,从而使AI从辅助工具转换为完成单个任务的辅助工具,转换为具有更强和更广泛功能的“ AI同事”,并可以自动完成完整的工作。
Vibe编码将逐渐进入现实,同时将解雇初级和中级编码器,产品,测试等。
仍然有关于微软裁员的热情消息:
5月13日,微软宣布将在全球范围内裁员约6,000名员工,占总计228,000名员工的3,其中1,985人在华盛顿州被解雇,其中包括1,510名在办公室工作的人和475人远程工作。
这是自2023年10,000个裁员以来最大的裁员。
附录
标题:人类发布最强的代码型号Claude 4
链接:https://www.zhangqiushi.com/news/sypc/21256.html
版权:文章转载自网络,如有侵权,请联系删除!
用户评论
终于来了!一直在等Claude的升级,听说这次更新效果简直爆表啊,能写复杂程序居然还懂上下文?这也太厉害了吧!赶紧试试看!
有19位网友表示赞同!
代码生成一直是开发效率的关键,如果这Claude 4真如传所说效果爆炸,那对于程序员来说简直太棒了。期待体验一下,早日解放我们双手!
有17位网友表示赞同!
我以前用过的AI代码模型性能实在惨不忍睹,这次Anthropic发布的Claude 4终于能对标OpenAI了吗?真的希望能够真正提升开发效率,而不是沦为炒作噱头。
有7位网友表示赞同!
这已经是第四代了, Anthropic 可真能持续投入研发!期待一个开源版本,这样每个人都可以免费使用它来学习和研究代码生成技术。
有20位网友表示赞同!
我一直觉得AI写代码有很大的局限性,比如理解复杂的业务逻辑还是不如人意。这次Claude 4能否克服这些缺陷呢?让我看看它的真实水平吧!
有19位网友表示赞同!
看到文章说Claude 4在许多编程语言上都表现出色。希望它能支持多种开发环境和框架,这样我就可以更容易地使用它来提高工作效率了。
有11位网友表示赞同!
之前一直用OpenAI的模型,这次Anthropic出的Claude 4性能更好?还是得试试才能知道啦!说不定这就是我一直找的更强大,更高效的工具。
有12位网友表示赞同!
代码编写占据我的很多时间,期待 Claude 4 能帮我提高一些效率。不过我还需要看到它在实际应用中的表现,毕竟理论和实践是两种不同的东西。
有7位网友表示赞同!
感觉Anthropic在代码生成领域越来越强了!从Claude 1到Claude 4的进步很大,希望他们能继续突破,将AI技术应用得更广、更深。
有7位网友表示赞同!
我很激动 Claude 4 能更好地理解上下文和逻辑,这能够极大地提升代码的质量和可维护性。我迫不及待想要了解它的详细功能,并将其运用到我的项目中!
有12位网友表示赞同!
虽然我很期待 Claude 4 的开发能力,但我还是担心它可能会降低程序员的工作质量。我们不能依赖AI而忘记学习和思考的能力,这对于长远的发展更为重要。
有15位网友表示赞同!
我对 Anthropic 的这次发布感到很兴奋。我希望能看到一个更开放、可定制的 AI 代码生成模型。这样每个人都能根据自己的需求进行开发和改进。
有13位网友表示赞同!
代码写多了真的累啊,希望这个Claude 4能给我带来一些帮助。不过还是得看看它能否真正做到智能化,而不是简单的文字替代。
有19位网友表示赞同!
期待Claude 4能够成为一个强大而安全、可控的工具,为开发者提供高效和可靠的支持,同时也需要考虑其潜在的影响以及伦理问题。
有19位网友表示赞同!
代码生成模型虽然好,但还是得让人类在其中发挥主导作用。 AI不能完全替代人类的创造力和思维能力,这才是技术发展的真正意义。
有12位网友表示赞同!
Anthropic 的这次发布让我对未来AI发展充满了期待,同时也更加认识到 AI 技术本身并没有什么错,而关键在于如何正确地使用它!
有5位网友表示赞同!
以前我写代码时常常会遇到卡住的情况,希望Claude 4能够帮助我更快更高效地解决问题。尤其是在复杂项目的开发过程中,一个强大的AI助手将会变得越来越重要。
有11位网友表示赞同!
听说 Claude 4可以进行代码优化和调试?这对程序员来说可是福音啊!如果真的能做到,那可节省太久的时间了!
有14位网友表示赞同!