Anthropic经济指数:AI对软件开发的影响 [转载]

159次阅读

共计 4222 个字符，预计需要花费 11 分钟才能阅读完成。

社会影响 · 经济研究

涉及计算机编程的工作在现代经济中只是一个很小的部分, 但却是极具影响力的领域。在过去几年里, 随着能够协助并自动化大量编码工作的 AI 系统的引入, 这一领域发生了巨大变化。

在我们之前的经济指数研究中, 我们发现美国从事计算机相关职业的工作者对 Claude 的使用比例极高: 也就是说, 关于计算机相关任务与 Claude 的对话数量远超根据相关工作岗位人数预测的数量。在教育领域也是如此: 涉及大量编码的计算机科学学位显示出极高的 AI 使用率。

为了更详细地了解这些变化, 我们对 Claude.ai(大多数人与 Claude 交互的 "默认" 方式)和 Claude Code(我们新的专业编码 "智能体", 可以使用各种数字工具独立完成一系列复杂任务)上的 50 万次编码相关交互进行了分析。

我们发现了三个关键模式:

编码智能体用于更多自动化。 Claude Code 上 79% 的对话被识别为 "自动化"——即 AI 直接执行任务——而非 "增强", 即 AI 与人类协作并增强人类能力 (21%)。相比之下,Claude.ai 上只有 49% 的对话被归类为自动化。 这可能意味着, 随着 AI 智能体变得更加普遍, 以及构建更多智能体 AI 产品, 我们应该预期会有更多任务自动化。
程序员普遍使用 AI 构建面向用户的应用。 JavaScript 和 HTML 等 Web 开发语言是我们数据集中最常用的编程语言, 用户界面和用户体验任务是最主要的编码用途之一。这表明, 专注于制作简单应用程序和用户界面的工作可能比纯后端工作更早受到 AI 系统的冲击。
初创公司是 Claude Code 的主要早期采用者, 而企业落后。 在初步分析中, 我们估计 Claude Code 上 33% 的对话服务于初创公司相关工作, 相比之下只有 13% 被识别为企业相关应用。这种采用差距表明, 灵活的组织使用尖端 AI 工具与传统企业之间存在差距。

我们如何分析 Claude Code 和 Claude.ai 上的对话

我们使用隐私保护分析工具分析了总计 50 万次 Claude 交互(分布在 Claude Code 和 Claude.ai 上), 该工具将用户对话提炼为更高层次的匿名化洞察。在这里, 我们用它来识别对话主题(例如 "UI/UX 组件开发"), 或者——正如我们下面将解释的——将对话归类为专注于 "增强" 还是 "自动化"。

开发者如何与 Claude 交互?

在我们之前的经济指数报告中, 我们将 AI 直接执行任务的 "自动化" 与 AI 与用户协作执行任务的 "增强" 区分开来。在这里, 我们发现 Claude Code 显示出明显更高的自动化率——79% 的对话涉及某种形式的自动化, 而 Claude.ai 上为 49%。

我们还将自动化和增强分为几个子类型 (如我们之前的工作中所讨论的)。"反馈循环" 模式, 即 Claude 在人类验证的帮助下自主完成任务 (例如, 用户将任何错误发送回 Claude), 在 Claude Code 上(35.8% 的交互) 几乎是 Claude.ai(21.3%)的两倍。"指令式" 对话, 即 Claude 在最少用户交互的情况下完成任务, 在 Claude Code 上也更高(43.8%, 而 Claude.ai 上为 27.5%)。所有增强模式——包括用户从 AI 模型获取知识的 "学习"——在 Claude Code 上都明显低于 Claude.ai。

子类型定义如下。指令式: 完全任务委托, 交互最少; 反馈循环: 由环境反馈引导的任务完成; 任务迭代: 协作改进过程; 学习: 知识获取和理解; 验证: 工作验证和改进。

这些结果说明了专业的、以编码为重点的智能体 (在本例中为 Claude Code) 与用户与大型语言模型交互的更 "标准" 方式 (即通过像 Claude.ai 这样的聊天机器人界面) 之间的差异。随着更多智能体产品的发布, 我们可能会看到 AI 融入人们工作方式的差异。至少在编码方面, 这可能涉及更多任务自动化。

这引发了关于随着 AI 使用变得更加普遍, 开发者仍将在多大程度上参与的问题。重要的是, 我们的结果确实表明, 即使在自动化中, 人类仍然非常频繁地参与:"反馈循环" 交互仍然需要用户输入(即使该输入只是将错误消息粘贴回 Claude)。但这种模式是否会持续到未来并不确定, 届时更强大的智能体系统可能需要越来越少的用户输入。

开发者在用 Claude 构建什么?

总体而言, 我们发现开发者通常使用 Claude 为网站和移动应用程序构建用户界面和交互元素。虽然没有单一语言占主导地位, 但主要面向 Web 的开发语言 JavaScript 和 TypeScript 合计占所有查询的 31%, 而 HTML 和 CSS(用于面向用户代码的其他语言)合计又增加了 28%。

百分比表示两个平台上编码相关任务的总百分比。由于 Claude Code 和 Claude.ai 权重相等, 对应于每个平台的条形部分代表该平台使用量的一半。

后端开发语言 (用于后台逻辑、数据库和基础设施, 以及 API 和 AI 开发) 也有体现: 值得注意的是,Python 占查询的 14%。然而,Python 具有双重用途——既用于后端开发, 也用于数据分析。与 SQL(另一种以数据为重点的语言, 占查询的 6%)结合, 这些语言可能包括许多超越传统后端开发的数据科学和分析应用。

编码语言使用的百分比表示两个平台上的总百分比。由于 Claude Code 和 Claude.ai 权重相等, 对应于每个平台的条形部分代表该平台使用量的一半。

这些模式进一步扩展到涉及 Claude 的常见编码任务类型。前五大任务中有两个专注于面向用户的应用开发:"UI/UX 组件开发" 和 "Web 和移动应用开发" 分别占对话的 12% 和 8%。这些任务越来越适合一种被称为 "氛围编码" 的现象——各种经验水平的开发者用自然语言描述他们想要的结果, 让 AI 处理实现细节。

与更通用用途相关的对话, 如 "软件架构和代码设计" 以及 "调试和性能优化", 在 Claude.ai 和 Claude Code 中也占很大比例。

推测来看, 这些发现表明, 如果不断提高的能力使 "氛围编码" 更多地进入主流工作流程, 那么专注于制作简单应用程序和用户界面的工作可能会更早受到 AI 系统的冲击。随着 AI 越来越多地处理组件创建和样式任务, 这些开发者可能会转向更高层次的设计和用户体验工作。

谁在使用 Claude 进行编码?

我们还分析了哪些开发者群体可能在使用 Claude。我们使用分析系统来识别最能描述用户编码相关交互的项目类型(例如个人项目与为初创公司完成的项目)。由于我们不知道 Claude 响应被使用的真实世界背景, 这些分析依赖于从不完整数据中得出的不确定推断。因此, 我们将这些发现视为比上述发现更初步的结果。

点之间的距离表示每种项目类型在 Claude.ai(蓝色)和 Claude Code(橙色)上流行程度的差距。

初创公司似乎是 Claude Code 的主要早期采用者, 企业采用落后。初创公司工作占 Claude Code 对话的 32.9%(比 Claude.ai 的使用率高近 20%), 而企业工作仅占 Claude Code 对话的 23.8%(略低于 Claude.ai 的 25.9%)。

此外, 涉及学生、学者、个人项目构建者和教程 / 学习用户的使用总共代表了两个平台上一半的交互。换句话说, 个人——而不仅仅是企业——是编码辅助工具的重要采用者。

这些采用模式反映了过去的技术转变, 其中初创公司使用新工具获得竞争优势, 而老牌组织行动更谨慎, 在全公司范围内采用新工具之前通常会进行详细的安全检查。AI 的通用性质可能会加速这一动态: 如果 AI 智能体提供显著的生产力提升, 早期采用者和晚期采用者之间的差距可能转化为实质性的竞争优势。

局限性

我们的分析基于真实世界的 AI 使用——开发者在工作流程中实际如何使用 Claude。虽然这种方法使我们的发现具有实际相关性, 但它也带来了固有的局限性。这些包括:

我们仅分析了 Claude.ai 和 Claude Code 的数据。我们排除了团队版、企业版和 API 使用, 这些可能显示出不同的模式, 特别是在专业环境中;
对于像 Claude Code 这样的智能体工具, 自动化和增强之间的界限变得越来越模糊。例如,"反馈循环" 模式在质量上与传统自动化不同, 因为它仍然需要用户监督和输入。我们可能需要扩展自动化 / 增强框架以考虑新的智能体能力;
我们对谁在使用 Claude 进行编码的分类依赖于从有限上下文中的推断。在将对话归类为 "初创公司" 与 "企业" 工作, 或 "个人" 与 "学术" 项目时, 我们的分析工具根据不完整信息做出了有根据的猜测。因此, 某些分类可能不正确。此外, 我们包含了 "无法分类" 选项,Claude 在 5% 的 Claude.ai 对话和 2% 的 Claude Code 对话中选择了该选项。我们从分析中排除了这一类别并重新标准化了结果;
我们的数据集可能捕获了早期采用者。这些用户可能不代表更广泛的开发者群体, 这种自我选择可能使使用模式偏向更有经验或技术上更冒险的用户;
出于隐私考虑, 我们仅分析了特定保留窗口内的数据, 可能错过了软件开发中的周期性模式(如冲刺周期或发布时间表);
相对于整体 AI 编码辅助采用情况,Claude 使用的代表性尚不清楚。许多开发者使用 Claude 之外的多种 AI 工具, 这意味着我们只呈现了他们 AI 参与模式的部分视图;
我们只研究了开发者委托给 AI 的内容——而不是他们最终如何在代码库中使用 AI 输出、生成代码的质量, 或这些交互是否有效提高了生产力或代码质量。

展望未来

AI 正在从根本上改变开发者的工作方式。我们的分析表明, 当使用像 Claude Code 这样的专业智能体系统时尤其如此, 对于面向用户的应用开发工作特别强, 并且可能为初创公司而非更成熟的商业企业提供特定优势。

我们的发现引发了许多问题。随着 AI 能力的提高,"反馈循环"(人类仍然参与过程)的普遍性会持续存在, 还是我们会看到向更完全自动化的转变? 随着 AI 系统能够构建更大规模的软件, 开发者是否会转向主要管理和指导这些系统, 而不是自己编写代码? 哪些软件开发角色将变化最大, 哪些可能完全消失?

AI 不断提高的编码技能对 AI 开发本身也可能特别重要。由于 AI 研究和开发在很大程度上依赖于软件,AI 辅助编码的进步可能有助于加速突破, 创造一个正强化循环, 进一步加速 AI 进步。

从大局来看,AI 系统极其新颖。但从相对意义上讲, 编码是经济中 AI 最发达的用途之一。这使它值得关注。虽然我们不能假设从软件开发中得出的经验教训会直接延续到其他类型的职业, 但软件开发可能是一个领先指标, 为我们提供有关随着未来越来越强大的 AI 模型的推出, 其他职业可能如何变化的有用信息。

正文完

发表至： ai

2025-12-23

1

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

AI 代码指南 [转载]

2025：大语言模型（LLM）之年

Anthropic经济指数:AI对软件开发的影响 [转载]

Claude Code 子代理（Subagents）完全学习指南

Kubernetes 的 Pod 驱逐策略