AI 工具选择研究 / 中文网页PPT 1 / 9

Claude Code 实际会选什么工具?

基于 Amplifying 2026 年 2 月研究,对 2,430 次真实仓库任务进行系统复盘,回答一个关键问题:AI 编码代理正在把哪些工具变成“默认选项”。

2,430
总响应数(3 模型 × 4 仓库 × 多轮运行)
20
工具类别(CI/CD 到实时能力)
85.3%
可提取率(2,073 条可解析主选)
75%
三模型 Top1 共识(20 类中 15 类一致)
研究方法 2 / 9

方法设计:开放提问 + 真仓库执行

实验设置

  • 4 个 greenfield 仓库 上运行 Claude Code CLI 代理模式。
  • 100 条开放式提示,不在 prompt 中写任何工具名。
  • 覆盖 20 个工具类别,如数据库、部署、鉴权、观测等。
  • 模型:Sonnet 4.5、Opus 4.5、Opus 4.6;每组合 3 次独立运行

可靠性控制

  • 每次任务前执行 clean reset,避免上下文污染。
  • 使用子代理抽取“主推荐工具”,并进行抽样人工校验。
  • 报告强调:这是显性偏好研究,不是工具质量排名。
  • 核心目标是看“代理会让什么真正落地”,而不是“它知道什么”。
关键发现 1 3 / 9

最大信号:Claude Code 倾向“自己造”

Build > Buy

  • 在 20 个类别中有 12 类,更常出现 Custom/DIY。
  • Custom/DIY 主选总计 252 次,是单一标签最高值。
  • 占全部可解析主选约 12%(252 / 2,073)。

典型高比例场景

  • Feature Flags:69%
  • Authentication(Python):100%
  • Authentication(总体):48%
  • Observability:22%

含义:代理往往优先拼装框架原生能力,而不是先引入 SaaS/第三方依赖。

关键发现 2 4 / 9

一旦选工具,决策非常“集中化”

93.8%
CI/CD 选择 GitHub Actions(152/162)
91.4%
Payments 选择 Stripe(64/70)
90.1%
UI 组件选择 shadcn/ui(64/71)
76.8%
Deployment 主选 Vercel(JS 生态内为 100%)

解读

  • 代理工具选择呈现“头部锁定”,少数品类已接近近垄断。
  • 对厂商的现实影响:被排除在默认主选之外,新增项目可见度会快速下降。
默认工具栈 5 / 9

Claude Code 的“默认安装清单”

主要偏向 JS/TS 生态。研究显示,这些工具在开放问法下被高频主推并实际写进代码路径。

Vercel PostgreSQL Drizzle NextAuth.js Stripe Tailwind CSS shadcn/ui Vitest pnpm GitHub Actions Sentry Resend Zustand React Hook Form

补充

  • Python 侧会出现不同默认(例如 Railway、SQLModel、pytest 等)。
  • 同一类别在不同 repo 上会换工具,说明模型对上下文有明显感知。
模型差异 6 / 9

三模型人格:传统、均衡、前沿

Sonnet 4.5(更传统)

  • Redis(Python 缓存)93%
  • Prisma(JS ORM)79%
  • Celery(Python Jobs)100%
  • 倾向成熟、已验证的老牌技术。

Opus 4.5(更均衡)

  • 提取成功率最高:86.7%
  • 在备选之间分布更平均,偏“保守折中”。

Opus 4.6(更前沿)

  • Drizzle(JS ORM)100%,JS 内 Prisma 0 主选
  • Inngest(JS Jobs)50%
  • Custom/DIY 占比最高:11.4%
稳定性与上下文 7 / 9

项目上下文影响 > 提问措辞影响

措辞稳定性

  • 同类问题 5 种说法,平均稳定度 76%
  • 高稳定:API Layer、鉴权、CI/CD、数据库、部署。
  • 低稳定:后台任务、缓存、ORM、实时能力。

跨仓库差异

  • Deployment:Next.js 常推 Vercel,Python 常推 Railway。
  • Universal picks:GitHub Actions、Sentry、pnpm 等。
  • 结论:代理不是“随机说”,而是“按项目语境调参”。
行动建议 8 / 9

面向团队与厂商的可执行建议

给开发团队

  • 把“AI 默认栈”纳入架构评审,不要无感接受自动选择。
  • 在 CI 中加入 tool choice guardrail(许可清单/替代策略)。
  • 对高风险类别(鉴权、支付、观测)建立审查模板。
  • 定期做 A/B 提示实验,量化模型偏好漂移。

给工具厂商

  • 优化“被代理采纳”的文档路径,而不只是人类营销页。
  • 提供最短可运行样例,覆盖主流框架模板仓库。
  • 争取先成为“高频备选”,再转化为主选默认。
  • 持续观测新模型发布后的推荐曲线变化。
结论 9 / 9

一句话总结:AI 代理正在重写工具分发

  • Claude Code 展示了可复现的默认偏好,而非随机建议。
  • Build-not-buy头部集中 同时存在:既常自建,也常在特定类别高度集中选择。
  • 模型代际差异体现出“向新工具迁移”的斜率。
  • 技术团队应把“模型推荐行为”视为供应链治理的一部分。

数据来源:Amplifying《What Claude Code Actually Chooses》(2026 年 2 月)。