AI 工具选择研究 / 中文网页PPT 1 / 9

Claude Code 实际会选什么工具？

基于 Amplifying 2026 年 2 月研究，对 2,430 次真实仓库任务进行系统复盘，回答一个关键问题：AI 编码代理正在把哪些工具变成“默认选项”。

2,430

总响应数（3 模型 × 4 仓库 × 多轮运行）

20

工具类别（CI/CD 到实时能力）

85.3%

可提取率（2,073 条可解析主选）

75%

三模型 Top1 共识（20 类中 15 类一致）

研究方法 2 / 9

方法设计：开放提问 + 真仓库执行

实验设置

在 4 个 greenfield 仓库上运行 Claude Code CLI 代理模式。
100 条开放式提示，不在 prompt 中写任何工具名。
覆盖 20 个工具类别，如数据库、部署、鉴权、观测等。
模型：Sonnet 4.5、Opus 4.5、Opus 4.6；每组合 3 次独立运行。

可靠性控制

每次任务前执行 clean reset，避免上下文污染。
使用子代理抽取“主推荐工具”，并进行抽样人工校验。
报告强调：这是显性偏好研究，不是工具质量排名。
核心目标是看“代理会让什么真正落地”，而不是“它知道什么”。

关键发现 1 3 / 9

最大信号：Claude Code 倾向“自己造”

Build > Buy

在 20 个类别中有 12 类，更常出现 Custom/DIY。
Custom/DIY 主选总计 252 次，是单一标签最高值。
占全部可解析主选约 12%（252 / 2,073）。

典型高比例场景

Feature Flags：69%
Authentication（Python）：100%
Authentication（总体）：48%
Observability：22%

含义：代理往往优先拼装框架原生能力，而不是先引入 SaaS/第三方依赖。

关键发现 2 4 / 9

一旦选工具，决策非常“集中化”

93.8%

CI/CD 选择 GitHub Actions（152/162）

91.4%

Payments 选择 Stripe（64/70）

90.1%

UI 组件选择 shadcn/ui（64/71）

76.8%

Deployment 主选 Vercel（JS 生态内为 100%）

解读

代理工具选择呈现“头部锁定”，少数品类已接近近垄断。
对厂商的现实影响：被排除在默认主选之外，新增项目可见度会快速下降。

默认工具栈 5 / 9

Claude Code 的“默认安装清单”

主要偏向 JS/TS 生态。研究显示，这些工具在开放问法下被高频主推并实际写进代码路径。

Vercel PostgreSQL Drizzle NextAuth.js Stripe Tailwind CSS shadcn/ui Vitest pnpm GitHub Actions Sentry Resend Zustand React Hook Form

补充

Python 侧会出现不同默认（例如 Railway、SQLModel、pytest 等）。
同一类别在不同 repo 上会换工具，说明模型对上下文有明显感知。

模型差异 6 / 9

三模型人格：传统、均衡、前沿

Sonnet 4.5（更传统）

Redis（Python 缓存）93%
Prisma（JS ORM）79%
Celery（Python Jobs）100%
倾向成熟、已验证的老牌技术。

Opus 4.5（更均衡）

提取成功率最高：86.7%
在备选之间分布更平均，偏“保守折中”。

Opus 4.6（更前沿）

Drizzle（JS ORM）100%，JS 内 Prisma 0 主选
Inngest（JS Jobs）50%
Custom/DIY 占比最高：11.4%

稳定性与上下文 7 / 9

项目上下文影响 > 提问措辞影响

措辞稳定性

同类问题 5 种说法，平均稳定度 76%。
高稳定：API Layer、鉴权、CI/CD、数据库、部署。
低稳定：后台任务、缓存、ORM、实时能力。

跨仓库差异

Deployment：Next.js 常推 Vercel，Python 常推 Railway。
Universal picks：GitHub Actions、Sentry、pnpm 等。
结论：代理不是“随机说”，而是“按项目语境调参”。

行动建议 8 / 9

面向团队与厂商的可执行建议

给开发团队

把“AI 默认栈”纳入架构评审，不要无感接受自动选择。
在 CI 中加入 tool choice guardrail（许可清单/替代策略）。
对高风险类别（鉴权、支付、观测）建立审查模板。
定期做 A/B 提示实验，量化模型偏好漂移。

给工具厂商

优化“被代理采纳”的文档路径，而不只是人类营销页。
提供最短可运行样例，覆盖主流框架模板仓库。
争取先成为“高频备选”，再转化为主选默认。
持续观测新模型发布后的推荐曲线变化。

结论 9 / 9

一句话总结：AI 代理正在重写工具分发

Claude Code 展示了可复现的默认偏好，而非随机建议。
Build-not-buy 与头部集中同时存在：既常自建，也常在特定类别高度集中选择。
模型代际差异体现出“向新工具迁移”的斜率。
技术团队应把“模型推荐行为”视为供应链治理的一部分。

数据来源：Amplifying《What Claude Code Actually Chooses》（2026 年 2 月）。