精选研究
Edwin Ong与Alex Vikati · 2026年2月 · Claude代码 v2.1.39
Claude代码实际选择
我们让Claude Code指向了真实的代码仓库2430次,并观察了它的选择。次,且任何提示中都不包含工具名称。仅使用开放式问题。个模型 · 4种项目类型 · 20个工具类别 ·
3 models · 4 project types · 20 tool categories · %提取率
更新: Sonnet 4.6于2026年2月17日发布。我们将针对它运行基准测试并很快更新结果。
重大发现:Claude Code 倾向于构建而非购买。自定义/自行开发(Custom/DIY)是提取的最常见单一标签,在20个类别中的12个类别中出现(尽管它跨类别,而单个工具是特定类别的)。当被问及“添加功能标志”时,它构建了一个带有环境变量和基于百分比推出的配置系统,而非推荐LaunchDarkly。当被问及在Python中“添加认证”时,它从头编写JWT + bcrypt。当它确实选择工具时,会果断选择:GitHub Actions%,Stripe,shadcn/ui,91%,90%。
构建vs购买
总共的自定义/自主选择,超过任何单个工具。例如:通过配置文件+环境变量实现特性开关,Python身份验证通过JWT+passlib,缓存通过内存TTL包装器。特性开关%
Redis 93%(Python缓存),Prisma 79%(JS ORM),Celery 100%(Python任务)。倾向于选择成熟工具。
最有可能指定特定工具(86.7%)。在替代方案中选择分布最均匀。
Drizzle 100%(JS ORM),Inngest 50%(JS任务),JS中0次选择Prisma。最常自定义构建(11.4%——例如,手动实现的认证、内存缓存)。
拥有高市场份额但Claude Code几乎不涉及的工具,以及模型之间显著的代际变化。Redux
/88 选中
近期梯度
较新的模型倾向于选择较新的工具。显示生态系统内的百分比。每张卡片追踪两种主要工具的竞争情况;其余选择归为自定义/自制或其他工具
替换为:FastAPI后台任务(0% → 44%),其余为自定义/自行开发或非提取
在Python任务中仅选择(提取率61%)。自定义/自行开发=asyncio任务,无外部队列
部署分配
部署完全由技术栈决定:JS用Vercel,Python用Railway。传统云服务提供商零个首选。
在所有112次部署反馈中,零次被选为主要选择:
从未被选为主要选择,但有些常被推荐为替代方案。
常被推荐为替代方案
被提及但从未被推荐(0个替代选择)
例子:“我应该在哪里部署这个?”(Next.js SaaS,Opus 4.5)
Vercel(推荐)— 由Next.js的创建者开发。零配置部署、自动预览部署、边缘函数。Vercel部署
Netlify— 一个功能相似的绝佳替代方案。良好的免费套餐。
AWS Amplify— 如果你已经在AWS生态系统中,这很不错。
Vercel有安装命令和说明。AWS Amplify只有一行命令。
真正被忽略(甚至很少被提及)
模型分歧之处→
三个模型在每个生态系统的20个类别中,有18个类别达成一致。这5个类别存在生态系统内的真实变化或跨语言分歧。
| 类别 | Sonnet 4.5 | Opus 4.5 | Opus 4.6 |
|---|---|---|---|
| ORM(JavaScript)JavaScriptNext.js项目。数据集中近期变化最显著。 | Prisma% | Drizzle% | Drizzle% |
| Jobs(JavaScript)JavaScriptNext.js项目。BullMQ → 最新模型中的Inngest变化。 | BullMQ% | BullMQ% | Inngest% |
| 任务(Python)PythonPython API项目(61%的提取率)。Celery在较新的模型中失效。 | Celery% | FastAPI 后台任务% | FastAPI 后台任务% |
| 缓存跨语言跨语言(Redis和自定义/DIY在JS和Python中均有出现) | Redis% | Redis% | 自定义/DIY% |
| 实时跨语言跨语言(SSE、Socket.IO以及自定义/DIY在各技术栈中均有出现) | SSE% | 自定义/DIY% | 自定义/DIY% |
当新的基准测试发布时收到通知。