251 个模型按CI/CD排名。 评分包含以下额外加分: function calling (pipeline triggers), JSON mode (config files), reasoning (debugging builds), large context, 流式输出和web search.
| # | 模型 | 评分 |
|---|---|---|
| 1 | Claude Opus 4.7Anthropic | 95 |
| 2 | GPT-5.5OpenAI | 93 |
| 3 | Gemini 3.1 Pro Preview Custom ToolsGoogle | 92 |
| 4 | Gemini 3.1 Pro PreviewGoogle | 92 |
| 5 | GPT-5.4 ProOpenAI | 92 |
| 6 | GPT-5.4OpenAI | 92 |
| 7 | GPT-5.5 ProOpenAI | 91 |
| 8 | GPT-5.2 ProOpenAI | 91 |
| 9 | Claude Opus 4.6 (Fast)Anthropic | 90 |
| 10 | Claude Opus 4.6Anthropic | 90 |
| 11 | Grok 4.20xAI | 89 |
| 12 | GPT-5.3-CodexOpenAI | 89 |
| 13 | GPT-5 ProOpenAI | 89 |
| 14 | Gemini 3 Flash PreviewGoogle | 88 |
| 15 | Grok 4xAI | 88 |
| 16 | GPT-5.1-Codex-MaxOpenAI | 88 |
| 17 | GPT-5.2-CodexOpenAI | 90 |
| 18 | GPT-5.2OpenAI | 90 |
| 19 | o3 Deep ResearchOpenAI | 87 |
| 20 | o3 ProOpenAI | 87 |
| 21 | o3OpenAI | 87 |
| 22 | GPT-5 CodexOpenAI | 88 |
| 23 | GPT-5OpenAI | 88 |
| 24 | Claude Sonnet 4.6Anthropic | 85 |
| 25 | Claude Opus 4.5Anthropic | 85 |
| 26 | GPT-5.1OpenAI | 87 |
| 27 | GPT-5.1-CodexOpenAI | 87 |
| 28 | GPT-5.1-Codex-MiniOpenAI | 87 |
| 29 | DeepSeek V4 ProDeepSeek | 87 |
| 30 | Gemini 2.5 ProGoogle | 84 |
生成GitHub Actions、GitLab CI、Jenkins和CircleCI流水线配置。JSON模式产生有效的YAML兼容结构化输出。
分析构建日志、识别慢速步骤并建议缓存策略。推理模型评估并行化机会和依赖关系图。
创建部署脚本、回滚流程和蓝绿部署配置。函数调用支持与云服务商和镜像仓库集成。
生成Terraform、Pulumi和CloudFormation模板。模型理解资源依赖、状态管理和配置漂移检测。
AI可以分析构建失败、建议修复不稳定的测试、生成流水线配置并识别瓶颈。函数调用让模型能与CI API交互,以编程方式触发构建和读取日志。
具有推理能力的模型可以分析构建日志、识别失败根因并建议代码修复。结合函数调用读取日志和创建PR,可以半自动化修复流程。人工审查仍然必不可少。
JSON/YAML结构化输出生成有效的流水线配置。大上下文窗口可同时处理整个流水线定义和应用代码。推理处理多阶段部署的复杂条件逻辑。
模型分析流水线计时数据以识别并行化机会、不必要的步骤和缓存改进。它们可以重构单仓库构建图并建议测试拆分策略。