152 个模型按制造业排名。 评分包含以下额外加分: 视觉能力, reasoning (root cause analysis), JSON mode (structured reports), function calling (system integration)和large context.
| # | 模型 | 评分 |
|---|---|---|
| 1 | GPT-5.4 ProOpenAI | 92 |
| 2 | GPT-5.4OpenAI | 92 |
| 3 | GPT-5.2 ProOpenAI | 91 |
| 4 | Claude Opus 4.6 (Fast)Anthropic | 90 |
| 5 | Claude Opus 4.6Anthropic | 90 |
| 6 | GPT-5.2-CodexOpenAI | 90 |
| 7 | GPT-5.2OpenAI | 90 |
| 8 | Grok 4.20xAI | 89 |
| 9 | GPT-5.3-CodexOpenAI | 89 |
| 10 | GPT-5 ProOpenAI | 89 |
| 11 | Gemini 3 Flash PreviewGoogle | 88 |
| 12 | Grok 4xAI | 88 |
| 13 | GPT-5.1-Codex-MaxOpenAI | 88 |
| 14 | GPT-5 CodexOpenAI | 88 |
| 15 | GPT-5OpenAI | 88 |
| 16 | GPT-5.1OpenAI | 87 |
| 17 | GPT-5.1-CodexOpenAI | 87 |
| 18 | GPT-5.1-Codex-MiniOpenAI | 87 |
| 19 | o3 Deep ResearchOpenAI | 87 |
| 20 | o3 ProOpenAI | 87 |
| 21 | o3OpenAI | 87 |
| 22 | Claude Sonnet 4.6Anthropic | 85 |
| 23 | Claude Opus 4.5Anthropic | 85 |
| 24 | Grok 4.20 Multi-AgentxAI | 88 |
| 25 | Gemini 2.5 ProGoogle | 84 |
| 26 | Gemini 2.5 Pro Preview 06-05Google | 84 |
| 27 | Gemini 2.5 Pro Preview 05-06Google | 84 |
| 28 | GPT-5.3 ChatOpenAI | 87 |
| 29 | Claude Sonnet 4.5Anthropic | 82 |
| 30 | GPT-5.1 ChatOpenAI | 87 |
视觉模型检查产品缺陷、分析表面质量和分类异常。上传产线图像获取自动化检测报告。
分析传感器数据、振动模式和设备日志以预测故障。推理模型识别根本原因并推荐维护计划。
优化调度、资源分配和吞吐量。JSON模式生成与MES和ERP系统兼容的结构化生产计划。
生成标准操作程序、工作指导和合规文档。大上下文模型处理完整的规范文件和监管要求。
视觉模型检查产品缺陷、测量尺寸精度并从生产线图像分类质量等级。它们实现比人工检查更高的一致性。函数调用与MES和SCADA系统集成。
推理模型处理多约束的复杂排程。它们识别瓶颈、建议调度调整并生成产能规划的假设场景。
函数调用连接IoT传感器和设备监控系统。推理分析振动数据和温度趋势来预测故障。JSON模式输出结构化维护计划。
模型分析生产数据以识别浪费、变异和低效。它们建议改善措施、生成价值流图并计算OEE指标。