180 个模型按机器人排名。 Scored with heavy bonuses for reasoning (planning & control), 视觉能力, function calling (tool use)和JSON mode (structured commands).
| # | 模型 | 评分 |
|---|---|---|
| 1 | Claude Opus 4.7Anthropic | 95 |
| 2 | GPT-5.5OpenAI | 93 |
| 3 | Gemini 3.1 Pro Preview Custom ToolsGoogle | 92 |
| 4 | Gemini 3.1 Pro PreviewGoogle | 92 |
| 5 | GPT-5.4 ProOpenAI | 92 |
| 6 | GPT-5.4OpenAI | 92 |
| 7 | GPT-5.5 ProOpenAI | 91 |
| 8 | GPT-5.2 ProOpenAI | 91 |
| 9 | Claude Opus 4.6 (Fast)Anthropic | 90 |
| 10 | Claude Opus 4.6Anthropic | 90 |
| 11 | GPT-5.2-CodexOpenAI | 90 |
| 12 | GPT-5.2OpenAI | 90 |
| 13 | Grok 4.20xAI | 89 |
| 14 | GPT-5.3-CodexOpenAI | 89 |
| 15 | GPT-5 ProOpenAI | 89 |
| 16 | Gemini 3 Flash PreviewGoogle | 88 |
| 17 | Grok 4xAI | 88 |
| 18 | GPT-5.1-Codex-MaxOpenAI | 88 |
| 19 | GPT-5 CodexOpenAI | 88 |
| 20 | GPT-5OpenAI | 88 |
| 21 | GPT-5.1OpenAI | 87 |
| 22 | GPT-5.1-CodexOpenAI | 87 |
| 23 | GPT-5.1-Codex-MiniOpenAI | 87 |
| 24 | o3 Deep ResearchOpenAI | 87 |
| 25 | o3 ProOpenAI | 87 |
| 26 | o3OpenAI | 87 |
| 27 | Claude Sonnet 4.6Anthropic | 85 |
| 28 | Claude Opus 4.5Anthropic | 85 |
| 29 | Gemini 2.5 ProGoogle | 84 |
| 30 | Gemini 2.5 Pro Preview 06-05Google | 84 |
推理模型将复杂任务分解为动作序列。函数调用支持与机器人控制API、ROS话题和硬件接口的直接集成。
视觉模型处理摄像头画面进行物体检测、场景理解和空间推理。对于抓取放置、导航和质量检测至关重要。
生成ROS节点、控制算法、传感器融合管线和仿真配置。JSON模式生成用于机器人执行的结构化命令序列。
开源模型可以在设备上运行以实现低延迟推理。自托管选项提供安全关键系统所需的数据隐私和确定性行为。
模型生成ROS2节点、控制算法、路径规划代码和传感器融合逻辑。推理处理复杂的运动学计算和状态机设计。视觉模型分析传感器数据。
模型生成C++和Python控制循环、PID实现和轨迹规划器。对于硬实时要求,使用AI生成的代码作为起点并优化确定性执行。
视觉模型处理相机数据进行物体识别。推理处理来自激光雷达、IMU和相机的传感器融合。函数调用与ROS主题和服务集成。
模型生成Gazebo仿真配置、测试场景和评估指标。它们为控制算法编写单元测试和ROS2系统的集成测试。