183 个模型按科学排名。 评分包含以下额外加分: reasoning (complex analysis), large context (papers), 视觉能力, 网页搜索和JSON mode (structured data).
| # | 模型 | 评分 |
|---|---|---|
| 1 | Claude Opus 4.7 (Fast)Anthropic | 95 |
| 2 | Claude Opus 4.7Anthropic | 95 |
| 3 | GPT-5.5OpenAI | 93 |
| 4 | Gemini 3.1 Pro Preview Custom ToolsGoogle | 92 |
| 5 | Gemini 3.1 Pro PreviewGoogle | 92 |
| 6 | GPT-5.4 ProOpenAI | 92 |
| 7 | GPT-5.4OpenAI | 92 |
| 8 | GPT-5.5 ProOpenAI | 91 |
| 9 | GPT-5.2 ProOpenAI | 91 |
| 10 | Claude Opus 4.6 (Fast)Anthropic | 90 |
| 11 | Claude Opus 4.6Anthropic | 90 |
| 12 | Grok 4.20xAI | 89 |
| 13 | GPT-5.3-CodexOpenAI | 89 |
| 14 | GPT-5 ProOpenAI | 89 |
| 15 | Gemini 3 Flash PreviewGoogle | 88 |
| 16 | Grok 4xAI | 88 |
| 17 | Grok 4.20 Multi-AgentxAI | 88 |
| 18 | GPT-5.1-Codex-MaxOpenAI | 88 |
| 19 | GPT-5.2-CodexOpenAI | 90 |
| 20 | GPT-5.2OpenAI | 90 |
| 21 | o3 Deep ResearchOpenAI | 87 |
| 22 | o3 ProOpenAI | 87 |
| 23 | o3OpenAI | 87 |
| 24 | Claude Sonnet 4.6Anthropic | 85 |
| 25 | Claude Opus 4.5Anthropic | 85 |
| 26 | GPT-5 CodexOpenAI | 88 |
| 27 | GPT-5OpenAI | 88 |
| 28 | GPT-5.1OpenAI | 87 |
| 29 | GPT-5.1-CodexOpenAI | 87 |
| 30 | GPT-5.1-Codex-MiniOpenAI | 87 |
大上下文模型(128K+)可以处理完整的研究论文。结合推理能力,提取关键发现、识别方法论漏洞并综合多个来源。
视觉模型分析图表、曲线图和实验图像。推理模型进行复杂的统计分析,帮助研究人员验证发现并发现模式。
推理模型帮助设计实验、识别混杂变量和建议对照组。网页搜索确保研究了解最新发表的方法和协议。
大输出模型起草具有适当结构的科学论文章节。模型审查草稿的逻辑一致性、建议改进并与当前文献进行对照。
模型执行文献综述、生成假设、设计实验和分析结果。网络搜索访问最新出版物。推理处理复杂的科学推理和数学推导。
模型起草方法、结果和讨论部分。它们格式化引用、生成摘要和构建论证。大输出生成完整草稿。应根据原始来源验证主张。
推理用于数学建模和算法设计。代码生成用于仿真脚本。大上下文用于同时处理数据集和多篇论文。
模型执行统计分析、生成可视化、识别异常值并建议额外实验。推理帮助在现有文献背景下解释结果。