#	模型	提供商	评分	$/百万输出	上下文
1	Claude Fable 5Anthropic	Anthropic	97	$50.00	1M
2	Claude Opus 4.7 (Fast)Anthropic	Anthropic	95	$150.00	1M
3	Claude Opus 4.7Anthropic	Anthropic	95	$25.00	1M
4	Claude Opus 4.8 (Fast)Anthropic	Anthropic	94	$50.00	1M
5	Claude Opus 4.8Anthropic	Anthropic	94	$25.00	1M
6	GPT-5.5OpenAI	OpenAI	92	$30.00	1.1M
7	Gemini 3.1 Pro Preview Custom ToolsGoogle	Google	92	$12.00	1.0M
8	Gemini 3.1 Pro PreviewGoogle	Google	92	$12.00	1.0M
9	GPT-5.4 ProOpenAI	OpenAI	92	$180.00	1.1M
10	GPT-5.4OpenAI	OpenAI	92	$15.00	1.1M
11	GPT-5.5 ProOpenAI	OpenAI	90	$180.00	1.1M
12	GPT-5.2-CodexOpenAI	OpenAI	90	$14.00	400K
13	GPT-5.2 ProOpenAI	OpenAI	90	$168.00	400K
14	GPT-5.2OpenAI	OpenAI	90	$14.00	400K
15	Claude Opus 4.6 (Fast)Anthropic	Anthropic	90	$150.00	1M
16	Claude Opus 4.6Anthropic	Anthropic	90	$25.00	1M
17	Grok 4.20xAI	xAI	88	$2.50	2M
18	GPT-5.3-CodexOpenAI	OpenAI	88	$14.00	400K
19	GPT-5 ProOpenAI	OpenAI	88	$120.00	400K
20	GPT-5 CodexOpenAI	OpenAI	88	$10.00	400K
21	GPT-5OpenAI	OpenAI	88	$10.00	400K
22	Gemini 3 Flash PreviewGoogle	Google	88	$3.00	1.0M
23	GPT-5.1-Codex-MaxOpenAI	OpenAI	87	$10.00	400K
24	GPT-5.1OpenAI	OpenAI	87	$10.00	400K
25	GPT-5.1-CodexOpenAI	OpenAI	87	$10.00	400K
26	GPT-5.1-Codex-MiniOpenAI	OpenAI	87	$2.00	400K
27	o3 Deep ResearchOpenAI	OpenAI	86	$40.00	200K
28	o3 ProOpenAI	OpenAI	86	$80.00	200K
29	o3OpenAI	OpenAI	86	$8.00	200K
30	DeepSeek V4 ProDeepSeek	DeepSeek	86	$0.87	1.0M

AI调试应用场景

分析错误消息、日志和代码上下文以识别底层问题。推理模型擅长从症状追溯到根本原因，解释Bug为什么发生而不仅仅是出了什么问题。

解析复杂堆栈跟踪并识别关键调用链。大上下文窗口（128K+）让模型处理完整的日志文件和相关源代码。推理模型可以跟踪执行流程并定位逻辑偏离预期的位置。

关联日志文件中的事件、识别故障模式并发现时序问题。流式传输让您实时查看调试步骤。JSON模式支持提取相关日志条目的结构化数据，用于下游分析或事件跟踪。

比较代码差异与失败测试，识别引入回归的更改。函数调用支持与版本控制和CI/CD系统集成以自动获取上下文。推理帮助解释更改如何导致故障。

AI调试工具