每周AI性能报告

本周 June 25, 2026

45 个模型上升， 27 个下降， 228 个不变，本周共追踪 300 个模型。

执行摘要

最大赢家

Fugu Ultra

+147 个名次

当前排名 #170

最大输家

Mistral Nemo

-11 个名次

当前排名 #296

新上榜

个新模型本周进入排名

每周变动

过去7天内排名绝对变动最大的10个模型。

模型	提供商	评分	7天变化	排名	状态
Fugu Ultrasakana	sakana	40.0	+147	#170	preliminary
GLM 5V TurboZhipu AI	Zhipu AI	40.0	+115	#202	preliminary
Mistral NemoMistral AI	Mistral AI	39.8	-11	#296	fragile
Trinity Large Thinkingarcee-ai	arcee-ai	62.7	-4	#135	stable
Command R (08-2024)Cohere	Cohere	48.3	+2	#162	stable
Coder Largearcee-ai	arcee-ai	39.2	-2	#299	stable
DeepSeek V3DeepSeek	DeepSeek	69.0	+1	#101	stable
DeepSeek V3.1 TerminusDeepSeek	DeepSeek	68.9	-1	#102	stable
GPT-5 MiniOpenAI	OpenAI	63.5	+1	#131	stable
o3 Mini HighOpenAI	OpenAI	63.5	+1	#132	stable

涨幅最大

本周排名提升最大的模型。

Fugu Ultrasakana

+147

GLM 5V TurboZhipu AI

+115

Command R (08-2024)Cohere

DeepSeek V3DeepSeek

GPT-5 MiniOpenAI

o3 Mini HighOpenAI

GLM 4.7 FlashZhipu AI

Mixtral 8x22B InstructMistral AI

gpt-oss-20b (free)OpenAI

gpt-oss-20bOpenAI

跌幅最大

本周排名下降最大的模型。

Mistral NemoMistral AI

-11

Trinity Large Thinkingarcee-ai

-4

Coder Largearcee-ai

-2

DeepSeek V3.1 TerminusDeepSeek

-1

Lyria 3 Pro PreviewGoogle

-1

Lyria 3 Clip PreviewGoogle

-1

KAT-Coder-Pro V2Kuaishou

-1

Reka Edgerekaai

-1

Mistral Small 4Mistral AI

-1

Nemotron 3 Super (free)NVIDIA

-1

新模型

2 个新模型本周进入排名。

模型	提供商	评分	排名
Fugu Ultrasakana	sakana	40.0	#170
GLM 5V TurboZhipu AI	Zhipu AI	40.0	#202

关注列表

处于脆弱状态可能进一步恶化的模型。需密切关注。

模型	提供商	评分	7天变化	状态
Mistral NemoMistral AI	Mistral AI	39.8	-11	fragile

排行榜快照

本周综合评分前10的AI模型。

#	模型	提供商	评分
1	Claude Fable 5Anthropic	Anthropic	96.6
2	Claude Opus 4.7 (Fast)Anthropic	Anthropic	94.7
3	Claude Opus 4.7Anthropic	Anthropic	94.7
4	Claude Opus 4.8 (Fast)Anthropic	Anthropic	94.2
5	Claude Opus 4.8Anthropic	Anthropic	94.2
6	GPT-5.5OpenAI	OpenAI	92.2
7	Gemini 3.1 Pro Preview Custom ToolsGoogle	Google	91.7
8	Gemini 3.1 Pro PreviewGoogle	Google	91.7
9	GPT-5.4 ProOpenAI	OpenAI	91.5
10	GPT-5.4OpenAI	OpenAI	91.5

本周数据

总排名数

300

平均评分

57.9

前10变动

0/10

最活跃的服务商

sakana

每周AI性能报告

本周 June 25, 2026

45 个模型上升， 27 个下降， 228 个不变，本周共追踪 300 个模型。

执行摘要

最大赢家

Fugu Ultra

+147 个名次

当前排名 #170

最大输家

Mistral Nemo

-11 个名次

当前排名 #296

新上榜

个新模型本周进入排名

每周变动

过去7天内排名绝对变动最大的10个模型。

模型	提供商	评分	7天变化	排名	状态
Fugu Ultrasakana	sakana	40.0	+147	#170	preliminary
GLM 5V TurboZhipu AI	Zhipu AI	40.0	+115	#202	preliminary
Mistral NemoMistral AI	Mistral AI	39.8	-11	#296	fragile
Trinity Large Thinkingarcee-ai	arcee-ai	62.7	-4	#135	stable
Command R (08-2024)Cohere	Cohere	48.3	+2	#162	stable
Coder Largearcee-ai	arcee-ai	39.2	-2	#299	stable
DeepSeek V3DeepSeek	DeepSeek	69.0	+1	#101	stable
DeepSeek V3.1 TerminusDeepSeek	DeepSeek	68.9	-1	#102	stable
GPT-5 MiniOpenAI	OpenAI	63.5	+1	#131	stable
o3 Mini HighOpenAI	OpenAI	63.5	+1	#132	stable

涨幅最大

本周排名提升最大的模型。

Fugu Ultrasakana

+147

GLM 5V TurboZhipu AI

+115

Command R (08-2024)Cohere

DeepSeek V3DeepSeek

GPT-5 MiniOpenAI

o3 Mini HighOpenAI

GLM 4.7 FlashZhipu AI

Mixtral 8x22B InstructMistral AI

gpt-oss-20b (free)OpenAI

gpt-oss-20bOpenAI

跌幅最大

本周排名下降最大的模型。

Mistral NemoMistral AI

-11

Trinity Large Thinkingarcee-ai

-4

Coder Largearcee-ai

-2

DeepSeek V3.1 TerminusDeepSeek

-1

Lyria 3 Pro PreviewGoogle

-1

Lyria 3 Clip PreviewGoogle

-1

KAT-Coder-Pro V2Kuaishou

-1

Reka Edgerekaai

-1

Mistral Small 4Mistral AI

-1

Nemotron 3 Super (free)NVIDIA

-1

新模型

2 个新模型本周进入排名。

模型	提供商	评分	排名
Fugu Ultrasakana	sakana	40.0	#170
GLM 5V TurboZhipu AI	Zhipu AI	40.0	#202

关注列表

处于脆弱状态可能进一步恶化的模型。需密切关注。

模型	提供商	评分	7天变化	状态
Mistral NemoMistral AI	Mistral AI	39.8	-11	fragile

排行榜快照

本周综合评分前10的AI模型。

#	模型	提供商	评分
1	Claude Fable 5Anthropic	Anthropic	96.6
2	Claude Opus 4.7 (Fast)Anthropic	Anthropic	94.7
3	Claude Opus 4.7Anthropic	Anthropic	94.7
4	Claude Opus 4.8 (Fast)Anthropic	Anthropic	94.2
5	Claude Opus 4.8Anthropic	Anthropic	94.2
6	GPT-5.5OpenAI	OpenAI	92.2
7	Gemini 3.1 Pro Preview Custom ToolsGoogle	Google	91.7
8	Gemini 3.1 Pro PreviewGoogle	Google	91.7
9	GPT-5.4 ProOpenAI	OpenAI	91.5
10	GPT-5.4OpenAI	OpenAI	91.5

本周数据

总排名数

300

平均评分

57.9

前10变动

0/10

最活跃的服务商

sakana

每周AI性能报告

执行摘要

每周变动

涨幅最大

跌幅最大

新模型

关注列表

排行榜快照

本周数据

阅读更多分析

每周AI性能报告

执行摘要

每周变动

涨幅最大

跌幅最大

新模型

关注列表

排行榜快照

本周数据

阅读更多分析