最佳数据分析AI模型

使用MMLU、MATH-500和GPQA基准测试分数对AI模型的数据分析能力进行排名。找到数据科学、分析和洞察的最佳LLM。

Last updated: 50m ago

第一名模型

评分: 85.7

平均评分

68.5

所有排名模型

已排名模型

有基准测试数据

权重：MMLU (40%)MATH-500 (30%)GPQA (30%)

Top Best for Data Analysis Models by Weighted Score

Top 15 models by weighted score

LMMarketCap.com

Benchmark Breakdown

Per-benchmark scores for top 10 models

MMLU

MATH-500

GPQA

LMMarketCap.com

#	模型	提供商	评分	MMLU	MATH-500	GPQA
1	o3OpenAI	OpenAI	85.7	92.3	99	--
2	GPT-5.4OpenAI	OpenAI	85.2	94	95.5	--
3	R1 0528DeepSeek	DeepSeek	84.8	91.5	97.8	--
4	o1OpenAI	OpenAI	84.4	91.8	96.4	--
5	GPT-5.2OpenAI	OpenAI	84.3	93.5	94	--
6	R1DeepSeek	DeepSeek	84.2	90.8	97.3	--
7	GPT-5.1OpenAI	OpenAI	84	93.2	93.5	--
8	GPT-5OpenAI	OpenAI	83.5	93	92.5	--
9	Gemini 2.5 ProGoogle	Google	83.4	90.8	95.2	--
10	o3 MiniOpenAI	OpenAI	82.5	86.9	97.9	--
11	Claude Opus 4.6Anthropic	Anthropic	82.3	92.1	90.5	--
12	DeepSeek V3 0324DeepSeek	DeepSeek	81.4	89.2	92	--
13	Claude Opus 4.5Anthropic	Anthropic	81	91.4	88.1	--
14	DeepSeek V3DeepSeek	DeepSeek	80.3	88.5	90.2	--
15	Claude Opus 4Anthropic	Anthropic	80	91	86	--
16	Claude Sonnet 4.6Anthropic	Anthropic	79.8	91.2	85.3	--
17	Gemini 3 Flash PreviewGoogle	Google	79.2	88	88	--
18	Claude Sonnet 4.5Anthropic	Anthropic	78.7	90.8	83	--
19	o4 MiniOpenAI	OpenAI	77.8	--	97.3	--
20	Claude Sonnet 4Anthropic	Anthropic	77.4	89.5	81.4	--
21	Gemini 2.5 FlashGoogle	Google	77.2	85.8	85.8	--
22	Llama 4 MaverickMeta	Meta	76.5	88	81	--
23	GPT-4.1OpenAI	OpenAI	76.2	89.2	78.5	--
24	GPT-4oOpenAI	OpenAI	75.2	88.7	76.6	--
25	Gemini 3.1 Pro PreviewGoogle	Google	74.1	92.6	--	--
26	Llama 3.3 70B InstructMeta	Meta	74.1	86.3	77	--
27	GPT-5.5OpenAI	OpenAI	73.9	92.4	--	--
28	GPT-5.5 ProOpenAI	OpenAI	73.9	92.4	--	--
29	Mistral LargeMistral AI	Mistral AI	72.9	84.7	76	--
30	GPT-4 TurboOpenAI	OpenAI	72.5	86.5	72.6	--
31	Claude Haiku 4.5Anthropic	Anthropic	71.4	84.5	72.5	--
32	DeepSeek V3.2DeepSeek	DeepSeek	70.8	88.5	--	--
33	Llama 3.1 70B InstructMeta	Meta	70.5	86	68	--
34	GPT-4o-miniOpenAI	OpenAI	69.2	82	70.2	--
35	Phi 4Microsoft	Microsoft	64.3	84.8	80.4	20.8
36	Llama 4 ScoutMeta	Meta	60.3	79.6	50.3	--
37	Gemma 2 27BGoogle	Google	60.2	75.2	--	--
38	Command R7B (12-2024)Cohere	Cohere	6.3	--	--	7.8
39	Llama 3.1 8B InstructMeta	Meta	5.9	--	--	7.4
40	Llama 3.2 3B InstructMeta	Meta	4.9	--	--	6.2
41	Qwen2.5 7B InstructAlibaba	Alibaba	4.4	--	--	5.5
42	Llama 3 8B InstructMeta	Meta	1.7	--	--	2.1