使用MMLU、MATH-500和GPQA基准测试分数对AI模型的数据分析能力进行排名。找到数据科学、分析和洞察的最佳LLM。
o4 Mini
评分: 97.3
69.8
所有排名模型
47
有基准测试数据
每个模型的评分是其可用基准测试结果的加权平均值。当模型缺少某些基准测试时,权重会在可用的基准测试之间重新归一化。 所有评分均为0-100的刻度。数据来源于官方模型卡片、已发表论文和第三方评估平台。
根据我们的基准测试分析,OpenAI的o4 Mini目前在Data Analysis领域排名第一,加权评分为97.3/100。
模型使用MMLU、MATH-500、GPQA基准测试分数的加权平均进行排名。所有分数均归一化到0-100的刻度。
我们目前对47个拥有相关基准测试数据的模型进行了Data Analysis任务排名。