Context Window Efficiency Explorer

Analyzes score-per-context-token ratio across 299 AI models to find those that make the best use of their context window, output capacity, and cost.

Context Window vs Score

LMMarketCap.com

Efficiency Overview

Key efficiency metrics across all analyzed models.

Most Efficient (128K+)

GPT-5.3 Chat

679.7 score/MToken

Best Output Efficiency

Gemma 2 27B

37.6 score/1K output

Best Cost Efficiency

Ling-2.6-flash

2000.0 score/$

Avg Overall Efficiency

6.0%

normalized across all models

Efficiency Rankings

Top 50 models ranked by score per million context tokens.

#	Model	Provider	Score	Context	Output	Score/MToken	Output Eff.	Cost Eff.	Tier
1	ALLaM 2 7B InstructHUMAIN	HUMAIN	40	4K	4K	9765.6	9.8	Free	Small
2	ALLaM 34BHUMAIN	HUMAIN	40	4K	4K	9765.6	9.8	Free	Small
3	GPT-3.5 Turbo (older v0613)OpenAI	OpenAI	39	4K	4K	9621.5	9.6	26.3	Small
4	Gemma 2 27BGoogle	Google	77	8K	2K	9411.6	37.6	118.6	Small
5	ALLaM 7B Instruct (preview)HUMAIN	HUMAIN	38	4K	4K	9375.0	9.4	Free	Small
6	GPT-4OpenAI	OpenAI	65	8K	4K	7874.5	15.7	1.4	Small
7	Phi 4Microsoft	Microsoft	60	16K	16K	3656.0	3.7	570.5	Small
8	Reka Edgerekaai	rekaai	40	16K	16K	2441.4	2.4	400.0	Small
9	GPT-3.5 Turbo 16kOpenAI	OpenAI	40	16K	4K	2441.3	9.8	11.4	Small
10	GPT-3.5 TurboOpenAI	OpenAI	40	16K	4K	2441.3	9.8	40.0	Small
11	Voxtral Small 24B 2507Mistral AI	Mistral AI	40	32K	--	1250.0	--	200.0	Medium
12	Perceptron Mk1perceptron	perceptron	40	33K	8K	1220.7	4.9	48.5	Medium
13	LFM2.5-1.2B-Thinking (free)Liquid AI	Liquid AI	40	33K	--	1220.7	--	Free	Medium
14	LFM2.5-1.2B-Instruct (free)Liquid AI	Liquid AI	40	33K	--	1220.7	--	Free	Medium
15	Gemma 3n 4BGoogle	Google	40	33K	--	1220.7	--	444.4	Medium
16	SabaMistral AI	Mistral AI	40	33K	--	1220.7	--	100.0	Medium
17	Mistral Small 3Mistral AI	Mistral AI	40	33K	16K	1220.7	2.4	615.4	Medium
18	Falcon Arabic 7B InstructTII	TII	40	33K	8K	1220.7	4.9	Free	Medium
19	Falcon3 10B InstructTII	TII	40	33K	8K	1220.7	4.9	Free	Medium
20	Falcon3 7B InstructTII	TII	40	33K	8K	1220.7	4.9	Free	Medium
21	Coder Largearcee-ai	arcee-ai	39	33K	--	1199.3	--	60.5	Medium
22	MiniMax M2-herMiniMax	MiniMax	69	66K	2K	1049.8	33.6	91.7	Medium
23	Mixtral 8x22B InstructMistral AI	Mistral AI	63	66K	--	961.3	--	15.8	Medium
24	GLM 4.5VZhipu AI	Zhipu AI	62	66K	16K	946.0	3.8	51.7	Medium
25	Olmo 3 32B ThinkAllen AI	Allen AI	55	66K	66K	831.6	0.8	167.7	Medium
26	GPT-5.3 ChatOpenAI	OpenAI	87	128K	16K	679.7	5.3	11.0	Large
27	GPT-5.1 ChatOpenAI	OpenAI	86	128K	32K	673.4	2.7	15.3	Large
28	DeepSeek V3.2DeepSeek	DeepSeek	81	131K	64K	616.5	1.3	282.5	Large
29	Reka Flash 3rekaai	rekaai	40	66K	66K	610.4	0.6	266.7	Medium
30	GPT-5.2 ChatOpenAI	OpenAI	77	128K	16K	600.0	4.7	9.8	Large
31	GLM 4.5Zhipu AI	Zhipu AI	75	131K	98K	569.9	0.8	53.4	Large
32	GPT-4o (2024-08-06)OpenAI	OpenAI	71	128K	16K	553.1	4.3	11.3	Large
33	GPT-4o (2024-05-13)OpenAI	OpenAI	71	128K	4K	553.1	17.3	7.1	Large
34	GPT-4oOpenAI	OpenAI	71	128K	16K	553.1	4.3	11.3	Large
35	GPT-5 ChatOpenAI	OpenAI	70	128K	16K	548.4	4.3	12.5	Large
36	GPT-4o Search PreviewOpenAI	OpenAI	70	128K	16K	546.9	4.3	11.2	Large
37	GPT-4o-miniOpenAI	OpenAI	69	128K	16K	538.3	4.2	183.7	Large
38	GLM 4.5 AirZhipu AI	Zhipu AI	70	131K	98K	536.3	0.7	143.5	Large
39	DeepSeek V3DeepSeek	DeepSeek	69	131K	16K	526.4	4.3	138.0	Large
40	GPT-4 TurboOpenAI	OpenAI	66	128K	4K	518.0	16.2	3.3	Large
41	Qwen3 VL 235B A22B ThinkingAlibaba	Alibaba	67	131K	33K	513.5	2.1	47.1	Large
42	Mistral LargeMistral AI	Mistral AI	66	128K	--	511.7	--	16.4	Large
43	Llama 3.3 70B InstructMeta	Meta	66	131K	16K	506.6	4.1	316.2	Large
44	Llama 3.3 70B Instruct (free)Meta	Meta	66	131K	--	499.7	--	Free	Large
45	GLM 4.6VZhipu AI	Zhipu AI	65	131K	33K	496.7	2.0	108.5	Large
46	Llama 3.1 70B InstructMeta	Meta	65	131K	16K	495.1	4.0	162.3	Large
47	Qwen3 30B A3B Thinking 2507Alibaba	Alibaba	64	131K	131K	486.0	0.5	265.4	Large
48	Qwen3 30B A3BAlibaba	Alibaba	64	131K	16K	486.0	3.9	205.5	Large
49	R1 0528DeepSeek	DeepSeek	79	164K	33K	482.2	2.4	59.6	Large
50	Mercury 2Inception	Inception	61	128K	50K	472.7	1.2	121.0	Large

Tier Analysis

Efficiency breakdown across context window tiers.

Small10 models

Avg Score48

Score/MToken6679.4

Best

ALLaM 2 7B Instruct

Worst

GPT-3.5 Turbo 16k

Medium17 models

Avg Score45

Score/MToken1067.6

Best

Voxtral Small 24B 2507

Worst

Sonar

Large201 models

Avg Score57

Score/MToken307.7

Best

GPT-5.3 Chat

Worst

GPT Chat Latest

Mega71 models

Avg Score64

Score/MToken60.9

Best

Claude Fable 5

Worst

Llama 4 Scout

Diminishing Returns Analysis

Are bigger context windows correlated with higher scores?

Diminishing returns detected: Larger context windows do not always correlate with higher average scores.

Tier	Avg Context	Avg Score	Avg Efficiency
Small	10K	48	6679.4
Medium	48K	45	1067.6
Large	208K	57	307.7
Mega	1.2M	64	60.9

Output Token Efficiency

Top 20 models by output efficiency (score per 1K output tokens). Models with 16K+ output tokens are highlighted.

Model	Provider	Score	Max Output	Output Eff.
Gemma 2 27BGoogle	Google	77	2K	37.6
MiniMax M2-herMiniMax	MiniMax	69	2K	33.6
UI-TARS 7B ByteDance	ByteDance	40	2K	19.5
GPT-4o (2024-05-13)OpenAI	OpenAI	71	4K	17.3
GPT-4 TurboOpenAI	OpenAI	66	4K	16.2
GPT-4OpenAI	OpenAI	65	4K	15.7
GPT-4 Turbo PreviewOpenAI	OpenAI	59	4K	14.5
Claude 3 HaikuAnthropic	Anthropic	51	4K	12.4
Command R (08-2024)Cohere	Cohere	48	4K	12.1
Command R+ (08-2024)Cohere	Cohere	48	4K	12.1
Gemma 4 31B (free)Google	Google	80	8K	9.8
Jamba Large 1.7AI21 Labs	AI21 Labs	40	4K	9.8
GPT-3.5 Turbo 16kOpenAI	OpenAI	40	4K	9.8
GPT-3.5 TurboOpenAI	OpenAI	40	4K	9.8
ALLaM 2 7B InstructHUMAIN	HUMAIN	40	4K	9.8
ALLaM 34BHUMAIN	HUMAIN	40	4K	9.8
GPT-3.5 Turbo (older v0613)OpenAI	OpenAI	39	4K	9.6
ALLaM 7B Instruct (preview)HUMAIN	HUMAIN	38	4K	9.4
Nova Lite 1.0Amazon	Amazon	40	5K	7.8
Nova Micro 1.0Amazon	Amazon	40	5K	7.8

Key Insights

Auto-generated observations from the efficiency data.

Context Sweet Spot

Small models have the highest average efficiency at 6679.4 score/MToken across 10 models.

Output Matters

Models with 16K+ output tokens score 27% higher on average than models with smaller output limits.

Compact High Performers

0 models achieve top-20 scores with under 128K context.

Explore More

Dive deeper into context windows, compare models, or explore other dimensions.

All Explorers Context Windows Large Context Models

Frequently Asked Questions

Efficiency is measured as the score-per-context-token ratio - how much ranking score a model achieves relative to its context window size. Models that score highly with smaller context windows are considered more efficient than those requiring massive context to achieve similar results.

Cost efficiency combines quality (composite score) with pricing. The most cost-efficient models achieve high benchmark scores while maintaining low per-token API costs. Free and budget-tier models that perform well are the most cost-efficient options.

Not necessarily. Our efficiency analysis shows diminishing returns beyond certain context sizes. Models with 128K tokens often score similarly to those with 1M+ tokens, meaning the extra context capacity adds cost without proportional quality gains for most use cases.

Efficiency Rankings

Top 50 models ranked by score per million context tokens.

#	Model	Provider	Score	Context	Output	Score/MToken	Output Eff.	Cost Eff.	Tier
1	ALLaM 2 7B InstructHUMAIN	HUMAIN	40	4K	4K	9765.6	9.8	Free	Small
2	ALLaM 34BHUMAIN	HUMAIN	40	4K	4K	9765.6	9.8	Free	Small
3	GPT-3.5 Turbo (older v0613)OpenAI	OpenAI	39	4K	4K	9621.5	9.6	26.3	Small
4	Gemma 2 27BGoogle	Google	77	8K	2K	9411.6	37.6	118.6	Small
5	ALLaM 7B Instruct (preview)HUMAIN	HUMAIN	38	4K	4K	9375.0	9.4	Free	Small
6	GPT-4OpenAI	OpenAI	65	8K	4K	7874.5	15.7	1.4	Small
7	Phi 4Microsoft	Microsoft	60	16K	16K	3656.0	3.7	570.5	Small
8	Reka Edgerekaai	rekaai	40	16K	16K	2441.4	2.4	400.0	Small
9	GPT-3.5 Turbo 16kOpenAI	OpenAI	40	16K	4K	2441.3	9.8	11.4	Small
10	GPT-3.5 TurboOpenAI	OpenAI	40	16K	4K	2441.3	9.8	40.0	Small
11	Voxtral Small 24B 2507Mistral AI	Mistral AI	40	32K	--	1250.0	--	200.0	Medium
12	Perceptron Mk1perceptron	perceptron	40	33K	8K	1220.7	4.9	48.5	Medium
13	LFM2.5-1.2B-Thinking (free)Liquid AI	Liquid AI	40	33K	--	1220.7	--	Free	Medium
14	LFM2.5-1.2B-Instruct (free)Liquid AI	Liquid AI	40	33K	--	1220.7	--	Free	Medium
15	Gemma 3n 4BGoogle	Google	40	33K	--	1220.7	--	444.4	Medium
16	SabaMistral AI	Mistral AI	40	33K	--	1220.7	--	100.0	Medium
17	Mistral Small 3Mistral AI	Mistral AI	40	33K	16K	1220.7	2.4	615.4	Medium
18	Falcon Arabic 7B InstructTII	TII	40	33K	8K	1220.7	4.9	Free	Medium
19	Falcon3 10B InstructTII	TII	40	33K	8K	1220.7	4.9	Free	Medium
20	Falcon3 7B InstructTII	TII	40	33K	8K	1220.7	4.9	Free	Medium
21	Coder Largearcee-ai	arcee-ai	39	33K	--	1199.3	--	60.5	Medium
22	MiniMax M2-herMiniMax	MiniMax	69	66K	2K	1049.8	33.6	91.7	Medium
23	Mixtral 8x22B InstructMistral AI	Mistral AI	63	66K	--	961.3	--	15.8	Medium
24	GLM 4.5VZhipu AI	Zhipu AI	62	66K	16K	946.0	3.8	51.7	Medium
25	Olmo 3 32B ThinkAllen AI	Allen AI	55	66K	66K	831.6	0.8	167.7	Medium
26	GPT-5.3 ChatOpenAI	OpenAI	87	128K	16K	679.7	5.3	11.0	Large
27	GPT-5.1 ChatOpenAI	OpenAI	86	128K	32K	673.4	2.7	15.3	Large
28	DeepSeek V3.2DeepSeek	DeepSeek	81	131K	64K	616.5	1.3	282.5	Large
29	Reka Flash 3rekaai	rekaai	40	66K	66K	610.4	0.6	266.7	Medium
30	GPT-5.2 ChatOpenAI	OpenAI	77	128K	16K	600.0	4.7	9.8	Large
31	GLM 4.5Zhipu AI	Zhipu AI	75	131K	98K	569.9	0.8	53.4	Large
32	GPT-4o (2024-08-06)OpenAI	OpenAI	71	128K	16K	553.1	4.3	11.3	Large
33	GPT-4o (2024-05-13)OpenAI	OpenAI	71	128K	4K	553.1	17.3	7.1	Large
34	GPT-4oOpenAI	OpenAI	71	128K	16K	553.1	4.3	11.3	Large
35	GPT-5 ChatOpenAI	OpenAI	70	128K	16K	548.4	4.3	12.5	Large
36	GPT-4o Search PreviewOpenAI	OpenAI	70	128K	16K	546.9	4.3	11.2	Large
37	GPT-4o-miniOpenAI	OpenAI	69	128K	16K	538.3	4.2	183.7	Large
38	GLM 4.5 AirZhipu AI	Zhipu AI	70	131K	98K	536.3	0.7	143.5	Large
39	DeepSeek V3DeepSeek	DeepSeek	69	131K	16K	526.4	4.3	138.0	Large
40	GPT-4 TurboOpenAI	OpenAI	66	128K	4K	518.0	16.2	3.3	Large
41	Qwen3 VL 235B A22B ThinkingAlibaba	Alibaba	67	131K	33K	513.5	2.1	47.1	Large
42	Mistral LargeMistral AI	Mistral AI	66	128K	--	511.7	--	16.4	Large
43	Llama 3.3 70B InstructMeta	Meta	66	131K	16K	506.6	4.1	316.2	Large
44	Llama 3.3 70B Instruct (free)Meta	Meta	66	131K	--	499.7	--	Free	Large
45	GLM 4.6VZhipu AI	Zhipu AI	65	131K	33K	496.7	2.0	108.5	Large
46	Llama 3.1 70B InstructMeta	Meta	65	131K	16K	495.1	4.0	162.3	Large
47	Qwen3 30B A3B Thinking 2507Alibaba	Alibaba	64	131K	131K	486.0	0.5	265.4	Large
48	Qwen3 30B A3BAlibaba	Alibaba	64	131K	16K	486.0	3.9	205.5	Large
49	R1 0528DeepSeek	DeepSeek	79	164K	33K	482.2	2.4	59.6	Large
50	Mercury 2Inception	Inception	61	128K	50K	472.7	1.2	121.0	Large

Tier Analysis

Efficiency breakdown across context window tiers.