OpenAI: gpt-oss-20b

by OpenAI

gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license. It uses a Mixture-of-Experts (MoE) architecture with 3.6B active parameters per forward pass, optimized for lower-latency inference and deployability on consumer or single-GPU hardware. The model is trained in OpenAI’s Harmony response format and supports reasoning level configuration, fine-tuning, and agentic capabilities including function calling, tool use, and structured outputs.

Avg Score

72.9%

743 answers

Avg Latency

13.3s

298 runs

Pricing

$0.02

input

$0.10

output

per 1M tokens

Context

131K

tokens

Alternatives

Models with similar or better quality but different tradeoffs

Same Quality, Cheaper

Models with similar or better performance at a lower cost per token.

Model	Cost
Meta: Llama 4 Scout	-36%
Mistral: Ministral 3 8B 2512	-27%

Same Quality, Faster

Models with similar or better performance but lower latency.

Model	Latency
Google: Gemini 3 Flash Preview	-57%
Google: Gemini 2.5 Flash Lite	-56%
Amazon: Nova 2 Lite	-52%
Meta: Llama 4 Maverick	-52%
Meta: Llama 4 Scout	-51%

Same Cost, Better

Models at a similar price point with higher benchmark scores.

Model	Score
Meta: Llama 4 Maverick	+4%

Other Models from OpenAI

Compare performance with other models from the same creator

Model	Score	Latency	Cost/1M
OpenAI: o1-pro	94.2%	95.3s	$375.00
OpenAI: GPT-5.1-Codex-Max	93.5%	25.2s	$5.63
OpenAI: GPT-5	92.2%	54.7s	$5.63
OpenAI: GPT-5 Image	90.9%	49.2s	$10.00
OpenAI: GPT-5.1 Chat	90.6%	6.1s	$5.63
OpenAI: GPT-5.1-Codex-Mini	90.6%	12.6s	$1.13
OpenAI: GPT-5.1-Codex	90.6%	16.6s	$5.63
OpenAI: GPT-5.1	90.3%	35.5s	$5.63
OpenAI: o3	90.3%	19.0s	$5.00
OpenAI: gpt-oss-120b	90.0%	28.3s	$0.11
OpenAI: o4 Mini Deep Research	89.7%	134.5s	$5.00
OpenAI: GPT-5 Pro	89.4%	332.1s	$67.50
OpenAI: GPT-5 Image Mini	89.3%	31.8s	$2.25
OpenAI: GPT-4o Search Preview	89.3%	11.2s	$6.25
OpenAI: GPT-4.1	89.2%	21.8s	$5.00
OpenAI: gpt-oss-safeguard-20b	88.4%	2.3s	$0.19
OpenAI: o1	88.3%	24.1s	$37.50
OpenAI: GPT-5.2	87.8%	20.7s	$7.88
OpenAI: o3 Pro	87.6%	125.7s	$50.00
OpenAI: GPT-5.2-Codex	87.2%	21.7s	$7.88
OpenAI: GPT-5 Codex	87.2%	20.5s	$5.63
OpenAI: GPT-5.2 Pro	86.9%	47.7s	$94.50
OpenAI: o3 Deep Research	86.5%	362.7s	$25.00
OpenAI: GPT-5.2 Chat	86.4%	9.5s	$7.88
OpenAI: GPT-5 Chat	86.2%	6.8s	$5.63
OpenAI: o4 Mini High	86.1%	26.8s	$2.75
OpenAI: o3 Mini High	86.1%	13.8s	$2.75
OpenAI: o4 Mini	85.3%	18.2s	$2.75
OpenAI: o3 Mini	85.3%	16.0s	$2.75
OpenAI: ChatGPT-4o	82.9%	7.4s	$10.00
OpenAI: GPT-5 Mini	82.5%	24.7s	$1.13
OpenAI: GPT-5 Nano	77.0%	34.2s	$0.22
OpenAI: GPT-4o (2024-05-13)	76.5%	4.7s	$10.00
OpenAI: GPT-4o	76.1%	5.8s	$12.00
OpenAI: GPT-4o (2024-11-20)	75.6%	13.0s	$6.25
OpenAI: GPT-4o	73.8%	12.5s	$6.25
OpenAI: GPT-4.1 Mini	71.9%	13.2s	$1.00
OpenAI: GPT-3.5 Turbo (older v0613)	70.8%	13.7s	$1.50
OpenAI: GPT-4o-mini (2024-07-18)	70.3%	13.2s	$0.38
OpenAI: GPT-4o (2024-08-06)	70.0%	9.5s	$6.25
OpenAI: gpt-oss-120b	69.6%	29.1s	$0.11
OpenAI: GPT-4o-mini	67.4%	11.5s	$0.38
OpenAI: GPT-4o-mini Search Preview	66.2%	6.5s	$0.38
OpenAI: GPT-4 Turbo (older v1106)	64.7%	18.1s	$20.00
OpenAI: GPT-4 Turbo Preview	62.6%	15.8s	$20.00
OpenAI: GPT-4	61.7%	12.1s	$45.00
OpenAI: GPT-4 Turbo	61.5%	26.5s	$20.00
OpenAI: GPT-4 (older v0314)	59.7%	16.8s	$45.00
OpenAI: GPT-4.1 Nano	59.2%	5.3s	$0.25
OpenAI: GPT-3.5 Turbo 16k	48.2%	4.2s	$3.50
OpenAI: GPT-3.5 Turbo	42.9%	4.0s	$1.00
OpenAI: GPT-3.5 Turbo Instruct	27.5%	4.4s	$1.75
OpenAI: GPT-4o Audio	—	—	$6.25
OpenAI: gpt-oss-120b	—	—	Free
OpenAI: GPT Audio	—	—	$6.25
OpenAI: GPT Audio Mini	—	—	$1.50
OpenAI: Codex Mini	—	—	$3.75

Benchmark Performance

How this model performs across different benchmarks

Benchmark	Score	Rank
Venture Capital Terms Benchmark	99.7%	12 / 25
Spatial Reasoning: Germany	88.6%	25 / 35
Character Frequency Bench	81.8%	20 / 35
German Memelord Bench	6.6%	30 / 35
Niederstetten Benchmark	4.0%	38 / 41
Money Boy Cultural Literacy Test	0.0%	31 / 35

Price vs Performance

Compare cost efficiency across all models

Current model (baseline)

Other models (relative score)

Y-axis shows score difference from shared benchmarks. X-axis uses log scale.

Score Over Time

Performance trends across all benchmark runs

Benchmark Activity

Number of benchmark runs over time

Quickstart

Get started with this model using OpenRouter

View on OpenRouter

import { OpenRouter } from "@openrouter/sdk";

const openrouter = new OpenRouter({
  apiKey: "<OPENROUTER_API_KEY>"
});

const completion = await openrouter.chat.completions.create({
  model: "openai/gpt-oss-20b",
  messages: [
    {
      role: "user",
      content: "Hello!"
    }
  ]
});

console.log(completion.choices[0].message.content);

Get your API key at openrouter.ai/keys