Gemini 2.5 Flash Lite

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

by Google

Overview

Quick stats across all benchmark runs.

Score

27%

275 benchmarks

Avg Latency

5.9s

754 requests

Pricing

$0.10 in / $0.40 out

per 1M tokens

Context

1049K

tokens

Alternatives

Models with similar or better quality but different tradeoffs

Same Quality, Cheaper

Models with similar or better performance at a lower cost per token.

Model	Cost
gpt-oss-20b	-44%
Llama 3.3 70B Instruct	-23%

Same Quality, Faster

Models with similar or better performance but lower latency.

Model	Latency
Gemini 3 Flash Preview	-4%

Same Cost, Better

Models at a similar price point with higher benchmark scores.

Model	Score
DeepSeek V3.2	+7%
Llama 4 Maverick	+2%

Benchmark Performance

How this model performs across different benchmarks

Benchmark	Score	Rank
Venture Capital Terms Benchmark	100%	4 / 22
Spatial Reasoning: Germany	94%	10 / 27
Karlsruhe Local Knowledge Benchmark	53%	18 / 27
Money Boy Cultural Literacy Test	51%	25 / 99
Niederstetten Benchmark	45%	18 / 33
Character Frequency Bench	42%	25 / 27
Categorization Bench	12%	50 / 52
German Memelord Bench	1%	27 / 27

Price vs Performance

Compare cost efficiency across all models

Current model (baseline)

Other models (relative score)

Y-axis shows score difference from shared benchmarks. X-axis uses log scale.

Score Over Time

Performance trends across all benchmark runs

Benchmark Activity

Number of benchmark runs over time

Quickstart

View on OpenRouter

Get started with this model using OpenRouter

import { OpenRouter } from "@openrouter/sdk";

const openrouter = new OpenRouter({
  apiKey: "<OPENROUTER_API_KEY>"
});

const completion = await openrouter.chat.completions.create({
  model: "google/gemini-2.5-flash-lite",
  messages: [
    {
      role: "user",
      content: "Hello!"
    }
  ]
});

console.log(completion.choices[0].message.content);

Get your API key at openrouter.ai/keys

Other Models from Google

Compare performance with other models from the same creator

Model	Latency	Cost/1M	Score
Gemini 2.5 Pro	22.2s	$5.63	89%
Gemini 3.1 Pro Preview	9.8s	$7.00	79%
Gemini 3 Flash Preview	5.7s	$1.75	77%
Gemini 3.1 Flash Lite	1.8s	$0.88	62%
Gemini 2.0 Flash	7.0s	$0.25	50%
Gemini 2.5 Flash	8.4s	$1.40	46%
Gemini 2.5 Flash Image Preview (Nano Banana)	—	$1.40	—
Nano Banana Pro (Gemini 3 Pro Image Preview)	37.7s	$7.00	—
Gemini 2.5 Pro Preview 05-06	39.7s	$5.63	—
Gemma 2 27B	13.2s	$0.65	—
Gemma 4 26B A4B	—	Free	—
Gemma 4 31B	—	Free	—
Lyria 3 Pro Preview	—	Free	—
Lyria 3 Clip Preview	—	Free	—
Gemini 3.1 Flash Lite Preview	—	$0.88	—
Nano Banana 2 (Gemini 3.1 Flash Image Preview)	—	$1.75	—
Gemini 3.1 Pro Preview Custom Tools	—	$7.00	—
Gemma 3 27B	21.2s	$0.12	—
Gemini 2.5 Flash Preview 09-2025	7.4s	$1.40	—
Gemma 3 4B	27.8s	$0.06	—
Gemini 2.0 Flash Lite	8.8s	$0.19	—
Gemma 3n 4B	23.5s	$0.09	—
Gemini 2.5 Pro Preview 06-05	34.8s	$5.63	—
Gemma 3 12B	26.5s	$0.09	—
Gemini 2.5 Flash Lite Preview 09-2025	5.0s	$0.25	—
Nano Banana (Gemini 2.5 Flash Image)	50.1s	$1.40	—
Gemini 3 Pro Preview	20.8s	$7.00	—
Gemma 2 9B	6.1s	$0.06	—
Gemini 3.5 Flash	2.1s	$5.25	—
Gemma 3n 2B (free)	30.6s	Free	—
Gemini 2.0 Flash Experimental (free)	13.3s	Free	—