Aggiornato quotidianamente

Benchmark LLM per prodotti reali

Scegli lo stack perfetto per i tuoi progetti di automazione basandoti su dati oggettivi di costo, latenza e qualità.

Esplora i dati Calcola il costo

20+

Modelli

24h

Aggiornamenti

Metriche Chiave

100%

Data-Driven

Scegli il tuo caso d'uso

Ogni scenario richiede un bilanciamento diverso tra intelligenza, velocità e costo. Seleziona per vedere la nostra raccomandazione.

Top 3 per Estrazione Dati Strutturati

Massima precisione e context window, focus su structured output.

Best Choice

Anthropic

Claude Opus 5 (Adaptive Reasoning, Max Effort)

Intelligence

61/100

Output Speed

60t/s

Latency (TTFT)

29.30s

Blended Cost

$10.00/1M

Usa questo stack

Anthropic

Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

Intelligence

60/100

Output Speed

71t/s

Latency (TTFT)

52.83s

Blended Cost

$20.00/1M

Usa questo stack

Anthropic

Claude Opus 5 (Adaptive Reasoning, Xhigh Effort)

Intelligence

60/100

Output Speed

54t/s

Latency (TTFT)

22.73s

Blended Cost

$10.00/1M

Usa questo stack

Tabella dati completa

Analizza tutti i modelli monitorati. Dati aggiornati ogni 24h per intelligence, coding e speed.

Mostra solo consigliati (>45)


Claude Opus 5 (Adaptive Reasoning, Max Effort)Anthropic	60.7	78.0	60	29.30	$5.00	$25.00
Claude Opus 5 (Adaptive Reasoning, Xhigh Effort)Anthropic	60.1	77.0	54	22.73	$5.00	$25.00
Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)Anthropic	59.9	76.5	71	52.83	$10.00	$50.00
GPT-5.6 Sol (max)OpenAI	58.9	77.4	78	64.63	$5.00	$30.00
Claude Opus 5 (Adaptive Reasoning, High Effort)Anthropic	58.9	76.5	55	12.28	$5.00	$25.00
GPT-5.6 Sol (xhigh)OpenAI	57.7	78.3	73	23.43	$5.00	$30.00
Kimi K3 (max)Kimi	57.1	76.2	34	2.94	$3.00	$15.00
Claude Opus 5 (Adaptive Reasoning, Medium Effort)Anthropic	56.3	74.3	55	6.73	$5.00	$25.00
GPT-5.6 Sol (high)OpenAI	55.9	77.2	74	13.71	$5.00	$30.00
Claude Opus 4.8 (Adaptive Reasoning, Max Effort)Anthropic	55.7	74.3	0	0.00	$5.00	$25.00

Pagina 1 di 60

Dati forniti da Artificial Analysis. I prezzi sono in $ per 1M token. Aggiornato ogni 24h.

Come li scegliamo

Non ci basiamo solo sui benchmark sintetici. Ottimizziamo per:

1
Qualità su dataset reali
Testiamo "needle in a haystack" su PDF di 50+ pagine.
2
Costo su volumi
Analizziamo il TCO (Total Cost of Ownership) su 100k+ chiamate/mese.
3
Robustezza
Monitoriamo il failure rate e la consistenza dell'JSON output.

Calcolatore Costi LLM

Stima il costo mensile del tuo caso d'uso.

Volume Documenti / Mese

Stima: ~1000 token per documento

Volume Token Totali

Efficiency

$0.14

GPT-5 Nano, Gemini 2.5 Lite

Standard

$0.65

GPT-5 Mini, DeepSeek V3

Frontier

$4.80

GPT-5.2, Gemini 3 Pro, Claude 4.5

*Stime indicative basate sui prezzi di listino attuali.

Vuoi la shortlist per il tuo flusso?

Descrivici il tuo caso d'uso e ti invieremo un'analisi personalizzata con lo stack consigliato.

Benchmark LLM per prodotti reali

Scegli il tuo caso d'uso

Top 3 per Estrazione Dati Strutturati

Claude Opus 5 (Adaptive Reasoning, Max Effort)

Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

Claude Opus 5 (Adaptive Reasoning, Xhigh Effort)

Tabella dati completa

Come li scegliamo

Qualità su dataset reali

Costo su volumi

Robustezza

Vuoi la shortlist per il tuo flusso?