Ecco il modello Fast della famiglia Gemini 3 disponibile a livello globale nell'app Gemini e in Ricerca Google.
Google ha annunciato oggi il lancio di Gemini 3 Flash, il modello più smart della nuova famiglia di LLM di punta, Gemini 3, presentata il mese scorso. Gemini 3 Flash sostituisce come predefinito Gemini 2.5 Flash in Gemini, nell'API e viene integrato in Ricerca a livello globale come principale in AI Mode, con Gemini 3 Pro e Nano Banana Pro che ottengono contestualmente potenziamenti nel motore di ricerca Web di Big G a partire dal Nord America.
A partire da oggi, Gemini nell'app e sul Web ha tre modelli fra cui scegliere nel selettore: Veloce, Ragionamento e Pro, tutti basati su Gemini 3, Flash e Pro.
Per gli sviluppatori, Gemini 3 Flash risulterà un modello più intelligente, scalabile ed economico, con performance superiori anche a Gemini 3 Pro in determinati contesti.
Gemini 3 Flash è altamente efficiente senza sacrificare l'intelligenza, spingendo la frontiera di Pareto in termini di prestazioni ed efficienza. Supera le prestazioni di 2.5 Pro, pur essendo 3 volte più veloce (in base ai benchmark di Artificial Analysis) a una frazione del costo. Anche con il livello di pensiero più basso, 3 Flash spesso supera le versioni precedenti con livelli di pensiero "alti".
Nell'API Gemini e in Vertex AI, Gemini 3 Flash ha un prezzo di $ 0,50/1 milione di token di input e $ 3/1 milione di token di output (l'input audio rimane a $ 1/1 milione di token di input). Include di serie il caching del contesto, consentendo una riduzione dei costi del 90% nei casi di utilizzo ripetuto dei token oltre determinate soglie. Analogamente, 3 Flash è oggi disponibile anche con l' API Batch , consentendo un risparmio sui costi del 50% e limiti di velocità molto più elevati per l'elaborazione asincrona. Per i casi d'uso sincroni e quasi in tempo reale, i clienti dell'API a pagamento hanno anche accesso a limiti di velocità pronti per la produzione.
Per codifica e programmazione giochi, Gemini 3 Flash offre prestazioni superiori a tutti i modelli precedenti, superando anche Gemini 3 Pro per capacità di codifica agentica.
Anche per l'analisi di documenti, il nuovo modello Fast di Google si dimostra efficiente e superiore ai precedenti LLM, senza rinunciare alle caratteristiche di velocità.
Ulteriori dettagli su Gemini 3 Flash a partire dal post di presentazione di Google qui.


