Il modello più veloce ed economico della famiglia Gemini 2.5 è adesso fuori dall'anteprima e disponibile su Google AI Studio e Vertex AI.
Dopo la presentazione avvenuta in concomitanza con il rilascio delle versioni stabili di Gemini 2.5 Flash e Pro, Google annuncia la disponibilità generale di Gemini 2.5 Flash-Lite, adesso e a sua volta fuori dalla preview.
Oggi rilasciamo la versione stabile di Gemini 2.5 Flash-Lite, il nostro modello più veloce e più economico (0,10 $ in input per 1 milione di unità, 0,40 $ in output per 1 milione di unità) della famiglia Gemini 2.5. Abbiamo sviluppato 2.5 Flash-Lite per ampliare i confini dell'intelligenza per dollaro, con funzionalità di ragionamento native che possono essere attivate opzionalmente per i casi d'uso più complessi. Basandosi sul successo di 2.5 Pro e 2.5 Flash, questo modello completa la nostra gamma di modelli 2.5 pronti per l'uso in produzione su larga scala.
Google garantisce che Gemini 2.5 Flash-Lite non è inferiore per potenzialità, efficienza e prestazioni agli altri LLM, a fronte di un prezzo competitivo a qualsiasi livello. Nel dettaglio:
- La migliore velocità della categoria: Gemini 2.5 Flash-Lite ha una latenza inferiore sia rispetto a 2.0 Flash-Lite che a 2.0 Flash su un ampio campione di prompt.
- Efficienza in termini di costi: è il nostro modello 2.5 più economico di sempre, con un prezzo di $0,10/1 milione di token in input e $0,40 in output, che consente di gestire grandi volumi di richieste a costi contenuti. Abbiamo anche ridotto il prezzo degli input audio del 40% rispetto al lancio in anteprima.
- Intelligente e piccolo: dimostra una qualità complessivamente superiore rispetto alla versione 2.0 Flash-Lite in una vasta gamma di benchmark, tra cui codifica, matematica, scienze, ragionamento e comprensione multimodale.
- Funzionalità complete: quando si sviluppa con Flash-Lite 2.5, si ha accesso a una finestra di contesto da 1 milione di token, budget di pensiero controllabili e supporto per strumenti nativi come Grounding con Google Search, esecuzione del codice e contesto URL.
Google conferma che puoi iniziare subito ad utilizzare Gemini Flash-Lite 2.5 indicando "gemini-2.5-flash-lite" nel tuo codice. L'alias di anteprima sarà rimosso definitivamente da Flash-Lite il prossimo 25 agosto. La versione stabile di Gemini 2.5 Flash-Lite è disponibile su Google AI Studio e Vertex AI.