I nuovi LLM più potenti, veloci ed economici di sempre sono stati annunciati da OpenAI. Subito in fase di anteprima.
OpenAI torna ad aggiornare i suoi Large Language Model per il pubblico, presentando la nuova famiglia GPT-5.6, composta per il momento dai modelli Sol, Terra e Luna. Si cambia dunque approccio per consentire identificazioni più immediate riguardo capacità di ragionamento, velocità o convenienza.
In questo nuovo sistema di denominazione introdotto con GPT-5.6, il numero identifica la generazione di un modello, mentre Sol, Terra e Luna identificano livelli di capacità durevoli che possono evolvere secondo una propria cadenza, ha detto OpenAI.
Il modello GPT-5.6 Sol è il più potente del gruppo ed è l'LLM più prestante mai realizzato da OpenAI. Offre ragionamenti più lunghi e mirati per analizzare prompt complessi e rispondere in maniera precisa ed articolata alle richieste.
GPT-5.6 Terra ha prestazioni simili a GPT-5.5, ma è più efficiente e decisamente più economico di quest'ultimo.
GPT-5.6 Luna è il più veloce e meno costoso del gruppo, ideale per le comuni attività quotidiane svolte dalla fetta di utenza più ampia in ChatGPT.
Con GPT-5.6 introduciamo un nuovo meccanismo di ragionamento Massimo per dare a Sol più tempo per ragionare in profondità. Inoltre, introduciamo una nuova modalità Ultra che va oltre le capacità di un singolo agente, sfruttando i sub-agenti per accelerare il lavoro complesso.
Per quanto riguarda i flussi di lavoro di programmazione, GPT‑5.6 Sol stabilisce un nuovo standard su Terminal‑Bench 2.1, che testa flussi di lavoro da riga di comando che richiedono pianificazione, iterazione e coordinamento degli strumenti.
GPT‑5.6 Sol è il nostro modello più performante di sempre per la sicurezza informatica. Sposta la frontiera dell'efficienza prestazionale per le attività di sicurezza a lungo termine, tra cui la ricerca e lo sfruttamento delle vulnerabilità. Su ExploitBench, GPT‑5.6 Sol è competitivo con Mythos Preview utilizzando solo circa 1/3 dei token di output. Su ExploitGym, un benchmark creato dai ricercatori dell'UC Berkeley in collaborazione con OpenAI e altri laboratori all'avanguardia, i modelli GPT-5.6 Sol, Terra e Luna dimostrano tutti forti miglioramenti nelle capacità informatiche man mano che aumentiamo il ragionamento.
Abbiamo sviluppato GPT-5.6 Sol, Terra e Luna con le nostre misure di sicurezza più robuste fino ad oggi, con configurazioni adattate alle capacità di ciascun modello. Man mano che il modello diventa più performante, progettiamo misure di sicurezza in grado di resistere sempre più alle pressioni avversarie del mondo reale, preservando al contempo l'accesso ad attività legittime come la revisione del codice, la ricerca di vulnerabilità, lo sviluppo di patch, il debug, la formazione sulla sicurezza e i test difensivi. Il nostro obiettivo è rendere le attività offensive proibite più difficili, incerte e rilevabili, senza limitare inutilmente questi usi benefici. Sulla base della nostra valutazione del modello e delle misure di sicurezza, prevediamo vantaggi sostanziali per le attività difensive legittime, limitando al contempo in modo significativo gli usi offensivi proibiti.
GPT-5.6 Sol è più efficace nell'aiutare gli utenti a individuare e correggere le vulnerabilità che nell'eseguire attacchi end-to-end in modo affidabile. Con il continuo sviluppo di queste funzionalità, la nostra priorità è garantire che raggiungano e apportino benefici ai difensori, che potranno utilizzare questi strumenti per individuare le debolezze, sviluppare patch e rafforzare i sistemi in generale.
GPT-5.6 Sol non supera la soglia di criticità informatica prevista dal nostro quadro di preparazione. Nelle valutazioni condotte su Chromium e Firefox, ha identificato bug e primitive di sfruttamento (gli elementi costitutivi di un exploit), ma non è riuscito a produrre autonomamente un exploit completo e funzionante nelle condizioni testate. Tuttavia, le soglie di riferimento non possono cogliere tutti i modi in cui un modello può essere utilizzato o combinato con altri strumenti. Questa incertezza, unita al più ampio cambiamento di funzionalità del modello, è il motivo per cui stiamo affiancando alle maggiori capacità del modello misure di sicurezza più rigorose e un rilascio graduale.
I nuovi modelli Sol, Terra e Luna della famiglia GPT-5.6 sono disponibili in anteprima per un numero selezionato e limitato di partner OpenAI. Saranno lanciati pubblicamente per utenti e sviluppatori a partire dalle prossime settimane in ChatGPT, Codex e API.


