Ecco l'evoluzione di Operator e Deep Research disponibile in ChatGPT per i piani paganti. L'intelligenza artificiale pensa e agisce da remoto per conto dell'utente utilizzando un intero computer virtuale.
OpenAI annuncia un nuovo balzo in avanti dei suoi evoluti sistemi di intelligenza artificiale presentando oggi ChatGPT agent, nuova opzione agentica disponibile in ChatGPT per gli abbonati ai piani Pro, Plus e Team, avviabile direttamente dal selettore chat e scegliendo Modalità agente.
ChatGPT agent è in grado di lavorare per l'utente dal suo computer, opportunamente predisposto in virtuale con tutto ciò di cui si ha bisogno nelle circostanze richieste, pensando ed agendo da remoto per conto dell'utente stesso.
ChatGPT can now do work for you using its own computer.
— OpenAI (@OpenAI) July 17, 2025
Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ
Alcuni dettagli appena pubblicati da OpenAI:
OpenAI annuncia ChatGPT agent, l'AI che lavora per te
ChatGPT ora può lavorare per te utilizzando il suo computer, gestendo attività complesse dall'inizio alla fine.
Ora puoi chiedere a ChatGPT di gestire richieste come "guarda il mio calendario e informami sui prossimi incontri con i clienti in base alle ultime notizie", "pianifica e acquista gli ingredienti per preparare una colazione giapponese per quattro" e "analizza tre concorrenti e crea una presentazione".
ChatGPT esplorerà in modo intelligente i siti web, filtrerà i risultati, ti chiederà di accedere in modo sicuro quando necessario, eseguirà codice, condurrà analisi e persino fornirà presentazioni e fogli di calcolo modificabili che riassumono i risultati.
Al centro di questa nuova funzionalità c'è un sistema agentico unificato. Riunisce tre punti di forza di innovazioni precedenti: la capacità dell'operatore di interagire con i siti web, la capacità di sintesi delle informazioni da parte di Deep Research e l'intelligenza e la fluidità conversazionale di ChatGPT.
ChatGPT esegue queste attività utilizzando il proprio computer virtuale, passando con disinvoltura dal ragionamento all'azione per gestire flussi di lavoro complessi dall'inizio alla fine, il tutto in base alle tue istruzioni.
Ma soprattutto, hai sempre il controllo. ChatGPT richiede l'autorizzazione prima di intraprendere azioni significative, e puoi facilmente interrompere, prendere il controllo del browser o interrompere le attività in qualsiasi momento.
A partire da oggi, gli utenti Pro, Plus e Team possono attivare le nuove funzionalità agentiche di ChatGPT direttamente tramite il menu a discesa degli strumenti del compositore, selezionando "modalità agente" in qualsiasi momento di qualsiasi conversazione.
Sebbene l'agente ChatGPT sia già uno strumento potente per gestire attività complesse, il lancio di oggi è solo l'inizio. Continueremo ad aggiungere regolarmente miglioramenti significativi, rendendolo sempre più efficiente e utile per un numero sempre maggiore di persone.
In precedenza, Operator e Deep Research offrivano punti di forza unici: Operator permetteva di scorrere, cliccare e digitare sul web, mentre Deep Research eccelleva nell'analizzare e riassumere le informazioni.
Tuttavia, funzionavano meglio in situazioni diverse: Operator non permetteva di approfondire l'analisi o scrivere report dettagliati, mentre Deep Research non poteva interagire con i siti web per perfezionare i risultati o accedere a contenuti che richiedevano l'autenticazione dell'utente. In effetti, abbiamo notato che molte query eseguite dagli utenti con Operator erano in realtà più adatte a Deep Research, quindi abbiamo unito il meglio di entrambe.
Integrando questi punti di forza complementari in ChatGPT e introducendo strumenti aggiuntivi, abbiamo sbloccato funzionalità completamente nuove all'interno di un unico modello. Ora può interagire attivamente con i siti web, cliccando, filtrando e raccogliendo risultati più precisi ed efficienti. È anche possibile passare in modo naturale da una semplice conversazione alla richiesta di azioni direttamente all'interno della stessa chat.
Abbiamo dotato l'agente ChatGPT di una suite di strumenti: un browser visuale che interagisce con il web tramite un'interfaccia utente grafica, un browser testuale per query web più semplici basate sul ragionamento, un terminale e accesso API diretto. L'agente può anche sfruttare i connettori ChatGPT (si apre in una nuova finestra), che consente di collegare app come Gmail e Github in modo che ChatGPT possa trovare informazioni pertinenti alle tue richieste e utilizzarle nelle sue risposte. Puoi anche accedere a qualsiasi sito web prendendo il controllo del browser, consentendogli di approfondire e ampliare sia la ricerca che l'esecuzione delle attività.
Fornire a ChatGPT queste diverse modalità di accesso e interazione con le informazioni web significa che può scegliere il percorso ottimale per eseguire le attività nel modo più efficiente. Ad esempio, può raccogliere informazioni sul tuo calendario tramite un'API, elaborare in modo efficiente grandi quantità di testo utilizzando il browser testuale, e al contempo avere la possibilità di interagire visivamente con siti web progettati principalmente per gli esseri umani.
Tutto ciò viene fatto utilizzando un computer virtuale dedicato, che preserva il contesto necessario per l'attività, anche quando vengono utilizzati più strumenti: il modello può scegliere di aprire una pagina utilizzando il browser testuale o quello visuale, scaricare un file dal web, manipolarlo eseguendo un comando nel terminale e quindi visualizzare l'output nel browser visuale. Il modello adatta il suo approccio per svolgere le attività con velocità, precisione ed efficienza.