Modello proprietario di generazione immagini da input conversazionali presto integrato in Copilot e Bing Image Creator.
Microsoft fa sul serio con i suoi LLM fatti in casa e annuncia la disponibilitĂ di MAI-Image-1, primo modello di Microsoft AI specifico per la generazione di immagini da prompt testuali che debutta direttamente nella top 10 dei modelli text-to-image su LMArena.
Questo modello è stato addestrato con l'obiettivo di offrire un valore autentico ai creatori, ponendo molta cura nell'evitare risultati ripetitivi o stilisticamente generici. Ad esempio, è stata data priorità a una rigorosa selezione dei dati e a una valutazione sfumata, incentrata su compiti che rispecchiano fedelmente i casi d'uso creativi del mondo reale, tenendo conto del feedback dei professionisti delle industrie creative. Questo modello è progettato per offrire flessibilità reale, diversità visiva e valore pratico.
MAI-Image-1 eccelle nella generazione di immagini fotorealistiche, come l'illuminazione (ad esempio, luce di rimbalzo, riflessi), i paesaggi e molto altro. Questo è particolarmente vero se confrontato con molti modelli più grandi e lenti. La sua combinazione di velocità e qualità significa che gli utenti possono visualizzare più velocemente le loro idee sullo schermo, iterarle rapidamente e poi trasferire il loro lavoro su altri strumenti per continuare a perfezionarlo.
Puoi giù provare MAI-Image-1 su LMArena, mentre presto sarà disponibile anche in Copilot e Bing Image Creator. Per saperne di più, l'annuncio di Microsoft per questo post è qui.