Google lancia Gemini 3.0 Pro, il nuovo modello linguistico multimodale
Migliorato il ragionamento contestuale e l'integrazione nativa in Chrome e Workspace.
SOFTWARETECH


Google ha avviato la diffusione di Gemini 3.0 Pro, evoluzione del suo modello linguistico multimodale. L'obiettivo dichiarato è migliorare il ragionamento contestuale, la qualità dei risultati e l'integrazione profonda con gli strumenti Google come Workspace, Chrome e Android.
Rispetto alla versione 2.5 Pro, che aveva già stabilito uno standard nel ragionamento multimodale, il nuovo modello introduce un’inferenza più rapida, una maggiore coerenza fattuale e una migliore comprensione degli input misti, come grafici, PDF e screenshot. Test interni indicano una riduzione degli errori, citazioni più accurate e la capacità di ragionamento parallelo su dati visivi e testuali.
Una novità è l'introduzione di elementi di “Agentic Browsing” in Chrome Canary, un framework che permette a Gemini di analizzare e intervenire sui contenuti web senza abbandonare la finestra del browser. Il modello può riassumere pagine, estrarre informazioni strutturate ed eseguire leggere automazioni. Si tratta di un passo verso l'”AI ambientale”, in cui l'assistente opera in background ed è consapevole del contesto dell'utente.
L'architettura di Gemini 3.0 Pro si basa su un sistema multi-tower, dove i flussi visivi, audio e testuali vengono elaborati separatamente per poi essere fusi a livello di ragionamento, garantendo coerenza nell'elaborazione di input complessi. Le ottimizzazioni rendono il modello particolarmente adatto a flussi di lavoro aziendali che combinano dati visivi e testuali.
Parallelamente, Gemini 3.0 Pro si integra in Google Workspace come livello di ragionamento interno, potendo sintetizzare contenuti in Gmail, Documenti e Fogli, recuperando dati da diverse fonti Drive e mantenendo l'integrità delle citazioni. Inoltre, all'interno di Vertex AI, le organizzazioni possono costruire agenti specializzati sfruttando la comprensione multimodale del modello e le politiche di governance dei dati.
L'implementazione discreta e "silenziosa" del modello riflette la filosofia di Google: l'intelligenza artificiale deve essere nativa e distribuita nell'ecosistema, operando come un motore di ragionamento condiviso. Il risultato è un'assistenza contestuale che trasforma documenti, pagine web e messaggi in superfici dove l'IA lavora al fianco dell'utente.




