Gemma 4 è l’ultima generazione di modelli __open source__ di Google DeepMind, derivata dalla ricerca Gemini 3. La famiglia comprende varianti pre-addestrate e instruction-tuned, con una finestra di contesto fino a __256K token__ e supporto nativo di oltre 140 lingue. I modelli integrano una modalità __thinking configurabile__, capacità multimodali immagine, video e audio, nonché un function calling nativo che li rende perfetti per gli agenti IA.
Cos’è Gemma 4?
Gemma 4 è una famiglia di modelli open source pubblicata da Google DeepMind. Riprende i progressi della ricerca Gemini 3 e li distilla in modelli aperti, scaricabili con licenza Apache 2.0. La famiglia offre diverse dimensioni, dai modelli molto compatti adatti ai deployamenti edge e mobile ai modelli più potenti destinati ai server. Tutti i modelli sono disponibili in versioni pre-addestrate e instruction-tuned, il che copre sia i casi d’uso in R&D che le applicazioni operative. La presenza del function calling nativo e della modalità thinking configurabile distingue Gemma 4 dalla maggior parte delle altre famiglie open source, orientandola chiaramente verso gli agenti IA e i workflow complessi.
Funzionalità principali
Gemma 4 introduce diversi progressi maggiori. L’architettura combina strati di attenzione locali in finestra scorrevole con strati di attenzione globale, il che assicura una copertura completa ottimizzando i costi di inferenza. La finestra di contesto raggiunge 128K token nelle versioni piccole e 256K token nelle versioni medium, il che consente di elaborare documenti lunghi o storici estesi senza truncazione. I modelli gestiscono nativamente testo, immagini e video, con eccellente riconoscimento ottico di caratteri e buona comprensione di grafici. Le versioni E2B e E4B aggiungono input audio nativo per il riconoscimento e la comprensione vocale. La modalità thinking, configurabile, consente di attivare una catena di ragionamento esplicita quando il compito lo giustifica, o di generare direttamente la risposta per i casi semplici. Il function calling nativo e il supporto del ruolo di sistema fanno di Gemma 4 una base ideale per gli agenti IA. Le prestazioni sui benchmark di codice e agentici conoscono un netto miglioramento rispetto a Gemma 3.
Casi d’uso
Gemma 4 copre un’ampia gamma di scenari. Gli sviluppatori che mirano a distribuzioni edge lo utilizzano in applicazioni mobili, estensioni browser o dispositivi incorporati, grazie alle versioni 2B e 4B compatibili con LiteRT-LM o Cactus. I team IA costruiscono agenti interni capaci di ragionare ed eseguire strumenti, sfruttando il function calling nativo. Le imprese regolamentate distribuiscono le versioni più grandi localmente per rispondere a requisiti di sovranità e controllabilità. I ricercatori lo utilizzano come base di sperimentazione per il multilingue, il ragionamento lungo o le architetture ibride. Infine, gli editori SaaS lo integrano nei loro prodotti per offrire un’alternativa cost-efficient ai modelli proprietari.
Vantaggi
Il beneficio principale di Gemma 4 risiede nella combinazione tra qualità, apertura e flessibilità. La qualità si illustra con la vicinanza ai migliori modelli proprietari sui benchmark di riferimento. L’apertura, garantita dalla licenza Apache 2.0, autorizza il fine-tuning, il controllo e la distribuzione in qualsiasi ambiente, inclusi quelli più regolamentati. La flessibilità proviene dalla diversità della famiglia: lo stesso nucleo tecnologico si declina dal mobile al cluster GPU, il che semplifica la coerenza architettonica in un’organizzazione. L’ecosistema di supporto è eccezionale, con integrazioni day-one presso Hugging Face, Ollama, vLLM, llama.cpp, MLX, NVIDIA NIM e molti altri, il che garantisce una portabilità quasi universale.
Tariffe
Gemma 4 è gratuito per il download, con licenza Apache 2.0 che consente l’uso commerciale senza restrizioni. I costi pratici si situano solo a livello di infrastruttura di inferenza: GPU per l’on-premise o tariffazione all’uso tramite fornitori cloud come Google Cloud, Hugging Face Inference, Baseten o Replicate. Questa assenza di costi di licenza rappresenta un vantaggio economico significativo rispetto ai modelli proprietari, particolarmente per gli usi ad alto volume.
Conclusione
Gemma 4 illustra il ruolo centrale assunto dall’open source nella strategia di Google DeepMind. La nuova famiglia apporta una combinazione rara tra apertura totale, qualità di riferimento e copertura di casi d’uso eccezionale. Per i team IA che costruiscono agenti, assistenti o prodotti di ragionamento avanzato, è probabilmente la base open source più interessante disponibile nel 2026.