Gemma 4

Die Open-Source-Familie von Google DeepMind, maßgeschneidert für Edge, KI-Agenten und fortgeschrittenes Denken.

💰Kostenlos (Open Source) ★★★★½ 4,8/5 (90 Bewertungen)

Assistenten Code & Entwicklung

#Agents IA #AI Assistant #API #Open source

Probiere Gemma 4 →

Vorschau von Gemma 4

https://deepmind.google/models/gemma/gemma-4/

Gemma 4 besuchen →

Detaillierte Darstellung

Gemma 4 ist die neueste Generation von __Open-Source__-Modellen von Google DeepMind, abgeleitet aus der Gemini 3-Forschung. Die Familie umfasst vortrainierte und instruction-tuned Varianten mit einem Kontextfenster von bis zu __256K Tokens__ und nativem Support für über 140 Sprachen. Die Modelle integrieren einen konfigurierbaren __Thinking-Modus__, multimodale Funktionen für Bild, Video und Audio sowie natives Function Calling, das sie perfekt für KI-Agenten macht.

Was ist Gemma 4?

Gemma 4 ist eine Familie von Open-Source-Modellen, die von Google DeepMind veröffentlicht wurde. Sie nutzt Fortschritte aus Gemini 3-Forschung und destilliert sie in offenen Modellen, herunterladbar unter der Apache 2.0-Lizenz. Die Familie bietet mehrere Größen, von sehr kompakten Modellen für Edge- und Mobile-Bereitstellungen bis zu leistungsstärkeren Modellen für Server. Alle Modelle sind in vortrainierten und instruction-tuned Versionen verfügbar, was sowohl F&E- als auch operative Anwendungen abdeckt. Das Vorhandensein von nativem Function Calling und einem konfigurierbaren Thinking-Modus unterscheidet Gemma 4 von den meisten anderen Open-Source-Familien und orientiert es klar in Richtung KI-Agenten und komplexer Workflows.

Hauptfunktionen

Gemma 4 führt mehrere Hauptfortschritte ein. Die Architektur kombiniert lokale Attention-Schichten mit Schiebefenster mit globalen Attention-Schichten, was vollständige Abdeckung gewährleistet und gleichzeitig Inferenzkosten optimiert. Das Kontextfenster erreicht 128K Tokens auf kleinen Versionen und 256K Tokens auf mittleren Versionen, was die Verarbeitung langer Dokumente oder erweiterter Historien ohne Truncation ermöglicht. Die Modelle verarbeiten nativ Text, Bilder und Videos mit exzellenter optischer Zeichenerkennung und gutem Grafik-Verständnis. Die E2B- und E4B-Versionen fügen native Audio-Eingabe für Sprach- und Sprachverständnis hinzu. Der Thinking-Modus, konfigurierbar, ermöglicht das Aktivieren einer expliziten Reasoningkette, wenn die Aufgabe dies rechtfertigt, oder die direkte Generierung der Antwort für einfache Fälle. Natives Function Calling und System-Role-Support machen Gemma 4 zu einer idealen Grundlage für KI-Agenten. Die Leistung auf Code- und Agenten-Benchmarks zeigt eine deutliche Verbesserung gegenüber Gemma 3.

Anwendungsfälle

Gemma 4 deckt eine breite Palette von Szenarien ab. Entwickler, die Edge-Bereitstellungen anvisieren, verwenden es in mobilen Anwendungen, Browser-Erweiterungen oder eingebetteten Geräten, dank der LiteRT-LM- oder Cactus-kompatiblen 2B- und 4B-Versionen. KI-Teams konstruieren interne Agenten, die Grund legen und Werkzeuge ausführen können, wobei sie natives Function Calling nutzen. Regulierte Unternehmen stellen die größeren Versionen lokal bereit, um Souveränitäts- und Audit-Anforderungen zu erfüllen. Forscher nutzen es als Experimentiergrundlage für Mehrsprachigkeit, langes Denken oder Hybrid-Architekturen. Abschließend integrieren SaaS-Herausgeber es in ihre Produkte, um eine kosteneffiziente Alternative zu propriétären Modellen zu bieten.

Vorteile

Der Hauptvorteil von Gemma 4 liegt in der Kombination aus Qualität, Offenheit und Flexibilität. Qualität zeigt sich durch die Nähe zu den besten Propriétären-Modellen bei Referenz-Benchmarks. Offenheit, garantiert durch die Apache 2.0-Lizenz, ermöglicht Fine-Tuning, Auditing und Bereitstellung in jeder Umgebung, auch in den am stärksten regulierten. Flexibilität ergibt sich aus der Familie-Vielfalt: Ein einzelnes technologisches Fundament wird vom Handy bis zum GPU-Cluster angeboten, was die architektonische Kohärenz in einer Organisation vereinfacht. Das Support-Ökosystem ist außergewöhnlich, mit Tag-Eins-Integrationen bei Hugging Face, Ollama, vLLM, llama.cpp, MLX, NVIDIA NIM und vielen anderen, was quasi universelle Portabilität garantiert.

Tarife

Gemma 4 ist kostenlos zum Download unter der Apache 2.0-Lizenz erhältlich, die kommerzielle Nutzung ohne Einschränkung erlaubt. Die praktischen Kosten liegen nur bei Inferenzinfrastruktur: GPUs für On-Prem oder Nutzungstarife über Cloud-Anbieter wie Google Cloud, Hugging Face Inference, Baseten oder Replicate. Diese Abwesenheit von Lizenzkosten stellt einen erheblichen wirtschaftlichen Vorteil dar im Vergleich zu proprietären Modellen, besonders für hochvolumige Nutzungen.

Fazit

Gemma 4 illustriert die zentrale Position, die Open Source in der Strategie von Google DeepMind einnimmt. Die neue Familie bringt eine seltene Kombination zwischen totaler Offenheit, Referenzqualität und außergewöhnlichem Anwendungsfall-Umfang. Für KI-Teams, die Agenten, Assistenten oder fortgeschrittene Reasoning-Produkte konstruieren, ist dies wahrscheinlich die interessanteste Open-Source-Grundlage, die 2026 verfügbar ist.

❓ HÄUFIG GESTELLTE FRAGEN

FAQ — Gemma 4

Ist Gemma 4 wirklich Open Source?

Ja, die Gemma 4-Familie wird unter der Apache 2.0-Lizenz veröffentlicht, die kommerzielle Nutzung ohne Einschränkung ermöglicht.

Welche Modelle umfasst die Familie?

Gemma 4 bietet 2B- und 4B-Modelle für Edge, ein dichtes 31B-Modell für fortgeschrittene Anwendungen und einen 26B MoE, optimiert für Durchsatz.

Welche Sprachen werden unterstützt?

Über 140 Sprachen werden nativ abgedeckt, einschließlich Deutsch, Englisch, Spanisch, Französisch und vielen asiatischen Sprachen.

Verarbeitet das Modell Bilder und Videos?

Ja, Gemma 4 verarbeitet nativ Text, Bilder und Videos mit exzellentem OCR-Support und Grafik-Verständnis.

Kann man es auf Handy verwenden?

Ja, die 2B- und 4B-Versionen sind für Edge-, Handy- und Browser-Bereitstellungen konzipiert, via LiteRT-LM oder Cactus.

★★★★½ 4.8/5 (90 Bewertungen)

✅ Verifiziert von Comparateur-IA

Assistenten Code & Entwicklung

Die Open-Source-Familie von Google DeepMind, maßgeschneidert für Edge, KI-Agenten und fortgeschrittenes Denken.

💰 Preis Kostenlos (Open Source)

🆓 Kostenlose Testversion Ja

🌐 Sprachen 🇬🇧 English, 🇫🇷 Français

Website besuchen →

🔗 Auch zu entdecken

Verknüpfte Ressourcen

📖

AnleitungMás de 10 modelos de IA por 10 €/mes (TUTORIAL Mammouth AI)

→

📖

Anleitung¡7 Ejemplos INCREÍBLES para usar Gemini Nano Banana!

→