Wöchentliche Modelländerungen

Top-30 LLM Matrix

Kompakte Sicht auf Frontier-Modelle, Open-Weight-Modelle und Offline-Embeddings für EU- und DACH-Umgebungen.

Tracking 30 Top-Modelle

Letzte 7 Tage 8 echte Updates

EU-Souveränität 18 offline nutzbar

7-Tage Änderungen

letzte 7 Tage

GPT-5.5 Release 2026-04-23 Claude Opus 4.8 Opus 4.8 GA (28.05.2026) Gemini 3.5 Flash GA 2026-05-19 (I/O 2026) Mistral Medium 3.5 Neu im Vergleich (14.06.2026) DeepSeek V4 Pro Neu im Vergleich (14.06.2026) Kimi K2.6 Release 2026-04-20 MiniMax-M3 Neu im Vergleich (14.06.2026) DeepSeek V4 Flash HF-Update 27.04.2026

Rang Modell Track 7d Lizenz Einsatz Quelle

GPT-5.5 Frontier Reasoning

Sehr starke Default-Wahl, aber nicht für No-US-Anforderungen.

Frontier API API OpenAI DPA

Update 7d Release 2026-04-23

proprietär EU-Fit: mittel

Allgemeine Agentenarbeit, Research, schwierige Business-Analysen Tokens: Input bis 1M · Output bis 128k

OpenAI /v1/models + Artificial Analysis geprüft 28.04.2026

Claude Opus 4.8 Legal, Code, Analyse

Opus 4.8 löst 4.7 ab (GA 28.05.2026); $5/$25/Mtok unverändert, 1M Token Kontext. US-Provider.

Frontier API API Anthropic DPA

Update 7d Opus 4.8 GA (28.05.2026)

proprietär EU-Fit: mittel

Rechtsanalyse, Gap Analysis, komplexe Refactorings Tokens: Input 1M · Output 128k

Anthropic pricing docs (platform.claude.com) geprüft 01.06.2026

Gemini 3.1 Pro Long Context, Multimodal

Gute EU-Operationalisierung über Vertex, Setup bleibt entscheidend.

Frontier API Vertex EU-Region (europe-west1/3/4) Google Cloud CDPA

Geprüft Geprüft

proprietär EU-Fit: hoch

Lange Dokumente, mehrsprachige Analyse, Dokumentvergleiche Tokens: 1,048,576 Input · 65,536 Output

Google AI Studio /v1beta/models + Artificial Analysis geprüft 28.04.2026

Gemini 3.5 Flash Frontier Flash, Agentic Coding

Frontier-Flash, schlägt frühere Flagships auf Terminal-Bench 2.1 (76,2%); ~40% günstiger als 3.1 Pro. EU via Vertex.

Frontier API Vertex EU-Region (europe-west1/3/4) Google Cloud CDPA

Update 7d GA 2026-05-19 (I/O 2026)

proprietär EU-Fit: hoch

Agentic Coding, Tool-Use, mehrsprachige Analyse, Vorfilterung großer Mengen Tokens: 1M Input · bis 64k Output

Google AI Studio /v1beta/models + Artificial Analysis geprüft 26.05.2026

Mistral Medium 3.5 EU-souveräne Frontier-Wahl

Jetzt im Vergleich aufrufbar: EU-resident (api.mistral.ai), €1.38/€6.90 Mtok, Reasoning+Vision, außerhalb US CLOUD Act. Apache-2.0-Schwester Mistral Large 3 für EU-Self-Hosting.

Frontier API EU API (EU-resident) oder Private Deployment Mistral DPA

Update 7d Neu im Vergleich (14.06.2026)

premier; Large 3 Apache-2.0 EU-Fit: hoch

Souveräne Business-Assistenten, RAG, europäische Deployments Tokens: Input/Output im 256k Kontext (EU-resident)

api.mistral.ai/v1 + mistral.ai/pricing geprüft 14.06.2026

DeepSeek V4 Pro Reasoning, Coding

Jetzt im Vergleich aufrufbar: €0.40/€0.80 Mtok, Cache-Hit ~€0.003 (>99%), 1M Kontext, MIT-Open-Weight. CN-gehostet → DSGVO nur via EU-Self-Hosting der Gewichte.

Frontier API API oder dediziert, China-Risiko

Update 7d Neu im Vergleich (14.06.2026)

MIT EU-Fit: niedrig

General Use, Coding-Benchmarks, nicht sensible Experimente Tokens: 1M Input · bis 384k Output · Cache-Hit ~€0.003 HF: 174K Downloads · 2948 Likes

api.deepseek.com + api-docs.deepseek.com/pricing geprüft 14.06.2026

Kimi K2.6 Agentik, Coding

Frontier-Coding-Modell ($0.95/$4.00 Mtok); temperature API-seitig gelockt — bei Datenschutzprofilen restriktiv ausblenden.

Frontier API API, China-Risiko

Update 7d Release 2026-04-20

modellabhängig EU-Fit: niedrig

Preisbewusste Agenten- und Coding-Aufgaben ohne vertrauliche Daten Tokens: 262k Input · bis 66k Output

platform.kimi.ai/docs/models + Artificial Analysis geprüft 27.04.2026

Qwen3.6 Max Preview General Reasoning

Preview-Kandidat, nicht als souveräne Standardroute führen.

Frontier API API, China-Risiko

Watchlist Preview, kein GA

proprietär/preview EU-Fit: niedrig

Nichtkritische Übersetzung, Analyse und General-Use-Benchmarks Tokens: Input/Output je Preview-Route

Artificial Analysis + interner Report geprüft 28.04.2026

GLM-5.1 Coding, Agentik

Leistungsstark, aber Compliance-Kommunikation schwächer belegt.

Frontier API API oder Open-Weight-Route

Geprüft Geprüft

MIT EU-Fit: niedrig

Coding- und Agentik-Tests ohne vertrauliche Inhalte Tokens: Input/Output je API- oder Open-Weight-Route HF: 237.4K Downloads · 1527 Likes

Hugging Face Hub geprüft 28.04.2026

#10

MiniMax-M3 Agentic Coding, Office-Workflows

Jetzt im Vergleich aufrufbar: €0.55/€2.21 Mtok, Cache-Read €0.11 (80%, Write gratis), 1M Kontext, Frontier-Coding (SWE-Bench Pro 59%). CN-gehostet → DSGVO nur via EU-Self-Hosting.

Frontier API API oder Partner-Inferenz

Update 7d Neu im Vergleich (14.06.2026)

Open-Weight EU-Fit: niedrig

Office-Agenten, lange Aufgabenketten, unkritische Inhalte Tokens: 1M Input · Cache-Read €0.11 (Write gratis) HF: — Downloads · — Likes

api.minimax.io/v1 + Artificial Analysis geprüft 14.06.2026

#11

GPT Image 2 Bildgenerierung

Aktuell stärker als die früher geführte Nano-Banana-Pro-Empfehlung.

Bild & Video API OpenAI DPA

Geprüft Geprüft

proprietär EU-Fit: mittel

Professionelle Logos, Icons, Bilder und Bearbeitung Tokens: Input Prompt/Asset · Output Bild

Artificial Analysis Image Arena geprüft 28.04.2026

#12

Higgsfield Suite Video, Motion, Creative Suite

Als Suite führen, nicht als einzelnes Textmodell.

Bild & Video SaaS/API

Geprüft geprüft

proprietär EU-Fit: mittel

Marketing-Video, Storyboards, Social-Media-Produktion Tokens: Input Prompt/Asset · Output Bild/Video

Higgsfield + interner Report geprüft 27.04.2026

#13

GPT-OSS-120B Open-Weight LLM

Starker Open-Weight-Baustein mit breiter Inferenzunterstützung.

Open / Offline Self-host, EU GPU OpenAI DPA

Geprüft HF geprüft

Apache-2.0 EU-Fit: hoch

Offline-Assistenten, Agenten, souveräne RAG-Workloads Tokens: Input/Output je Self-host-Serving HF: 33.3M Downloads · 4739 Likes

Hugging Face Hub geprüft 27.04.2026

#14

Gemma 4 31B IT Multimodal Open-Weight

Für Industrie-Setups interessant, wenn Bild/Text gemeinsam analysiert werden.

Open / Offline Self-host, EU GPU Google Cloud CDPA

Geprüft Geprüft

Apache-2.0 EU-Fit: hoch

Lokale multimodale Assistenz, Dokumente, visuelle Prüfung Tokens: Input/Output je Self-host-Serving HF: 6.3M Downloads · 2383 Likes

Hugging Face Hub geprüft 28.04.2026

#15

Gemma 4 26B A4B IT Effizientes Multimodal-LLM

Guter Kandidat, wenn die 31B-Variante zu schwer ist.

Open / Offline Self-host, EU GPU Google Cloud CDPA

Geprüft Geprüft

Apache-2.0 EU-Fit: hoch

Edge-nahe Analyse, interne Assistenz, visuelle Dokumentprüfung Tokens: Input/Output je Self-host-Serving HF: 4.8M Downloads · 821 Likes

Hugging Face Hub geprüft 28.04.2026

#16

Llama 3.3 70B Instruct Enterprise Open-Weight

Sehr reifes Ökosystem, Lizenz ist nicht Apache.

Open / Offline Self-host, EU GPU

Geprüft HF geprüft

Llama 3.3 EU-Fit: hoch

RAG, interne Copilots, lange Business-Workflows Tokens: Input/Output je Self-host-Serving HF: 11.0M Downloads · 2740 Likes

Hugging Face Hub geprüft 27.04.2026

#17

Mistral Small 3.1 24B EU-nahe Open-Weight-Wahl

Sehr guter Standard für lokale EU-Deployments mit niedrigerem TCO.

Open / Offline Self-host, EU GPU Mistral DPA

Geprüft HF geprüft

Apache-2.0 EU-Fit: hoch

DACH-RAG, Übersetzung, kompakte Assistenten Tokens: Input/Output je Self-host-Serving HF: 2.9M Downloads · 1356 Likes

Hugging Face Hub geprüft 27.04.2026

#18

Qwen3 32B Open-Weight Reasoning

Technisch stark, aber Datenprovenienz/China-Kontext gesondert bewerten.

Open / Offline Self-host oder EU-Host

Geprüft HF geprüft

Apache-2.0 EU-Fit: mittel

Preisbewusste lokale Analyse und Coding-Assistenz Tokens: Input/Output je Self-host-Serving HF: 27.4M Downloads · 689 Likes

Hugging Face Hub geprüft 27.04.2026

#19

Qwen3 14B Kompakter Open-Weight

Guter Kandidat für On-Prem-Piloten mit begrenzter GPU-Kapazität.

Open / Offline Self-host, kleinere GPUs

Geprüft HF geprüft

Apache-2.0 EU-Fit: mittel

Lokale Assistenten, Klassifikation, kostensensible Analyse Tokens: Input/Output je Self-host-Serving HF: 15.2M Downloads · 389 Likes

Hugging Face Hub geprüft 27.04.2026

#20

Qwen3 8B Leichtes Open-Weight LLM

Hohe Nutzung auf HF, aber nicht für harte Frontier-Aufgaben.

Open / Offline Self-host, Edge-tauglicher

Geprüft HF geprüft

Apache-2.0 EU-Fit: mittel

Lokale Vorverarbeitung, einfache Agents, Kostenkontrolle Tokens: Input/Output je Self-host-Serving HF: 52.4M Downloads · 1066 Likes

Hugging Face Hub geprüft 27.04.2026

#21

DeepSeek V4 Flash Schnelles Reasoning

Heute aktualisiert, Inferenzprovider-Status noch nicht stabil genug.

Open / Offline Self-host oder Partner-Inferenz

Update 7d HF-Update 27.04.2026

MIT EU-Fit: mittel

Experimentelle schnelle Reasoning-Läufe ohne sensible Daten Tokens: Input/Output je Self-host- oder API-Route HF: 65.7K Downloads · 756 Likes

Hugging Face Hub geprüft 27.04.2026

#22

DeepSeek V3.2 MoE Open-Weight

Betrieb ist schwergewichtig; Governance sorgfältig dokumentieren.

Open / Offline Self-host, sehr große GPUs

Geprüft HF geprüft

MIT EU-Fit: mittel

High-End-Reasoning in dedizierten Labor- oder Benchmark-Setups Tokens: Input/Output je Self-host-Serving HF: 12.2M Downloads · 1423 Likes

Hugging Face Hub geprüft 27.04.2026

#23

Phi-4 Multimodal Instruct Kompakt multimodal

Stark für Spezialaufgaben, nicht als universelles Frontier-Modell führen.

Open / Offline Self-host, kleinere GPUs Microsoft Trust Center

Geprüft HF geprüft

MIT EU-Fit: hoch

Lokale Audio-/Bild-/Textanalyse mit begrenzter Infrastruktur Tokens: Input/Output je Self-host-Serving HF: 6.4M Downloads · 1595 Likes

Hugging Face Hub geprüft 27.04.2026

#24

Jina Embeddings v3 EU-markiertes Embedding

Sehr relevant, aber wegen Non-Commercial-Lizenz nicht als Standard für Industrie-Rollout führen.

Embedding / Offline Self-host, Lizenz prüfen

Geprüft Geprüft (CC-BY-NC)

CC-BY-NC-4.0 EU-Fit: hoch

Benchmark für mehrsprachige Retrieval-Qualität in EU-Kontexten Tokens: Input-Chunks · Output Vektor HF: 65.9M Downloads · 1139 Likes

Hugging Face Hub geprüft 28.04.2026

#25

BGE-M3 Multilingual Embedding

Sehr robuster Standard für deutsche Industrie-RAG-Pipelines.

Embedding / Offline Self-host, ONNX/TEI

Geprüft MTEB/HF geprüft

MIT EU-Fit: hoch

Mehrsprachiges RAG, Eventsuche, Prozessdaten-Retrieval Tokens: Input-Chunks · Output Vektor HF: 138.0M Downloads · 2950 Likes

Hugging Face Hub + MTEB geprüft 27.04.2026

#26

BGE Reranker V2 M3 Multilingual Reranker

Für Legal, Qualitätsberichte und industrielle Event-Analysen wichtig.

Embedding / Offline Self-host, TEI

Geprüft MTEB/HF geprüft

Apache-2.0 EU-Fit: hoch

Hochpräzise Trefferreihenfolge nach Embedding-Suche Tokens: Input Textpaare · Output Score HF: 55.9M Downloads · 965 Likes

Hugging Face Hub + MTEB geprüft 27.04.2026

#27

Nomic Embed Text V2 MoE MoE Embedding

Passend für Prozesssteuerungs-Events, wenn Latenz und Präzision zählen.

Embedding / Offline Self-host, Sentence Transformers

Geprüft MTEB/HF geprüft

Apache-2.0 EU-Fit: hoch

Model-of-Experts für lokale, mehrsprachige Retrieval-Pipelines Tokens: Input-Chunks · Output Vektor HF: 9.3M Downloads · 465 Likes

Hugging Face Hub + Nomic geprüft 27.04.2026

#28

Multilingual E5 Large Instruct Instruct Embedding

Gut erklärbarer Embedding-Baseline-Kandidat für EU-On-Prem.

Embedding / Offline Self-host, TEI/ONNX

Geprüft MTEB/HF geprüft

MIT EU-Fit: hoch

Mehrsprachige Dokument- und FAQ-Suche, technische Wissensbasen Tokens: Input-Chunks · Output Vektor HF: 23.8M Downloads · 619 Likes

Hugging Face Hub + MTEB geprüft 27.04.2026

#29

Snowflake Arctic Embed L v2.0 Enterprise Embedding

Stark für Retrieval, wenn Apache-2.0 und Enterprise-Tooling zählen.

Embedding / Offline Self-host, TEI/ONNX

Geprüft MTEB/HF geprüft

Apache-2.0 EU-Fit: hoch

Enterprise-Retrieval, mehrsprachige Suche, Audit-Dokumente Tokens: Input-Chunks · Output Vektor HF: 8.9M Downloads · 241 Likes

Hugging Face Hub + Snowflake geprüft 27.04.2026

#30

GTE Qwen2 7B Instruct Großes Embedding/Rerank-Modell

Leistungsstark, aber schwerer zu betreiben als kompakte Embeddings.

Embedding / Offline Self-host, große GPU

Geprüft MTEB/HF geprüft

Apache-2.0 EU-Fit: mittel

Präzises Retrieval für technische und industrielle Dokumenträume Tokens: Input-Chunks · Output Vektor HF: 3.3M Downloads · 479 Likes

Hugging Face Hub + MTEB geprüft 27.04.2026