KI-Lexikon

Foundation Model: Die vortrainierte KI-Basis hinter Enterprise-Systemen

15. Mai 2026

Ein Foundation Model ist ein großes neuronales Netz, das auf riesigen Datenmengen vortrainiert wurde und für viele nachgelagerte Aufgaben adaptiert werden kann - vom Chat-Assistenten über die Dokumentenextraktion bis zum autonomen Agenten. GPT-4o, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4 und Mistral Large 2 sind 2026 die dominierenden Foundation Models. Erfahren Sie, wie Foundation Models funktionieren, wie sie sich von zweckgebundenen Modellen unterscheiden und wie Unternehmen sie auswählen und steuern.

Kernpunkte

Stanford HAI prägte den Begriff Foundation Model 2021 für breit einsetzbare, vortrainierte Modelle, die für viele nachgelagerte Aufgaben adaptiert werden
Das Training eines Frontier-Foundation-Models kostet 2025-2026 zwischen 50 Millionen und 200 Millionen US-Dollar an Rechenleistung
Die EU-KI-Verordnung klassifiziert Modelle mit mehr als 10^25 Floating-Point-Operationen als General-Purpose-AI mit systemischem Risiko
Weniger als zehn Organisationen weltweit können ein Frontier-Foundation-Model end-to-end trainieren
Die meisten Unternehmen nutzen Foundation Models über APIs (OpenAI, Anthropic, Google) oder Cloud-Plattformen (Azure OpenAI, AWS Bedrock, Google Vertex)

Definition: Foundation Model

Ein Foundation Model ist ein großes neuronales Netz, das auf breiten, allgemeinen Daten vortrainiert wurde und als wiederverwendbare Basis für viele nachgelagerte KI-Anwendungen dient - Chat, Dokumentenanalyse, Code-Generierung, Bildgenerierung, agentische Workflows - statt für eine einzelne spezifische Aufgabe gebaut zu sein.

Kernmerkmale von Foundation Models

Foundation Models sind per Design generalistisch und erreichen eine Größenordnung, die einzelne Task-Modelle nicht rechtfertigen könnten - das ermöglicht den Transfer gelernter Muster auf Aufgaben, für die das Modell nie explizit trainiert wurde.

Trainiert auf riesigen Datensätzen mit Text, Code, Bildern oder multimodalen Inhalten
Einmal mit enormem Aufwand trainiert, dann vielfach adaptiert durch Prompting, Fine-Tuning oder Retrieval
Zero-Shot- und Few-Shot-fähig bei Aufgaben, für die das Modell nicht spezifisch gebaut wurde
Hauptsächlich über APIs und Cloud-Plattformen verteilt statt als Paket-Software

Foundation Model vs. zweckgebundenes Modell

Ein zweckgebundenes Modell wird auf aufgabenspezifischen Daten für genau eine Aufgabe trainiert - ein Spam-Klassifikator, ein Kreditscoring-Modell, ein Defekt-Erkennungsmodell. Ein Foundation Model wird auf allgemeine Fähigkeit trainiert und nachgelagert für viele Aufgaben spezialisiert. Die Wirtschaftslogik hat sich um 2021 gedreht: Statt dass jedes Team sein eigenes Machine-Learning-Modell trainiert, treibt eine kleine Anzahl von Foundation Models heute tausende nachgelagerte Anwendungen über Prompt Engineering und Retrieval an.

Bedeutung von Foundation Models im Enterprise-KI-Umfeld

Foundation Models sind das Substrat fast jeder Enterprise-Generative-AI-Einführung 2026. Laut Stanford HAIs AI Index 2025 werden mehr als 90 Prozent neuer Enterprise-KI-Anwendungen auf einem Foundation Model gebaut statt von Grund auf trainiert. Die strategische Frage für Unternehmen ist nicht mehr, ob ein Foundation Model genutzt wird, sondern welches, unter welchen Vertragsbedingungen und über welchen Bereitstellungsweg.

Methoden und Verfahren für Foundation Models

Unternehmen trainieren Foundation Models selten selbst; sie konsumieren und adaptieren sie über vier etablierte Muster.

API-Nutzung über Frontier-Anbieter

Das häufigste Muster verbindet Enterprise-Anwendungen mit einem Foundation Model über die Anbieter-API - OpenAI für GPT-4o und o3, Anthropic für Claude, Google für Gemini, Mistral für EU-residente Inferenz.

Auftragsverarbeitungsvertrag abschließen, der DSGVO und branchenspezifische Pflichten abdeckt
Region-Routing konfigurieren, um Daten innerhalb der EU zu halten
System-Prompts, Tool-Definitionen und Output-Formate pro Anwendungsfall festlegen

Cloud-Plattform-Deployment

Unternehmen in regulierten Branchen deployen Foundation Models über AWS Bedrock, Azure OpenAI oder Google Vertex - das Modell läuft im Cloud-Account, den das Unternehmen ohnehin steuert, mit bestehenden IAM-Richtlinien, Audit-Logs und Compliance-Nachweisen.

Fine-Tuning und Adaption

Für Workloads, bei denen ein generisches Foundation Model nicht spezifisch genug ist, wird das Basismodell auf Unternehmensdaten fine-getunet oder über parametereffiziente Methoden adaptiert (LoRA, Instruction Tuning). Adaption ist deutlich günstiger als Vortraining - Tausende statt Millionen Euro - und liefert ein für die Domäne spezialisiertes Modell, ohne die Basisfähigkeiten zu verlieren.

Wichtige Kennzahlen für Foundation Models

Die Bewertung eines Foundation Models erfordert Kennzahlen über Fähigkeit, Kosten und operatives Risiko - nicht nur Headline-Benchmarks.

Fähigkeits-Kennzahlen

Aufgaben-Genauigkeit auf domänenspezifischen Evaluierungen - die einzige Zahl, die in Produktion zählt
Kontextfenster-Größe - 200.000 bis 2.000.000 Token sind heute üblich und ermöglichen Volldokument-Workflows
Multimodalität - Text, Bild, Audio, Video als Ein- und Ausgaben je nach Modell
Tool-Use-Zuverlässigkeit - wie konsistent das Modell APIs in Agenten-Workflows korrekt aufruft

Kosten- und Durchsatz-Kennzahlen

Das Preismodell unterscheidet sich stark zwischen Anbietern und Tiers. McKinseys State-of-AI-Umfrage 2025 zeigt, dass Unternehmen typischerweise 60-80 Prozent ihres Generative-AI-Infrastruktur-Budgets auf Foundation-Model-Inferenz verwenden. Kosten pro Aufgabe - nicht pro Token - sind der einzige ehrliche Vergleichsmaßstab zwischen Anbietern.

Compliance- und Risiko-Kennzahlen

EU-AI-VO-Klassifikation - Modelle über 10^25 FLOPs lösen General-Purpose-AI-Pflichten beim Anbieter aus
Datenresidenz-Garantien - wo Inferenz läuft und woher Trainingsdaten stammen
Trainingsdaten-Transparenz - manche Anbieter veröffentlichen Herkunft, andere nicht
Halluzinationsrate bei verankerten vs. offenen Anfragen

Risikofaktoren und Kontrollen bei Foundation Models

Anbieterkonzentrations-Risiko

Der Frontier-Foundation-Model-Markt konzentriert sich auf weniger als zehn Organisationen. Unternehmen, die tief auf einem Foundation Model aufbauen, gehen kommerzielles Risiko ein - Preisänderungen, API-Abschaltungen, Fähigkeitsverschiebungen zwischen Modellversionen. Multi-Model-Abstraktionsschichten und Prompt-Portabilität sind zunehmend Standard-Kontrollen.

Abstraktionsschicht bauen, die Modellwechsel ohne Code-Umbau zulässt
Kritische Workflows vierteljährlich gegen alternative Modelle testen
Enterprise-Verträge mit Versions-Lock-Zusagen verhandeln

Datenexposition durch Training und Inferenz

Wenn ein Foundation Model bei einem externen Anbieter läuft, können Prompts und Outputs - je nach Vertrag - gespeichert oder für Modell-Training genutzt werden. Die Standard-Consumer-Bedingungen der meisten Anbieter sind nicht Enterprise-tauglich. Eine ausdrückliche No-Training-Klausel und EU-residente Verarbeitung sind die Mindestkontrollen für Unternehmensdaten.

Halluzination und Schluss-Folgerungs-Versagen

Foundation Models produzieren plausible, aber falsche Outputs bei Aufgaben ohne Verankerung. Enterprise-Deployments dämpfen das über Retrieval Augmented Generation, strukturierte Ausgaben und Validierung gegen Geschäftsregeln, bevor irgendeine Aktion ausgeführt wird.

Praxisbeispiel

Ein 600-Mitarbeiter-Mittelständler aus dem Maschinenbau setzte ein multilinguales Large Language Model von Anthropic über AWS Bedrock EU ein, um einen Kundensupport-Assistenten für DE, EN, FR und IT zu betreiben. Das Foundation Model bearbeitete Verständnis und Entwurf in allen vier Sprachen ohne separate Pro-Sprache-Modelle oder Nachtraining.

Ein einzelnes Foundation Model bedient vier Support-Sprachen mit konsistenter Qualität
AWS Bedrock EU hält Prompts und Outputs in den Regionen Frankfurt und Irland
Prompt-Templates und RAG verankern den Assistenten in der Produktdokumentation
Vierteljährliche Evaluierung gegen einen Alternativ-Anbieter hält die Architektur portabel

Aktuelle Entwicklungen und Auswirkungen

Reasoning-Modelle und Extended Thinking

Die 2025-2026er-Generation von Foundation Models hat explizite Schlussfolgerungs-Fähigkeiten ergänzt - OpenAI o1 und o3, Claude Extended Thinking, Gemini Deep Think. Diese Modelle tauschen höhere Latenz und Kosten gegen deutlich bessere Leistung bei komplexen, mehrstufigen Aufgaben, bei denen ältere Modelle zu einer falschen Antwort abgekürzt hätten.

Reasoning-Modelle kosten 3-5x mehr pro Token als Chat-Tier-Modelle
Geeignet für juristische Analyse, Finanzmodellierung, komplexe Code-Reviews, wissenschaftliche Aufgaben
Nicht geeignet für einfache Recherche oder Zusammenfassung - der Aufpreis rechtfertigt sich nicht

EU-souveräne Foundation Models

In Europa trainierte Foundation Models haben 2025-2026 spürbar Anteil gewonnen, weil Datenresidenz und KI-Souveränität an Bedeutung gewannen. Mistral Large 2, Aleph Alpha Luminous Supreme und das EuroLLM-Konsortium adressieren Unternehmen, die aus regulatorischen oder kommerziellen Gründen EU-trainierte und EU-gehostete Modelle benötigen.

EU-KI-Verordnung: Pflichten für Foundation-Model-Anbieter

Die EU-KI-Verordnung, ab August 2026 voll anwendbar, legt General-Purpose-AI-Anbietern oberhalb der 10^25-FLOPs-Schwelle spezifische Pflichten auf - Dokumentation, Urheberrechts-Compliance, Trainingsdaten-Zusammenfassungen sowie zusätzliche Pflichten für Modelle mit systemischem Risiko. Unternehmen, die diese Modelle nutzen, erben Transparenzpflichten nachgelagert.

Fazit

Foundation Models sind das Substrat moderner Enterprise-KI - die geteilte, vortrainierte Fähigkeit, die KI von einem Projekt-pro-Team in eine Konfiguration-pro-Aufgabe überführt. Für den Mittelstand öffnen Foundation Models Zugang zu Fähigkeiten, die kein einzelnes Unternehmen aufbauen könnte - und konzentrieren gleichzeitig kommerzielles und Compliance-Risiko auf wenige Anbieter. Die Wettbewerbsfrage lautet nicht mehr, ob man Foundation Models nutzt, sondern wie man sie sicher konsumiert - Multi-Model-Architekturen, EU-residente Inferenz, No-Training-Verträge und disziplinierte Evaluierung gegen die tatsächliche Geschäftsaufgabe. Während Reasoning-Modelle, souveräne europäische Alternativen und die EU-KI-VO parallel reifen, wird die Foundation-Model-Schicht zur strategischen Beschaffungsentscheidung, nicht zum technischen Detail.

Häufig gestellte Fragen

Was ist der Unterschied zwischen einem Foundation Model und einem Large Language Model?

Ein Foundation Model ist der Oberbegriff - jedes vortrainierte, generalistische Modell, das für viele Aufgaben adaptiert werden kann, einschließlich Text-, Bild-, Audio-, Video- und multimodaler Modelle. Ein Large Language Model ist eine spezifische Art von Foundation Model, das Text verarbeitet. Alle aktuellen LLMs (GPT, Claude, Gemini, Llama, Mistral) sind Foundation Models, aber nicht alle Foundation Models sind LLMs - Bildgeneratoren wie Stable Diffusion und Flux sind ebenfalls Foundation Models.

Welche Foundation Models nutzen Unternehmen tatsächlich 2026?

Die dominierenden Frontier-Foundation-Models 2026 sind OpenAI GPT-4o und o3, Anthropic Claude Opus 4.7 und Sonnet 4.6, Google Gemini 2.5 Pro, Meta Llama 4 und Mistral Large 2. Europäische Mittelständler nutzen häufig Claude (über AWS Bedrock EU) oder Mistral aus Datenresidenz-Gründen, GPT-4o für die breiteste Ökosystem-Unterstützung und Llama für selbst gehostete Deployments, wo Compliance es verlangt.

Was kostet das Training eines Foundation Models?

Das Training eines Frontier-Foundation-Models kostet 2025-2026 zwischen 50 Millionen und 200 Millionen US-Dollar an Rechenleistung, plus vergleichbare Summen für Datenbeschaffung, Talent und Evaluierung. Stanford HAIs AI Index 2025 berichtet, dass die teuersten Trainingsläufe 200 Millionen US-Dollar überschritten haben. Deshalb trainieren weniger als zehn Organisationen weltweit am Frontier, und deshalb konsumieren Unternehmen, statt zu trainieren.

Kann der Mittelstand ein eigenes Foundation Model trainieren?

Praktisch nein. Rechenleistung, Daten und Engineering für ein Frontier-Foundation-Model liegen außerhalb dessen, was ein Mittelständler stemmen kann. Der realistische Weg ist Fine-Tuning eines bestehenden Foundation Models auf unternehmensspezifischen Daten, was Tausende statt Millionen Euro kostet. Für die meisten Enterprise-Use-Cases reicht Retrieval Augmented Generation auf einem unveränderten Foundation Model.

Wie behandelt die EU-KI-Verordnung Foundation Models?

Die EU-KI-Verordnung schafft eine eigene Kategorie für General-Purpose-AI-Modelle, mit strengeren Pflichten für Modelle, die über 10^25 FLOPs trainiert wurden. Anbieter-Pflichten umfassen Trainingsdaten-Zusammenfassungen, Urheberrechts-Compliance, technische Dokumentation und zusätzliche Pflichten für Modelle mit systemischem Risiko. Unternehmen, die diese Modelle konsumieren, erben Transparenzpflichten - Nutzer müssen in bestimmten Kontexten informiert werden, wenn sie mit KI-generiertem Inhalt interagieren.

Was ist Fine-Tuning und wann brauchen wir es?

Fine-Tuning ist der Prozess, ein vortrainiertes Foundation Model zu nehmen und auf unternehmensspezifischen Daten weiter zu trainieren, um es für eine Domäne zu spezialisieren - juristische Texterstellung in einer bestimmten Jurisdiktion, Kundensupport in Ihrer Produktterminologie, Dokumentenextraktion auf Ihren Formularen. Sie brauchen Fine-Tuning typischerweise, wenn Prompt Engineering und Retrieval nicht ausreichen, um die erforderliche Genauigkeit zu erreichen, wenn Latenz oder Kosten ein kleineres spezialisiertes Modell verlangen, oder wenn die Domänensprache deutlich von der Trainingsverteilung des Foundation Models abweicht.

Foundation Model: Die vortrainierte KI-Basis hinter Enterprise-Systemen