Automatisierung20. Mai 20267 min

Modularer KI-Stack statt Modellreligion – warum Best-of-breed die richtige Architektur für KMU ist

Cremers warnt vor dem „ein Modell für alles"-Ansatz. Für KMU-Automationen heißt das: LLM für Sprache, Datenbank für Fakten, CRM für Status, Regelwerk für Compliance, Mensch für Freigaben. Best-of-breed statt KI-Monokultur.

Transluzente Glasschichten mit goldenen Kanten übereinander gestapelt – Symbol für modulare KI-Architektur mit austauschbaren Schichten

Einordnung

Daniel Cremers kritisiert die Vorstellung, ein einziges großes Modell könne alle Probleme lösen. Das ist eine direkte strategische Warnung für jeden, der KI-Automationen baut: Nicht alles mit einem Agenten erschlagen. Stattdessen modulare Architektur mit austauschbaren Schichten – Modell, Daten, Prozesslogik, Integration, Monitoring und menschliche Kontrolle. Das schützt vor Vendor Lock-in und operativen Risiken.

ETERNUM-Analyse

Warum „ein Modell für alles" gefährlich ist

Cremers vergleicht es mit einem Handwerker, der nur einen Hammer besitzt: Man kann damit auch Schrauben reinschlagen, aber es ist nicht optimal. Übertragen auf Unternehmensautomation:

Ein LLM kann Texte generieren, aber es ist keine Datenbank
Ein LLM kann Empfehlungen geben, aber es ist kein Regelwerk
Ein LLM kann Sprache verstehen, aber es ersetzt kein CRM
Ein LLM kann analysieren, aber es ersetzt kein Monitoring

Wer alles in ein einziges Modell packt, baut ein System, das teuer, instabil und schwer kontrollierbar ist.

Die modulare Architektur für KMU-Agenten

Jede Agentenlösung sollte in austauschbaren Schichten gedacht werden:

Modellschicht: LLM für Sprache und Reasoning (austauschbar: GPT, Claude, Gemini)
Daten-/Wissensschicht: Datenbank für Fakten, Wissensbasis für Branchenregeln
Prozesslogik: Workflow-Engine, Entscheidungsregeln, Eskalationslogik
Integrationsschicht: CRM, Kalender, E-Mail, Telefonie-APIs
Monitoring: Logging, Fehleranalyse, Qualitätskontrolle
Human-in-the-loop: Menschliche Freigabe bei kritischen Aktionen

Der entscheidende Vorteil: Wenn ein Modell teurer oder schlechter wird, tauscht man nur die Modellschicht – nicht das gesamte System.

Vendor Lock-in als reales Geschäftsrisiko

Cremers warnt auch vor nationalen Großmodellprojekten, die enorme Mittel verbrennen. Für KMU-Dienstleister gilt dieselbe Logik im Kleinen:

Nicht als „Claude-Agentur" oder „OpenAI-Agentur" positionieren
Nicht von einem einzigen Anbieter abhängig sein
Orchestrierung und Business-Logik unter eigener Kontrolle halten

Die richtige Positionierung ist tool-agnostisch: Beste Lösung für den Use Case, nicht Loyalität zu einem Vendor.

Das schützt gleichzeitig den Kunden und die eigene Marge – denn wenn ein Modell teurer wird, wechselt man ohne Systemumbau.

Kosten pro Ergebnis als feste Metrik

Cremers betont, dass Energieeffizienz einer der größten KI-Engpässe wird. Das menschliche Gehirn arbeitet mit 20 Watt – heutige KI-Systeme brauchen ein Vielfaches davon.

Für KMU-Automationen bedeutet das konkret: Nicht nur Tokenkosten betrachten, sondern Kosten pro Ergebnis messen:

Kosten pro beantwortetem Anruf
Kosten pro qualifiziertem Lead
Kosten pro gebuchtem Termin
Kosten pro automatisiertem Vorgang
Einsparung pro Monat

Wer diese Kennzahlen kennt, kann Retainer sauber kalkulieren und Kunden echten ROI nachweisen.

Praxistransfer

Tool-agnostisch positionieren: Nicht „Claude-Agentur", sondern „beste Lösung für den Use Case". Hauptmodell + Backup + günstige Variante für einfache Aufgaben.

Jede Agentenlösung in austauschbaren Schichten denken: Modell, Daten, Prozesslogik, Integration, Monitoring, Human-in-the-loop.

Kosten pro Ergebnis als feste Metrik einführen: Nicht Tokenkosten, sondern Kosten pro Termin, Lead oder beantwortetem Anruf.

Einfache Aufgaben mit günstigen Modellen lösen, komplexe mit leistungsstarken. Nicht für alles das teuerste Modell einsetzen.

Management-Fazit

Ein Modell für alles ist gefährlich – modulare Architektur mit austauschbaren Schichten ist der richtige Ansatz.
LLM für Sprache, Datenbank für Fakten, CRM für Status, Regelwerk für Compliance, Mensch für Freigaben.
Vendor Lock-in vermeiden: Tool-agnostisch positionieren, Orchestrierung unter eigener Kontrolle.
Kosten pro Ergebnis messen – nicht nur Tokenkosten. Das ermöglicht saubere Retainer-Kalkulation.
Wenn Inferenzkosten sinken, werden Voice Agents und Automationen profitabler – modulare Architektur macht das nutzbar.

Analyse basiert auf dem Transkript eines KI-Videos mit Prof. Daniel Cremers (TU München). Architekturempfehlungen als operative Übersetzung von ETERNUM.

KI sinnvoll einsetzen?

Lassen Sie uns in einem kurzen Gespräch klären, wie KI-gestützte Lösungen konkret in Ihrem Betrieb funktionieren können.

Potenzial-Check anfragen