Interaction Models statt Chatbots – warum die Zukunft von Voice Agents natürlicher und agentischer wird
Thinking Machines Lab zeigt Interaction Models: Systeme, die Audio, Video und Text kontinuierlich aufnehmen, in Echtzeit denken und handeln. Das ist eine andere Produktlogik als klassischer Chat – und ein Vorgeschmack auf die nächste Generation Voice Agents.

Einordnung
Thinking Machines Lab stellt ein Interaction Model vor: ein System, das Audio, Video und Text kontinuierlich aufnimmt und in Echtzeit denkt, antwortet und handelt. Im Gegensatz zu klassischen turn-basierten Modellen (User spricht → Modell antwortet) zielt das Konzept auf parallele, kontinuierliche Interaktion: zuhören, sprechen, sehen, Tool Calls ausführen und im Hintergrund Aufgaben delegieren – gleichzeitig.
ETERNUM-Analyse
Von Turn-Based zu kontinuierlicher Interaktion
Klassische Realtime-Modelle arbeiten turn-basiert:
- 1.User spricht
- 2.Modell antwortet
- 3.User spricht wieder
Das Thinking-Machines-Konzept zielt auf ein Multi-Stream-/Micro-Turn-Design:
- Zuhören und gleichzeitig denken
- Sprechen und gleichzeitig weitere Inputs verarbeiten
- Sehen (Video/Screen) und darauf reagieren
- Tool Calls im Hintergrund ausführen
- Aufgaben delegieren ohne das Gespräch zu unterbrechen
Das ist eine fundamental andere Produktlogik als klassischer Chat.
Warum heutige Voice Agents noch unnatürlich sind
Die ehrliche Analyse: Heutige Voice Agents haben noch klare Schwächen:
- Sie unterbrechen an falschen Stellen
- Sie warten zu lange nach dem Sprechen
- Sie erkennen Pausen schlecht (Denkpause vs. Gesprächsende)
- Sie können schwer parallel handeln (zuhören + im CRM nachschauen)
- Sie klingen manchmal mechanisch
Interaction Models zeigen die Richtung: Voice Agents werden natürlicher, schneller und handlungsfähiger. Das wird den Markt für Telefonagenten massiv verbessern.
BCI als Langfristperspektive: Kontextsensitive KI
Das Video enthält auch ein Interview mit Prof. Thorsten Zander zu Brain-Computer-Interfaces (BCI). Die These: LLMs leben in Sprache, aber haben kein echtes menschliches Welt-, Werte- und Gefühlserleben. Passive BCI könnten mentale Zustände erfassen – kognitive Belastung, Aufmerksamkeit, Stress, emotionale Reaktion.
Die Langfristperspektive: KI wird stärker kontextsensitiv, multimodal und zustandsbewusst. Für Voice Agents bedeutet das mittelfristig bessere Erkennung von Frust, bessere Eskalation bei Unsicherheit, mehr situatives Verständnis.
Aber klarer Punkt: BCI ist beobachten, nicht bauen. Noch zu früh, zu forschungsnah, zu reguliert.
Was das für den Voice-Agent-Markt bedeutet
Die Entwicklung bestätigt: Voice bleibt ein starker Einstiegspunkt für KI-Automation. Aber Voice Agents dürfen nicht isoliert betrachtet werden.
Die wertvolle Kombination ist:
- Voice Agent nimmt Anfrage an
- Backoffice-Agent legt Datensatz an
- Follow-up-Agent sendet Nachricht
- Reporting-Agent erstellt Tagesübersicht
Der Wert entsteht nicht beim Gespräch allein – sondern im Prozess danach. Voice + CRM + Follow-up + Reporting ist deutlich wertvoller als ein einzelner Telefonassistent.
Praxistransfer
Voice Agents sind kein Endprodukt, sondern der Einstiegspunkt in einen vollständigen Automatisierungsprozess: Gespräch → CRM → Follow-up → Reporting.
Beobachten Sie Interaction Models als Technologietrend: Die nächste Generation Voice Agents wird natürlicher und gleichzeitig handlungsfähiger.
BCI ist faszinierend, aber aktuell kein umsetzbarer Kernbereich. Strategisch beobachten, nicht investieren.
Die Qualität von Voice Agents wird sich in den nächsten 12–18 Monaten dramatisch verbessern. Jetzt einsteigen und mit dem Markt wachsen.
Management-Fazit
- Interaction Models gehen über klassische Chatbots hinaus: kontinuierliche, parallele Verarbeitung von Audio, Video und Text.
- Heutige Voice Agents haben noch Schwächen (Pausen, Unterbrechungen, mechanischer Klang) – Interaction Models zeigen die Lösung.
- Voice Agent + CRM + Follow-up + Reporting ist das eigentliche Wertangebot – nicht der Telefonbot allein.
- BCI-Forschung zeigt die Langfristrichtung: kontextsensitive, zustandsbewusste KI. Aktuell beobachten, nicht priorisieren.
- Der Voice-Agent-Markt wird sich in 12–18 Monaten dramatisch verbessern – früher Einstieg ist ein Vorteil.
Analyse basiert auf dem Transkript eines KI-News-Videos. Beschreibungen von Thinking Machines Lab und BCI-Interview als Videoaussagen eingeordnet.
KI sinnvoll einsetzen?
Lassen Sie uns in einem kurzen Gespräch klären, wie KI-gestützte Lösungen konkret in Ihrem Betrieb funktionieren können.
Potenzial-Check anfragen

