Chat killt SaaS nicht. Das hier schon.

Nadella hat SaaS für tot erklärt und Agents als die Zukunft ausgerufen. Beim Ziel hat er recht, beim Vehikel nicht. Warum Chat-only ein Rückschritt ist — und wie eine agent-native Decision Surface tatsächlich aussieht.

02. März 2026 · Ronny · AI · Agent UI · SaaS · Decision Surfaces · Enterprise

Microsofts CEO hat SaaS für tot erklärt und Agents als die Zukunft ausgerufen. Beim Ziel hat er recht. Beim Vehikel nicht.

Hinweis: „SaaS” meint in diesem Text das, was User sehen — tab-basierte Anwendungen mit strukturierten Views, Workflows und Governed Controls — nicht das Subscription-Pricing-Modell.

Im Dezember 2024 hat Satya Nadella einem Podcast-Publikum gesagt, dass „SaaS tot ist”.¹ Business-Logik würde in eine AI-Schicht wandern. Statt zwischen CRM, Projektmanagement und Buchhaltung hin- und herzuspringen, würdest du einem Agent sagen, welches Ergebnis du willst. Den Rest macht der Agent.

Vierzehn Monate später sieht diese Zukunft so aus: Eine Procurement-Verantwortliche fragt ihren Copilot „Zeig mir alle offenen Bestellungen mit Lieferverzug.” Die Antwort kommt als Absatz. Drei Lieferantennamen, zwei Datumsbereiche, ein Hinweis, „die angehängten Daten zu prüfen”. Keine Tabelle. Kein Sort. Kein Drill-down. Kein Approve-Button. Die Procurement-Verantwortliche öffnet Excel. Jedes Mal.

Chat-only hat SaaS nicht getötet. Es hat gezeigt, warum SaaS noch existiert.

Wo Chat gewinnt

Chat ist exzellent in dem, was Chat tut. Ad-hoc-Q&A, Ideation, unstrukturierte Suche, First-Draft-Generierung, exploratives Analysieren, wenn der User die Frage noch nicht kennt. Für all das ist ein Text-Prompt der schnellste Weg zur Orientierung. Low-stakes, ergebnisoffen, single-turn: Chat gewinnt.

Aber in dem Moment, wo ein Workflow Multi-Variablen-Vergleich, persistenten State über Schritte hinweg oder Echtzeit-Exception-Handling braucht, läuft Chat gegen eine strukturelle Wand. Das Problem ist nicht, dass Chat schlecht ist. Das Problem ist, dass Chat-only Interfaces ersetzen soll, für die es nie gebaut wurde.

Das Downgrade-Problem

SaaS funktioniert wegen Bandbreite. Ein Dashboard zeigt dir vierzig Datenpunkte gleichzeitig. Farbe kodiert Dringlichkeit. Räumliche Position zeigt Zusammenhänge. Ausreißer sind sichtbar, bevor du ein einziges Label liest. Das menschliche visuelle System verarbeitet das parallel (scannend und vergleichend) in Bruchteilen einer Sekunde.

Text ist sequentiell. Ein Satz nach dem anderen. Ein Chat-Fenster zwingt dich durch diese Sequenz, und jede neue Nachricht schiebt die vorherige aus dem Sichtfeld. Zwei Zahlen vergleichen, die eine Tabelle nebeneinander anzeigen würde, wird zur Scroll-Übung. Cognitive-Fit-Theory, etabliert von Vessey in Decision Sciences und über Jahrzehnte HCI-Forschung validiert, erklärt warum: Grafische Repräsentationen schlagen Tabellen bei räumlichen Tasks, weil visuelle Verarbeitung parallel läuft, während Text serielles Decoding erzwingt.²

Das ist keine UX-Präferenz. Es ist eine Constraint, wie menschliche Kognition Informationen verarbeitet — was Cognitive Science extraneous load nennt: die mentale Anstrengung, die fürs Navigieren der Oberfläche draufgeht, statt für das Verstehen der Daten. Ein gut designtes Dashboard minimiert diese Last. Ein Chat-Fenster maximiert sie.

Die Geschichte der Computing-Welt beweist das Muster. Buchhalterbücher wichen Spreadsheets. Command Lines wichen GUIs. Gedruckte Reports wichen interaktiven Dashboards. Jeder Übergang erhöhte Informationsdichte pro Zeiteinheit. Chat-only AI dreht die Bahn um. Es nimmt die reichsten AI-Capabilities und liefert sie durch den schmalsten Output-Kanal. Das könnte ein Novum sein: eine Technologie-Generation, die mit weniger Output-Bandbreite startet als die, die sie ersetzen will.

Das gilt auch direkt für AI-Output. Ein klügeres Modell, das einen besseren Absatz produziert, bleibt ein Absatz. Trend-Erkennung, Ausreißer-Detection, Multi-Variablen-Vergleich. Diese Tasks brauchen räumliche Verarbeitung, die Text nicht liefern kann. Klügere Modelle fixen den Output-Engpass nicht. Bessere Interfaces schon.

SaaS gab Usern Dashboards, Drill-downs und Governed Workflows. Chat-only-Agents haben das alles weggenommen und durch Absätze ersetzt. Nennen wir es beim Namen: ein Rückschritt, verkleidet als Disruption.

Dieses Experiment hatten wir schon. Frühe Software war eine Command Line: mächtig, aber sequentiell, gedächtnislastig und feindlich gegenüber Nicht-Experten. GUIs haben gewonnen, weil sie State externalisiert haben — Listen, Fenster, Tabellen, Constraints — und „merk dir das Kommando” in „sieh die Optionen” verwandelt haben. Chat-only-Agents sind ein partieller Rückspuler. Sie re-encoden State in Absätze und legen die Last zurück auf den User: vergleichen, filtern, validieren, entscheiden. Der nächste Interface-Shift heißt nicht „Chat überall”. Er heißt agent-driven Decision Surfaces, in denen das Modell strukturierten State vorschlägt, der User ihn visuell inspiziert und Aktionen über Governed Controls ausgeführt werden.

Die Industrie sieht die Lücke

Zähl die Initiativen. Google hat im Dezember 2025 A2UI veröffentlicht, eine deklarative Spezifikation, in der Agents UI-Components beschreiben, die Clients nativ rendern.³ Open-JSON-UI (OpenAIs deklarative Generative-UI-Schema, jetzt community-adopted via CopilotKit⁴) bietet eine parallele deklarative Spezifikation für strukturierten Widget-Output. CopilotKit, LangGraph und CrewAI haben AG-UI gebaut, ein Event-driven Transport-Protokoll für Echtzeit-Kommunikation zwischen Agent und Frontend. Vercel hat AI SDK 6.0 als agent-first Framework mit eingebauten Tool-Approval-Gates ausgeliefert. Anthropics MCP verbindet Agents mit externen Tools und Daten. Microsofts Copilot Extensions öffnen einen Marketplace für Dritt-Integrationen.

Sechs Initiativen von sechs verschiedenen Organisationen, alle innerhalb der letzten 12–18 Monate gestartet oder gereift. Sie adressieren unterschiedliche Layer des Stacks: Tool- und Data-Connectivity (MCP), UI-Rendering-Formate (A2UI, Open-JSON-UI), Transport (AG-UI), Developer-Control-Gates (Vercel AI SDK). Aber sie teilen drei Prinzipien, die die Richtung zeigen:

Streaming statt Request-Response. Agents emittieren Events in Echtzeit, statt einen einzelnen Textblock zurückzugeben. Die UI updatet, während der Agent denkt.
Deklarative UI statt generierter Code. Agents beschreiben was gerendert werden soll, aus einem vorab approved Component-Katalog. Der Client entscheidet wie. Das ist genauso sehr eine Security- wie eine UX-Entscheidung: Deklarative Specs lassen sich validieren, sandboxen und auditieren, bevor irgendetwas auf den Bildschirm kommt. Generierter Code nicht.
Human-in-the-loop als Primitive. Jedes große Framework hat jetzt First-Class-Support, um Agents zu pausieren und User-Approval vor Ausführung zu verlangen. Nicht als Add-on. Als zentrales Architekturmuster.

Die Formel: deklarative Component-Kataloge + sicherer Transport + Approval-Gates = governance-fähiges UI-Rendering.

Das sind nicht drei Firmen, die experimentieren. Es ist eine industrieweite Konvergenz auf dieselbe Schlussfolgerung: Chat-only-Agents können SaaS nicht ersetzen. Agent-native Interfaces schon.

Was es heute gibt: Cards, Buttons, Basis-Widgets. Die publizierten Use Cases zeigen, für wen sie gebaut sind. A2UIs Demos rendern Produktkarten, visuelle Suchergebnisse, Shopping-Previews. Consumer-Szenarien, in denen Governance irrelevant ist. Die Enterprise-Incumbents bieten mehr, aber innerhalb ihrer Mauern. Microsofts Dynamics-Copilot rendert Adaptive Cards mit strukturierten Inputs und Approve-Buttons, aber keine interaktiven Charts und keine Custom-Components. SAP Joule zeigt Fiori-Cards mit Drill-down, echter visueller Dichte, aber gekoppelt an SAP-Daten, gekoppelt an Fiori-Patterns, gebaut auf einem UI-Framework, das AI-generierte Interfaces um ein Jahrzehnt vordatiert. Salesforce Agentforce hat das mächtigste Widget-Toolkit der drei, aber es ist blind für alles außerhalb des CRMs. Jede Plattform hat ihr eigenes Silo gelöst. Keine hat das Cross-System-Problem gelöst.

Was Enterprise-User tatsächlich brauchen, ist strukturell anders als alles oben: interaktive, datendichte Decision Surfaces. Filterbare Tabellen mit Drill-down, Approval-Workflows mit Audit-Trails, Dashboards mit Echtzeit-Datenfeeds, Forms, die gegen Business-Regeln validieren, bevor sie abgeschickt werden. Die Enterprise-Governance-Schicht (Access Control, Corporate Identity, Cross-System-Datenzugriff, Domain-Ownership) liegt über all diesen Protokollen. Keines der aktuellen Frameworks liefert sie.

Diese Lücke ist strukturell, nicht eine Frage von Iteration Speed.

Wie der SaaS-Ersatz aussieht

Nadellas Vision ist nicht falsch. Der Ersatz für SaaS ist einfach kein Chat-Fenster. Es ist eine Decision Surface: eine UI, die Model-Output als strukturierten State und Affordances rendert — parallele Inspektion, Governed Execution und ein Audit-Trail in einem einzigen View. Wo Chat Antworten produziert, produziert eine Decision Surface actionable State.

Beispiel Procurement. Heute, mit Chat-only-AI verspätete Bestellungen handhaben:

Frage: „Welche Bestellungen sind verspätet?”
Lies eine Textliste mit Lieferantennamen und Daten
Kopiere die Infos in Excel
Vergleiche die Lieferanten manuell, filtere nach Impact
Verfasse einen Approval-Request in einem anderen System
Logge die Entscheidung in einem weiteren System

Sechs Schritte. Drei Tool-Wechsel. Null Audit-Trail.

Der Approval-Request landet in der Inbox eines Directors mit einem reingeklebten Chat-Auszug als einzigem Supporting Document. Der Director fragt nach dem Lieferantenvergleich. Die Procurement-Lead baut ihn aus dem Gedächtnis nach. Was nicht durchkommt: Der 3-Way-Match bei einem Lieferanten ist gescheitert. Lieferantenname auf der Rechnung passte nicht zur PO, Cost-Center-Feld leer. In SAP ist das eine geblockte Zahlung. In einem Chat-Transcript ist es Absatz drei.

Eine Decision Surface komprimiert das in einen View: eine filterbare Tabelle verspäteter Bestellungen, sortierbar nach Financial Impact oder Lieferantenzuverlässigkeit. Inline-Lieferantenvergleich. Ein Approve-Button, der einen Governed Workflow triggert. Role-based Access Control prüft die Autorität des Users. Validation Rules verifizieren Budget Limits. Das System erzeugt einen Audit Record automatisch. Der User liest keine Antwort. Er handelt auf einer.

Das Muster wiederholt sich quer durch Domains. Ein Finance-Controller fragt: „Welche Cost Center haben dieses Quartal das Budget überschritten?” Chat antwortet mit einem Absatz aus fünf Cost-Center-Namen, drei Prozentzahlen und dem Hinweis, „weiter zu untersuchen”. Neun von zehn Mal heißt „weiter untersuchen” Pivot-Tabelle. Eine Decision Surface zeigt eine Variance-Heatmap: rote Zellen für Overruns, sortiert nach Magnitude, mit Drill-down in Line Items und einem Inline-Reforecast-Trigger. Der Controller handelt in demselben View, in dem er die Anomalie entdeckt hat. Kein Copy-paste. Kein Pivot-Tabellen-Umweg.

Diese Lücke — die Distanz zwischen einer Frage stellen und einen Business-Prozess ausführen — ist, was SaaS geschlossen hat. Chat-only hat sie wieder aufgerissen.

Warum Enterprise nicht auf die Plattformen warten kann

~15 Millionen bezahlte M365-Copilot-Seats über schätzungsweise ~450 Millionen kommerzielle Microsoft-365-Seats, grob 3,3% Seat-Penetration nach ~2 Jahren (Microsoft Q2 FY26 Earnings, 28. Januar 2026).⁵ Viele probieren es; Conversion bleibt niedrig.

Die Adoption-Lücke hat eine strukturelle Ursache. Das durchschnittliche Enterprise managt ~900 Anwendungen, davon sind nur 29% integriert (MuleSoft/Salesforce, 2025 Connectivity Benchmark). 95% der IT-Leader nennen diese Fragmentierung als primäre Barriere für AI-Adoption.⁶ Chat-only-AI kann diese Lücke nicht schließen. Sie beantwortet Fragen zu Daten, auf die sie zugreifen kann, aber sie kann keine Cross-System-Views rendern, keine Governed Workflows triggern, keine Verbindung zwischen Entscheidung und Ausführung herstellen. Eine Textantwort auf „zeig mir verspätete Bestellungen” ist ein Rückschritt gegenüber der SAP-Transaktion, die der User schon hatte.

Niemand hat diese SAP-Transaktion geliebt. Aber sie hat funktioniert.

Die ROI-Daten bestätigen das. Gartner prognostiziert, dass 30% der Generative-AI-Projekte bis Ende 2025 nach Proof of Concept abgebrochen werden.⁷ RAND beziffert die breite AI-Failure-to-Production-Rate auf über 80%. Die Ausnahmen teilen ein Muster: Eine IDC-Studie unter 4.000+ Business Leaders fand einen durchschnittlichen 3,7-fachen Return auf AI-Investment, aber Organisationen mit reifer Data-Integration erreichen 10,3-fach, realisiert in 13 Monaten.⁸ Die Lücke sind nicht klügere Modelle. Es ist Integrationstiefe: isolierte AI beantwortet Fragen in einem Silo. Integrierte AI verändert, wie Entscheidungen getroffen werden. Das verlangt Interfaces, die strukturierte Daten tragen, nicht Text. Niemand shippt einen Governed Workflow als Absatz.

Das ist ein universelles Problem. Jedes Enterprise in regulierten Branchen (Finance, Healthcare, Manufacturing, Government) hat bereits BI-Dashboards und Reporting-Tools. Was sie nicht haben: agent-driven Workflows, in denen AI Aktionen vorschlägt, der User sie visuell inspiziert und Execution über Access Controls, Validation Rules und Audit Trails in einer einzigen Surface läuft. Chat-only-AI überspringt das alles. In regulierten Märkten ist die Lücke schärfer. GDPR und EU AI Act verlangen souveräne, auditierbare Architekturen. Ein Procurement-Team auf SAP braucht einen Audit-Trail, der dem Regulator genügt, nicht ein Chat-Transcript. Aber die Kernanforderung ist überall dieselbe: Governed Decision Surfaces zwischen AI und User. Compliance ist kein regionales Add-on. Es ist ein architektonisches Constraint, das den gesamten Stack formt.

Der Drei-Schichten-Test

Um SaaS zu ersetzen, muss ein AI-Agent matchen, was SaaS bereits liefert. Zwei Schichten entscheiden, ob das Interface zum Task passt. Chat-only scheitert typischerweise an beiden.

1. Informationsdichte. Vierzig Datenpunkte gleichzeitig gerendert, nicht sequentiell. Tabellen, Charts, Dashboards mit visuellen Encodings (Farbe, Position, Größe), die Bedeutung ohne ein einziges Wort Erklärung tragen. Beobachtbare Anforderungen: filterbare Tabellen, Sparklines für Trend-Erkennung, Cohort-Vergleich in einem Viewport. Decision Surfaces verarbeiten Information parallel. Text verarbeitet sie seriell.

2. Actionability. Filtern, sortieren, drillen, approven, ablehnen, eskalieren. Jede User-Aktion triggert einen Governed Workflow mit Access Control, Validation Rules und Audit Trail. Beobachtbare Anforderungen: One-Click-Approval mit Policy-Check, Inline-Form-Validation gegen Business Rules, Status-Transitions mit Role-based Gates. Text beschreibt Aktionen. Interfaces führen sie innerhalb der Regeln aus.

Eine Notiz zu Governance. Governance — Access Control, Audit Trails, Approval Workflows — ist unabhängig vom Interface erforderlich. Ein Chat-Agent kann RBAC genauso enforcen und Entscheidungen genauso loggen wie ein Dashboard. Governance ist kein Grund, UI über Chat zu wählen. Aber Governance muss sichtbar sein. Wenn ein Auditor fragt „zeig mir die Approval-Kette für diesen Lieferantenwechsel”, ist ein Chat-Transcript keine inspizierbare Kontrolle. Strukturierte UI macht Governance-State lesbar: wer hat approved, wann, unter welcher Policy, mit welchen Daten. Varonis hat fast 10 Milliarden Files über 1.000 Organisationen analysiert und festgestellt: 99% haben sensible Daten gegenüber AI exponiert; 90% haben sensible Files über Tools wie Copilot für jeden Mitarbeiter zugänglich.⁹ Deloittes 2026er „State of AI in the Enterprise”-Survey unter 3.235 Leadern in 24 Ländern fand: nur 21% der Organisationen haben ein reifes Governance-Modell für autonome AI-Agents.¹⁰ Die Governance-Schicht ist nicht optional. Sie ist die Voraussetzung für Enterprise-Trust. Aber sie ist eine Architekturanforderung für jedes Agent-Interface, kein Differenzierer zwischen Chat und UI.

Informationsdichte und Actionability. Das sind die zwei Schichten, an denen das Interface den Unterschied macht. Klassisches SaaS besteht beide. Chat-only besteht keine. Chat plus strukturierte UI plus Workflow-Execution kann bestehen, aber das ist kein Chatbot mehr. Das ist eine Decision Surface. Die Lücke ist nicht kosmetisch. Sie ist architektonisch.

Was kommt

Nadella hat recht: Die Ära der Standalone-SaaS-Anwendungen mit siloisierten Daten und starren UIs endet. Aber SaaS wird nicht durch Chat ersetzt. Es wird durch agent-native UI ersetzt: deklarative Interface-Definitionen, die in produktionsfähige Surfaces mit eingebauter Governance gerendert werden.

Die Bausteine existieren: Rendering-Specs, Data-Access-Protokolle, Governance-Frameworks. Sie wurden nur noch nicht in einen Stack zusammengesetzt. Diese Assemblierung ist unvermeidlich — auf dieselbe Weise, wie GUIs Command Lines ersetzt haben: nicht weil jemand Fenster erfunden hat, sondern weil die Bausteine (Bitmap-Displays, Mäuse, Event-Loops) konvergiert sind, bis das alte Paradigma keinen Sinn mehr ergab.

Chat ist die Command Line der AI-Ära. Die CLI ist nicht verschwunden — Power-User leben weiter darin. (Viele sind sogar zurück — danke, Claude Code.) Aber sie hat aufgehört, das Mainstream-Interface zu sein, in dem Moment, in dem GUIs State sichtbar gemacht haben. Derselbe Übergang startet jetzt. Decision Surfaces werden Chat-only-Agents als primäres Enterprise-Interface ablösen. Das Tempo hängt von einer Variable ab: wie laut Procurement-Leads, Finance-Controller und Compliance-Officer ablehnen, in Absätzen zu arbeiten.

Quellen

Satya Nadella im BG2-Podcast mit Bill Gurley und Brad Gerstner, 13. Dezember 2024. Spotify. IDC-Analyse der Aussage: Bo Lykkegaard, „Is SaaS Dead? Rethinking the Future of Software in the Age of AI”, IDC Blog, 2. Dezember 2025. ↩
Vessey, I. (1991). „Cognitive Fit: A Theory-Based Analysis of the Graphs Versus Tables Literature.” Decision Sciences, 22(2), 219–240. doi:10.1111/j.1540-5915.1991.tb00344.x ↩
Google Developers Blog, „Introducing A2UI: An open project for agent-driven interfaces”, 15. Dezember 2025. developers.googleblog.com ↩
Open-JSON-UI specification, CopilotKit-Dokumentation. Offene Standardisierung von OpenAIs deklarativem Generative-UI-Schema. docs.copilotkit.ai ↩
Microsoft Q2 FY26 Earnings, 28. Januar 2026. ~15 Millionen bezahlte M365-Copilot-Seats vs. ~450 Millionen kommerzielle M365-Seats = ~3,3% Seat-Penetration. Reported by The Register, Windows Central. ↩
MuleSoft/Salesforce, „2025 Connectivity Benchmark Report”, Befragung von 1.050+ IT-Leadern. ~900 Anwendungen pro Organisation, 29% integriert, 95% nennen Integration als Barriere für AI-Adoption. blogs.mulesoft.com. Die 95%-Zahl wird durch Deloitte, „State of AI in the Enterprise”, 2026 bestätigt (siehe ¹⁰). ↩
Gartner, „Gartner Says 30% of Generative AI Projects Will Be Abandoned After Proof of Concept by End of 2025”, Pressemitteilung, Juli 2024. RAND Corporation, Ryseff et al., „The Root Causes of Failure for Artificial Intelligence Projects and How They Can Succeed”, 2024. rand.org ↩
IDC, „2024 AI Opportunity Study” (sponsored by Microsoft), Befragung von 4.000+ Business Leaders. Durchschnittlich 3,7-facher Return auf AI-Investment; Top-Performer mit reifer Integration erreichen 10,3-fach. Wert realisiert in 13 Monaten. Microsoft Blog ↩
Varonis, „2025 State of Data Security Report: Quantifying AI’s Impact on Data Risk”. Analyse von fast 10 Milliarden Files über 1.000 Organisationen. varonis.com ↩
Deloitte, „State of AI in the Enterprise”, 7th edition, Januar 2026. Befragung von 3.235 Business- und IT-Leadern in 24 Ländern: nur 21% berichten ein reifes Governance-Modell für autonome AI-Agents. deloitte.com ↩ ↩²