🧭 Draft V3 — Tonlage „Reifer Milos" (Default), volle Evidenz-Tiefe eingewoben. Seriöser Aufbau wie V1 (Idee zuerst), Lockerheit auf Satzebene, kein Hype/keine Emojis. Belege im Fliesstext statt Zitat-Stakkato. Harte Zahlen (McKinsey 88/6, Deloitte, Harvey, Rocketin) vor Publikation an Originalquelle prüfen.
«We know more than we can tell.»
Warum die meisten Enterprise-AI-Initiativen eine Schicht zu hoch ansetzen
Michael Polanyi formulierte diesen Satz 1966. Er ist die Grundlage seines Konzepts vom impliziten Wissen: die Erfahrungen, Urteile und Fähigkeiten, die unser Handeln prägen, sich aber nie ganz in Worte, Regeln oder Formeln fassen lassen. Sechzig Jahre später beschreibt dieser eine Satz für mich die am stärksten unterschätzte Schwäche aktueller Enterprise AI-Initiativen.
Laut McKinsey setzen rund 88 Prozent der Unternehmen KI ein, aber nur etwa 6 Prozent erzielen daraus echten Wertbeitrag. Deloitte berichtet, dass eine grosse Mehrheit der Führungskräfte ihre KI-Initiativen hinter den Erwartungen zurückbleiben sieht. Das ist kein Tief, das von allein vorbeigeht. Das scheint mir ein Muster. Und es ist, anders als oft vermutet, kein Modellproblem.
Wir optimieren das Modell – und übersehen das Fundament
Schauen wir ehrlich hin. Woran arbeiten wir gerade alle? An der Verarbeitungsebene: RAG, Fine-Tuning, der nächste MCP-Server. Wir verbessern, wie eine KI mit Kontext umgeht – und die Fortschritte dort sind real. Nur… das eigentliche Problem liegt eine Schicht tiefer.
Denn in den meisten Unternehmen ist die Wissensbasis fragmentiert. Wir habe das alle schon mal gehört: Garbage In, Garbage Out. Sprich… ein grosser Teil des Organisationswissens ist gar nicht dokumentiert, der Rest oft veraltet, unzuverlässig oder mehrfach dupliziert. Auf genau diesem Boden bauen wir unsere modernen KI-Agenten – und wundern uns dann über mittelmässige Resultate. Der Engpass ist nicht das Modell, sondern das Substrat darunter. In unserem Team nennen wir dieses fehlende Substrat «Business Brain».
Vom Prompt zum Kontext
Ein kurzer Blick darauf, wie sich das Feld gerade selbst neu sortiert… «Prompt Engineering» reichte, solange wir kurze, abgeschlossene Dialoge mit einer KI führten. Es bricht in dem Moment, in dem Agenten über Stunden eigenständig arbeiten sollen. Anthropic hat dafür 2025 den Begriff Context Engineering geprägt: die Verschiebung von einzelnen Instruktionen hin zur Gestaltung des gesamten Informationszustands, in welchem dann ein System operiert. Harrison Chase, der CEO von LangChain, bringt es noch knapper auf den Punkt – im Grunde sei heute alles Context Engineering.
Der Analyst Nate B. Jones trennt das, was wir lange pauschal «Prompting» nannten, in mehrere eigenständige Disziplinen: «Der beste Prompt der Welt kann eine KI nicht dafür entschädigen, dass sie nicht weiss, woran du gearbeitet hast, was du bereits versucht hast, was deine Constraints sind – oder was ihr letzten Dienstag entschieden habt.» Genau dieses Nicht-Wissen ist das fundamentale Problem. Kontext ist der neue Code – und gehört entsprechend ernst behandelt.
Warum RAG allein nicht reicht
Kurz zu RAG, weil es oft als die Lösung verkauft wird. Vereinfacht gesagt sucht RAG zu einer Frage die ähnlichsten Textstellen aus euren Dokumenten und legt sie dem Modell vor. Das hilft – aber es ist Ähnlichkeit, nicht Verständnis. Das System erkennt, welche Stellen ähnlich klingen, nicht aber, wie sie inhaltlich zusammenhängen – oder ob sie die eigentliche Frage überhaupt beantworten.
Und genau das ist der Punkt: RAG ist eine Such-Methode, keine Wissens-Strategie. Es kann nur abrufen, was schon sauber dokumentiert ist – und scheitert dort, wo die Antwort erst aus dem Zusammenspiel mehrerer Quellen entsteht. Auch grössere Kontextfenster ändern daran nichts. Mehr Modell, mehr Tokens, mehr Schnittstellen… nichts davon hilft, wenn das Fundament darunter lückenhaft ist.
Die eigentliche Wand: implizites Wissen
Hier treffen sich Polanyi und der Alltag von heute. Das Wissen, das wir am dringendsten in unsere Systeme bekommen müssten, ist genau das, das sich am schlechtesten in Worte fassen lässt. Nate B. Jones sagt es unbequem deutlich: Gerade die erfahrensten, am stärksten ausgelasteten Leute tragen am meisten davon in sich – sie wenden es ständig an, ohne es je aufzuschreiben, und sind sich dessen selbst kaum bewusst.
Und er nennt eine Zahl, die hängenbleibt: Nur rund ein Fünftel des relevanten Wissens über ein Produkt oder einen Markt steckt in sauberen Daten. Der grosse Rest lebt verstreut – «in Slack-Threads, die vorbeiscrollen, in Meeting-Transkripten, die niemand liest, oder in den Köpfen sehr erfahrener Leute, die überlegen, das Unternehmen zu verlassen.» Solange diese eine Person bleibt, ist das ein theoretisches Problem. Geht sie, wird es ein sehr reales.
Neu ist der Gedanke nicht. Schon 1995 zeigten Nonaka und Takeuchi mit ihrem SECI-Modell, dass Wissen in einer Organisation auf vier Arten lebt: zwei davon stecken in Dokumenten, zwei entstehen nur zwischen Menschen – und genau die liessen sich technisch lange nicht greifen. Heute gibt es erstmals einen Weg, auch diesen menschlichen Teil systematisch einzufangen. Vorausgesetzt, man baut die Architektur bewusst dafür.
Konkret heisst das: Ein Strategie-Deck hält nur einen Bruchteil der Überlegungen fest, die hinter einer Entscheidung standen. Meeting-Notizen und CRM-Einträge erklären nur einen Teil dessen, was den Status eines Accounts wirklich ausmacht. Und Formeln wie «professionell, doch nahbar» sind am Ende leere Hüllen, in denen das eigentliche Wissen schon verloren gegangen ist. Das ist kein Dokumentations-Versagen – es ist ein strukturelles Problem.
Was ein Business Brain ausmacht
Wie sieht so ein Business Brain konkret aus? Vergessen wir das Bild vom „noch einem Wissensspeicher". Es ist kein zweites Confluence, sondern eine eigene Schicht direkt unter den Agents – die Quelle, aus der sie ihr Wissen ziehen. Und das ist keine Zukunftsmusik: Genau das bauen führende Teams gerade, vom KI-Labor Anthropic bis zum Möbelkonzern IKEA. Drei Prinzipien machen den Unterschied – jedes mit einem Beispiel, das zeigt, wie es in der Praxis aussieht.
Erstens: Nachvollziehbarkeit – jede Aussage weiss, woher sie kommt. Herkunft, Datum, Verlässlichkeit gehören an jede Information; sonst vermischen sich Vermutung und Fakt, und ein Agent argumentiert glänzend, aber falsch. Anthropic etwa hält im Gedächtnis seiner Agents fest, wer wann was hinterlegt hat, inklusive Änderungsverlauf. Praktisch heisst das: nichts ohne Quelle und Datum ablegen. Lieber „unbestätigt, Stand März" als eine glatte Behauptung ohne Herkunft.
Zweitens: Umgang mit Widersprüchen – sie werden festgehalten, nicht weggemittelt. Wenn fünf Stakeholder uneinig sind, ist genau diese Uneinigkeit die wertvolle Information – nicht der höfliche Durchschnitt. Das Team bei IKEA legt sein kuratiertes Wissen deshalb versioniert ab (Git statt Wiki), wo konkurrierende Beiträge nebeneinander stehen bleiben und gezielt aufgelöst werden, statt stillschweigend zu verschmelzen. Praktisch heisst das: abweichende Sichten sichtbar halten – wer sah was wann anders – statt sie zu einer scheinbar einigen Wahrheit zu glätten. KI glättet nämlich von selbst: Sie sagt lieber, was gefällt, als was stimmt.
Drittens: Abgleich mit der Realität – Geglaubtes wird gegen Ergebnisse geprüft. Was Menschen über ihr Marketing oder ihre Kunden glauben, ist eine Quelle – aber kein Beweis. Selbst Agents überschätzen sich: Ein Report-Agent meldete brav „erledigt" und schrieb seine Ergebnisse in Wahrheit nur auf die Festplatte – vom Resultat aus völlig unsichtbar. Die Konsequenz: Man lässt einen Agenten an echter Arbeit scheitern, macht die Lücken sichtbar und schliesst sie gemeinsam mit einem Fachexperten. Praktisch heisst das: Jede wichtige Annahme bekommt einen Realitäts-Check gegen tatsächliche Resultate, bevor man sich darauf verlässt.
Und wo fängt man an? Nicht mit einem Grossprojekt, sondern mit einer Domäne, die wehtut – Brand, ein Schlüssel-Account, ein zentrales Angebot. Dort zuerst das implizite Wissen der Schlüsselpersonen herausholen, solange sie noch da sind. Klein anfangen – aber das Fundament von Anfang an nach diesen drei Prinzipien bauen.
Ein Beleg aus der Praxis
Wie konkret das inzwischen ist, hat sich Ende Mai am Swiss MarTech Summit in Winterthur gezeigt. Jonathan Fearns von Accenture führte vor, wie sein Team für Lavazza einen «Digital Brand Brain» aufgebaut hat – die Marke, kodifiziert und maschinenlesbar gemacht. Entscheidend war eine Zahl, die er offenlegte: Nur rund 20 Prozent dessen, was eine Marke ausmacht, sind explizit – Brand Kits, Design-Systeme, Briefings, Guidelines. Die übrigen 80 Prozent sind implizit: Jahrzehnte an Entscheidungen von Creative Directors, Agentur-Calls, freigegebene und verworfene Assets. Jenes «So machen wir das», das nie in einer Guideline stand.
Es ist genau die Aufteilung, um die es in diesem Text geht – und sie kommt von aussen, von einem anderen Haus. Fearns brachte es auf einen Satz, der von Polanyi stammen könnte: Brand Guidelines seien nur ein winziger Bruchteil dessen, was eine Marke wirklich ausmacht. Bezeichnend ist auch, wo Accenture diesen Brand Brain verortet: in ihrem «Digital Core», der Schicht, auf der alles andere aufsetzt. Substrat, nicht Feature. Und es blieb keine Theorie – die resultierende Kampagne ging, vorab an synthetischen Personas getestet, in den USA live. Brand ist dabei nur eine Domäne; für Strategie, Sales, Service und Product gilt dieselbe Logik.
Woran wir arbeiten
An genau dieser Architektur bauen wir im Team seit Monaten. Die Basis ist ein versionierter Markdown-Vault, in dem dokumentierte Bestände – Brand-Material, Offerings, Strategie-Artefakte, Use-Case-Historien – neben strukturierten Schichten impliziten Wissens liegen. Dass wir auf Git statt auf klassische Knowledge-Management-Tools setzen, ist kein Zufall, sondern dieselbe Logik wie im IKEA-Beispiel: Versionierung, Herkunft und Widerspruch sind so von Anfang an eingebaut, nicht nachträglich aufgesetzt. Dazu kommt ein eigener Layer aus Interview-Agents, der implizites Wissen systematisch externalisiert – also genau jenen menschlichen Modus aus dem SECI-Modell bedient, der sich bisher nicht skalieren liess.
Ehrlich gesagt ist das Thema grösser, als wir zu Beginn dachten. Aber genau das ist der Grund, es seriös anzugehen, statt es zu überspringen.
Drei Konsequenzen
Architektonisch ist ein Business Brain eine Investition ins Fundament – eine Schicht, die unter vielen KI-Use-Cases liegt. Wer sie überspringt, optimiert weiter an Modell und Prompt, während der eigentliche Engpass eine Etage tiefer unberührt bleibt. Das ist die unbequeme Wahrheit hinter den eingangs genannten 6 Prozent: nicht zu wenig Intelligenz, sondern ein inkohärentes Fundament.
Budgetär folgt daraus ein klares Risiko. Wo niemand die Verantwortung für dieses Substrat trägt, generiert jeder ausgerollte Agent aus einer schmalen, dokumentierten Teilmenge der Realität. Das Tückische daran: Das Ergebnis wirkt kompetent genug. Die strukturelle Lücke wird erst sichtbar, wenn ein Mitbewerber sie längst geschlossen hat.
Kulturell kommt ein dritter Effekt dazu – und ehrlich gesagt der unangenehmste, weil er gerade überall spürbar ist. Die Tools sind plötzlich in jeder Hand. Jede und jeder will etwas bauen – einen Agenten hier, einen Assistenten dort – und glaubt, die Lösung gefunden zu haben. Foundation, Governance, Datenbasis? Kommt später, wenn überhaupt. Das erzeugt einen Hype-getriebenen Groove, der sich grossartig anfühlt – bis die Erwartung auf die Realität trifft.
Genau hier öffnet sich eine Lücke zwischen dem, was alle erwarten, und dem, was sich auf einem ungeklärten Fundament tatsächlich liefern lässt. Und die Erwartungen steigen schneller als die Reife: Accenture berichtete am Summit, dass drei von vier Nutzern nach einem Jahr KI-Erfahrung höhere Erwartungen haben als zuvor. Ein beeindruckender Prototyp ist eben schnell gebaut; ihn verlässlich, governance-konform und auf belastbaren Daten in Produktion zu bringen, ist eine ganz andere Liga. Wer diese Lücke nicht aktiv managt, riskiert, dass aus Begeisterung Ernüchterung wird – und am Ende das ganze Thema KI dafür büsst, dass das Fundament fehlte, nicht die Idee.
Bleibt zum Schluss eine Frage, die ich ernst meine: Auf welchem Substrat denken eure Agents eigentlich? Und wie weit reicht es in das Wissen, das jenseits eurer Dokumente liegt – in die 80 Prozent?
Quellen / weiterführend
- Michael Polanyi, The Tacit Dimension (1966)
- Nonaka & Takeuchi, The Knowledge-Creating Company (1995) — SECI-Modell
- Anthropic — Context Engineering (2025); Persistent Memory / „Dreaming"; Sycophancy
- Nate B. Jones — Disziplinen des Promptings; Tacit-Knowledge- & Organizational-Knowledge-Problem; Context Bundles
- AI Engineer (Conf-Talks) — Enterprise AI / IKEA „Knowledge Monolith" & Demand-Driven Context; The Future of RAG; Context Graphs (Neo4j); The Context Engine Gap
- Arize / Braintrust — Agent Observability & Evals
- Elicit — reproduzierbare Ableitungspläne
- Accenture / Lavazza — „Digital Brand Brain" (20 % explizit / 80 % implizit), Swiss MarTech Summit 2026, Winterthur, 28. Mai (Keynote: Jonathan Fearns)