Wie Lars der Einkommensteuer-Bot half, KI auf die Homepage des WSJ zu bringen
Von Nischenexperimenten zu routinemäßigen KI-generierten Rohfassungen für Marktberichte auf der digitalen Titelseite des Wall Street Journal
Tess Jeffers erklärt die KI-Strategie des WSJ auf dem International Journalism Festival in Perugia
Als Tess Jeffers zum ersten Mal eine KI-generierte Story für die Titelseite des Wall Street Journal vorschlug, wusste sie, dass sie damit eine Grenze überschritt, an die sich die meisten Redaktionen nicht heran wagten. Nicht etwa, weil die Technologie noch nicht ausgereift war, sondern weil beim WSJ viel auf dem Spiel steht, wenn etwas grundlegend schiefgeht. Doch das Experiment hat funktioniert.
KI-generierte Zusammenfassungen, die von menschlichen Redakteuren verfeinert werden, stehen nun routinemäßig neben der traditionellen Berichterstattung auf der digitalen Titelseite, die täglich 4 Millionen Abonnenten erreicht. Diese Phase ist der Höhepunkt von 12 Monaten sorgfältiger Experimente, die das WSJ auf dem Weg von der KI-Vorsicht zur KI-Zuversicht geführt haben.
Die Herausforderung, mit der alles begann
Die Reise des WSJ begann mit einer vertrauten Frustration in der Redaktion: Die Reporter ersticken in der Masse von Routineberichten, die höchste Genauigkeit verlangen, aber wenig Raum für Kreativität bieten. Statusaktualisierungen von den Märkten, Berichte über Verbraucherindexe, Gewinnzusammenfassungen von börsennotierten Unternehmen - die Art von Journalismus, den die Leser brauchen, von denen die Journalisten aber nicht gerade träumen.
Das WSJ verbrachte zu viel wertvolle Zeit mit einfachen „Was ist passiert?“-Storys, hatte aber nicht genug Zeit, um tiefer in die anspruchsvolleren „Warum ist das passiert?“-Analysen einzusteigen.
Die konventionelle Rechnung in diesem Fall ist ein brutales Entweder - Oder: entweder mehr Märkte und Ereignisse abdecken oder bei weniger Geschichten mehr in die Tiefe gehen. Die traditionelle Redaktionslogik sagte, man solle sich für eines entscheiden.
Tess Jeffers, WSJ-Direktorin für Daten und KI in der Redaktion, sah eine dritte Möglichkeit. Was wäre, wenn KI das „Was“ übernehmen könnte, damit sich die Reporter ganz auf das „Warum“ konzentrieren könnten?
Dabei stand viel auf dem Spiel: In einem abonnementbasierten Modell, bei dem das WSJ auf dem Markt der zuverlässigen Analysen in einem unerbittlichen Wettbewerb steht, könnte jeder KI-Fehltritt das über Jahrzehnte aufgebaute Vertrauen der Leser untergraben.
Das Experiment, das alles veränderte
Anstatt sich kopfüber in die Automatisierung zu stürzen, begann das WSJ mit dem, was Jeffers „winzige Experimente“ nennt - kleine Pilotprojekte, die versteckt durchgeführt wurden, um ihren Wert zu beweisen, ohne die Glaubwürdigkeit vor einem großen Publikum zu riskieren. Die gewählte Nische war ein Bot, der während der diesjährigen Steuersaison Hilfe für Steuerzahler bot.
Lars, der Steuer-Bot, wurde zum großen KI-Erfolg des WSJ.
Das Setup: Lars wurde im März 2025 eingeführt und verwendet Googles LLM Gemini 2.0 und ein Retrieval-Augmented Generation-Modell (RAG), das mit 1.300 WSJ-Steuerartikeln, Veröffentlichungen der US-Steuerbehörde IRS und Steuerleitfäden trainiert wurde. Im Gegensatz zu seinem Vorgänger Joannabot konzentriert sich Lars ganz auf Steuerfragen. (Joannabot ist ein KI-Chatbot, den die WSJ-Tech-Kolumnistin Joanna Stern entwickelt hat, um Fragen zu den neuesten iPhone-Modellen zu beantworten. Er hat leider die Tendenz, manchmal vom Thema abzuweichen.)
Die anfängliche Skepsis war beabsichtigt: Die Redakteure und Reporter des WSJ überprüften Lars per “red-teaming” auf sachliche Ungenauigkeiten, schädliche Inhalte oder daraufhin, ob er vom Thema abschweift und nicht nützlich ist. Als Lars diese Tests bestanden hatte, waren detaillierte und zuverlässige Steuerinformationen in greifbarer Nähe.
Der wichtigste Effekt: Lars ersetzte nicht die Steuerreporter, sondern half der Redaktion, das Publikum mit seinen Hunderten von sehr spezifischen und persönlichen Fragen gezielt zu bedienen - viel zu viele, als dass ein einzelner Reporter sie beantworten könnte.
Der Nebeneffekt: Lars erfüllt nicht nur echte Publikumsbedürfnisse, sondern die Reporter können ihre Zeit für tiefer gehende Recherchen über Steuerpolitik und Unternehmensstrategien nutzen.
Was den KI-Einsatz beim WSJ auszeichnet: Das WSJ setzt KI nicht ein, um Berichte schneller zu schreiben oder seinen Output mit einem geringeren Standard zu erhöhen. Die Redaktion nutzt sie, um mehr Stories auf gleichem Qualitätsniveau zu schreiben und so die Berichterstattung zu erweitern, ohne die Zahl der Mitarbeiter zu erhöhen.
Die Workflow-Integration: Die KI-Tools sind direkt in das Content-Management-System des WSJ eingebettet und nutzen die Frameworks FastAPI und Svelte, sodass kein umständlicher Wechsel zwischen den Plattformen erforderlich ist. Reporter können auf Chatbots, automatische Entwürfe und KI-Vorschläge zugreifen, ohne ihren normalen Arbeitsbereich zu verlassen. Das WSJ nutzt primär using Google Vertex als Basismodell für Product-features wie Bullet-Point-Zusammenfassungen. Zusätzlich zu Vertex, geben in-house entwickelte maßgeschneiderte Prompts dem Team den gewünschten Output.
Die Ergebnisse, die alle überrascht haben
Der Wandel war eher kultureller als technischer Natur. Wie Jeffers es ausdrückt, hat sich die Redaktion von „KI-Gegnern und KI-Enthusiasten“ zu mehrheitlich „vorsichtig neugierigen“ Journalisten entwickelt, die in KI einen Verstärker ihrer eigenen Fähigkeiten sehen.
Unerwartete Vorteile: Der Bewertungsprozess für KI hat den menschlichen Journalismus verbessert. Wöchentliche Überprüfungen der Chatbot-Ergebnisse haben den Blick der Redakteure für Genauigkeit und Voreingenommenheit bei allen Inhalten geschärft, nicht nur bei KI-generierten Beiträgen.
Was kommt als Nächstes?
Das WSJ plant bereits KI-gestützte Tools für barrierefreie Inhalte, einschließlich automatischer Untertitelung und automatischer Alt-Text-Generierung. Das WSJ erforscht KI-Agenten für die Abonnentenbindung und erweitert seinen KI-Übersetzungsdienst für Koreanisch.
Aber am aufschlussreichsten ist vielleicht, was sie nicht tun: Das WSJ wird die investigative Berichterstattung beim Schreibprozess nicht mit KI unterstützen. „Das menschliche Urteilsvermögen ist nach wie vor unersetzlich“, wenn viel auf dem Spiel steht, stellt Jeffers fest.
KI-generierte Zusammenfassungen werden transparent gekennzeichnet. Ein Click auf den “Read More” Button offenbart, nach welchen Richtlinen das WSJ KI einsetzt.
Die Konfliktzone: Die Leser misstrauen KI-generierten Inhalten zunehmend, wollen aber dennoch eine umfassende Berichterstattung. Die Lösung des WSJ: Transparenz über den Einsatz von KI in Kombination mit einer Verdoppelung der menschlichen Autoren für wirklich wichtige Stories. Das WSJ setzt weitgehend auf so genanntes AEO, „Antwortmaschinen-Optimierung“ - die Erstellung von einzigartigen Inhalten, die von KI-Search Tools nicht ohne Weiteres reproduziert werden können. Die Konzentration auf zeitlose Analysen und tiefgreifende Zusammenhänge deutet auf eine Zukunft hin, in der KI für die Verarbeitung von Nachrichten zuständig ist, während Menschen für die Interpretation und den Einblick zuständig sind.
„Wir sind nicht wirklich daran interessiert, KI-generiertes Material in großem Stil zu veröffentlichen. Was Abonnenten davon überzeugt, für uns zu bezahlen, ist unsere Originalberichterstattung, unsere Analysen, unser Fachwissen. KI-Inhalte, die von jedem erstellt werden können, sind wahrscheinlich kein Grund für ein Abonnement“, erklärte Jeffers auf einer Podiumsdiskussion auf dem Internationalen Journalismusfestival in Perugia im April.
„Unser Ziel ist es, KI zu nutzen, um unseren Journalismus schlagkräftiger und nicht nur effizienter zu machen“, so Jeffers. Nach 12 Monaten disziplinierten Experimentierens hat das WSJ einen Weg gefunden, beides zu tun - die Berichterstattung zu erweitern und gleichzeitig die Analyse zu vertiefen, die Routineaufgaben zu automatisieren und gleichzeitig die menschlichen Erkenntnisse zu erweitern.
Learnings aus der WSJ Case Study
Die Frage, die sich für Deine journalistische Arbeit und Deine Redaktion stellt, ist nicht, ob Du KI einsetzen solltest, sondern ob Du genauso diszipliniert wie das WSJ die Grenzen ziehen kannst, zwischen dem, was KI tun sollte und was nicht.
Für Journalisten: Der Ansatz des WSJ beweist, dass die Einführung von KI nicht alles oder nichts sein muss. Beginne mit Inhalten mit geringem Risiko, bei denen es auf Genauigkeit ankommt (datengetriebene Inhalte) und Kreativität zweitrangig ist. Nutze die Zeitersparnis, um Analysen und Recherchen zu vertiefen.
Für Führungskräfte: Die Aufteilung der Mitarbeiter des WSJ in drei Kategorien - 10 Prozent Antagonisten, 10 Prozent Enthusiasten, 80 Prozent vorsichtig neugierig - spiegelt wahrscheinlich ähnliche Verhältnisse vielen Redaktionen wider. Konzentriere Dich auf diese Mehrheit mit Schulungen für neugierige Anfänger, die die Technologie mit praktischen Anwendungsfällen entmystifizieren, anstatt sie als Allheilmittel zu verkaufen.
Anmerkung: Diesen Newsletter habe ich am 2. Juni upgedatet, um einige Fehler zu korrigieren und den Aspekt KI-Zufammenfassungen auszuweiten.
Benutzte Tools für die Produktion dieses Newsletters:
Otter.ai: Transkription des IJF-Diskussionspanels
Perplexity Pro: Zusätzliche Recherche
Claude 4 Sonnet: Gepromptete Rohfassung des englischen Newsletters
DeepL: Rohfassung der Übersetzung