Wie Minnesota Star Tribune an einem Wochenende schaffte, wozu die New York Times Jahre brauchte
Die Tageszeitung Minnesota Star Tribune startete ein KI Labor, von dem nicht nur sie selbst profitiert, sondern kollektiv auch weitere lokale Medien - Tool der Woche: Perplexity Pro Reiseführer
Auf dem wundervoll inspirierenden International Journalism Festival in Perugia (mein erster Besuch seit 2016) habe ich mit Aron Pilhofer über die KI-Strategie der Minnesota Star Tribune gesprochen. Aron ist Produktchef bei der Star Tribune Media Company in Minneapolis, dem größten Medienunternehmen im US-Bundesstaat Minnesota, und er gehört zum Team des KI Lab. Er ist außerdem Mitgründer der Sigma Awards (ein internationaler Wettbewerb der weltweit besten Datenjournalisten) sowie der Journalismus/Programmierer-Organisationen Hacks/Hackers und Document Cloud. Dieser Newsletter baut darauf auf, was Aron Pilhofer mir im Gespräch erzählt hat sowie seinen Aussagen auf diesem Panel: At the cutting edge of local news: hear from the innovators making things work.
KI Lab Team und Struktur
Das Star Tribune KI Labor startete Ende 2024 als zunächst interne Initiative und expandierte mit Hilfe von 500.000 Dollar Fördergeldern des Lenfest Instituts und einem Guthaben von Open AI für Chatbot-Anfragen (API Abruf-Credits). Das Lab besteht nun aus drei Team-Mitgliedern: Aron Pilhofer, Laborchef Chase Davis (früher Star Tribune CvD und noch früher Leiter des Interactive Department bei der New York Times, zu dem auch Aron Pilhofer gehörte), and ein Software-Ingenieur. Das KI Lab ist an die Produkt- and Software-Entwicklungsteams der bei Star Tribune angegliedert.
Ein einzigartiger kollaborativer Ansatz
Das Minnesota Star Tribune AI Lab zeichnet sich vor allem durch seinen Anspruch aus, offen mit anderen lokalen Unternehmen zusammen zu arbeiten und seine Erkenntnisse und Produkte mit der Branche zu teilen. Anders als andere KI-Initiativen, die proprietäre Tools entwickeln, setzt die Star Tribune mit seinem Lab bewusst auf Open Source. Das Flaggschiff-Projekt Agate* wird nicht nur für den internen Einsatz entwickelt, sondern mit dem expliziten Anspruch, dass die Medienbranche und zwar vor kleinere lokale Medien davon profitieren sollen.
Die Star Tribune ist maßgeblicher Partner der “Greater Minnesota Initiative,” die gemeinsam mit anderen Lokalmedien ein nachhaltig wirtschaftlich erfolgreiches Ökosystem für Lokaljournalismus aufbauen will. Kleinere lokale Medien haben dafür nicht die finanziellen Mittel, was die Open Source Initiative der Star Tribune besonders wertvoll macht.
Agate: Fokus auf technologischer Innovation und Verifizierung
Der technologische Anspruch ist klar definiert: Nur verlässliche und verifizierte Daten sollen das Labor verlassen. Um das zu erreichen, baut das System von Agate auf einem anspruchsvollen Workflow auf, der vier Stufen enthält:
Input-Stufe: Das System nimmt Inhalte auf
Verarbeitungs-Stufe: KI-Analyse und KI-generierte Datenausgabe
Validierungs-Stufe: Verifizierung des KI-Outputs
Output-Stufe: Strukturierte Datenausgabe
Die Validierungs-Stufe ist besonders wichtig. Sie enthält automatisierte Checks, um sicher zu stellen, dass die KI nicht “fabuliert”. Das System markiert mögliche Fehler für die redaktionelle Überprüfung und lässt gesichert als richtig befundene Inhalte automatisiert durchgehen. Ein Beispiel: Wenn die KI Kochrezepte verarbeitet, vergleicht das System automatisch jede Zutat und jeden Schritt des Rezepts mit den Originalrezepten im Archiv und markiert nur möglicherweise problematische Stellen für den manuellen Check.
Agate ist darauf trainiert, Zusammenhänge zu erkennen
Agate nutzt Large Language Models (LLMs) für die fortgeschrittene Erkennung und Extraktion von Datenkategorien wie z.B. Namen und Orte (entity extraction) und ist besonders gut darin, Zusammenhänge zu erkennen. Das System kann beispielsweise Beziehungen zwischen Orten und Ereignisse herstellen, auch wenn diese in Beiträgen nicht explizit genannt werden.
Was bedeutet das konkret? Aron Pilhofer erläutert das mit einem Beispiel: “Agate versteht, warum ein Ort genannt wird. Wenn ich das System zum Beispiel auffordere, mir alle Stories mit Autounfällen an einem bestimmten Ort aufzulisten, dann erkennt Agate den relevanten Ort auch dann, wenn er nicht explizit in einer Story vorkommt.”
In einem anderen konkreten Beispiel fand Agate eine relevante lokale Story, weil das System den Zusammenhang herstellte zwischen einem Basketball-Spieler in der Profiliga NBA, der früher die Privatschule Benilde-St. Margaret's besucht hatte und einem relevanten Ort. Das LLM erkannte eigenständig, dass sich die Privatschule in St. Louis Park befindet (ein Vorort der Stadt Minneapolis), obwohl der Ort nirgendwo erwähnt wurde.
Wie aus unstrukturierten Inhalten wertvolle Datenbanken werden
Wer bis hierhin gelesen hat, fragt sich wahrscheinlich inzwischen, was das alles mit der New York Times zu tun hat, und wie es der Star Tribune gelang, etwas viel schneller zu bauen als die NYT mit ihren vielfach größeren Ressourcen. Mit einer Anwendung verblüffte Agate das KI Lab Team besonders und zwar mit einer strukturierten Datenbank für Kochrezepte. “Wir haben an einem Wochenende geschafft, wofür die New York Times Jahre gebraucht hat und was sie Millionen von Dollars gekostet hat”, so Aron Pilhofer.
Das System extrahiert Zutaten und Rezeptschritte und verwandelt sie in strukturierte Daten im JSON-Format mit Verifizierung. Die Star Tribune ist sich noch nicht sicher, ob aus der Anwendung ein Produkt werden soll, und wenn ja, welches. Aber die Anwendung demonstriert, welches Potenzial Agate hat.
Fairerweise muss man dazu sagen, dass es die Koch-App der NYT schon seit 2014 gibt, als KI noch lange nicht so fortgeschritten war wie heute. Dennoch startete NYT Cooking mit anfangs 16.000 Rezepten, und viele davon stammten aus dem unstrukturierten alten Printarchiv. Inzwischen enthält NYT Cooking mehr als 23,000 Rezepte, hat mehr als eine Million zahlende Abonnenten (plus “All Access” Digital-Abonnenten subscribers) und ist ein erheblicher Umsatztreiber.
Praktische Anwendungen and Zukunftsvision
Das Star Tribune KI Lab entwickelt Tools für spezifische praktische Anwendungen, wie beispielsweise:
Hyperlokale Newsletter produzieren, deren redaktionelle Erstellung zu resourcen-intensiv und damit ineffizient wäre
Einen “Knowledge Graph” bauen als Plattform um darauf weitere Tools zu entwickeln
Extraktion von vielfältigen Datenkategorien entwickeln, Zusammenhänge über simple Identifizierungen hinaus verstehen
Strukturierte Daten aus unstrukturierten Inhalten herausziehen (wie im Experiment Kochrezepte)
Die Star Tribune plant, Agate von einem Tool, mit dem vornehmlich Software-Ingenieure umgehen, in eine zugängliche Plattform zu verwandeln, mit spezifischen Inputs und Outputs, wie beispielsweise: Ortsdaten aus Berichten in einbettbare Karten verwandeln. Dieser Plattform-Ansatz zielt darauf ab, auch Publisher mit geringer technischer Expertise zu erreichen.
Derzeit zielt die Star Tribune durch eine Partnerschaft mit der Minnesota Newspaper Association und lokalen Publishern darauf ab, die lokale Medienlandschaft in Minnesota zu stärken. Doch die KI-Initiative ist nicht zwingend auf Minnesota begrenzt, sondern kann auch auf weitere Bundesstaaten ausgeweitet werden. Das Team rechnet damit, dass die neue zugänglichere Version von Agate schon in diesem Jahr verfügbar sein wird. Lokale Publisher zeigten bei Meetings bereits hohes Interesse.
Warum ist das KI-Lab der Star Tribune relevant für die Medienindustrie?
Agates “Sicherheits-System” mit dem Fokus auf Verifizierung spricht eines der drängenden Probleme von KI im Journalismus an: verlässliche KI-generierte Inhalte und Unterdrückung von Halluzinationen.
Die Fähigkeit, nicht ohne weiteres ableitbare relevante Ortsdaten zu erkennen und Verbindungen herzustellen, macht die Archive von Lokalmedien wertvoller.
Zeitlose Evergreen-Inhalte zu finden und zu strukturieren, macht es möglich, daraus neue Verticals zu entwickeln - zum Beispiel Rezepte, Spiele und - speziell im Lokaljournalismus - zum Beispiel auch lokale Geschichte oder - lokale Sportgeschichte. Diese Verticals haben dann das Potenzial für Monetarisierung, zum Beispiel als Premium-Inhalte für teuere Abonnementstufen oder als eigenständige Apps.
Mit der Einrichtung von KI-Labs - sei es eigenständig oder kollaborativ - können lokale Medienunternehmen die Chance nutzen, proaktiv mit zu steuern, wohin sich KI entwickelt. Oder, um es mit den Worten von Aron Pilhofer zu sagen: “Innovation ist etwas, was normalerweise mit uns passiert. Dies ist eine der seltenen Chancen, die es uns ermöglicht, selbst zum Treiber von Innovation zu werden, die uns hilft.”
*Agate is amerikanischer Zeitungsjargon. So heißt die winzige Schrifttype, die für statistische Daten oder Rechtsbelehrungen verwendet wird.
Tool der Woche: Perplexity Pro Reiseführer
Nach dem IJF verbringe ich mit meinem Partner derzeit eine Woche in Neapel, halb Arbeit, halb Urlaub. Ich bin noch nie in Neapel oder der Region Kampanien gewesen und hatte nicht die geringste Zeit, vor der Abreise nach Perugia Reiseführer oder -Websites zu studieren. Ich habe deshalb Perplexity Pro für mich arbeiten lassen. Ich wusste nur, dass wir auf jeden Fall Pompeji besuchen und die historische Altstadt von Neapel besuchen und eine Woche lang typisch neapolitanische Küche rauf und runter probieren wollten. Ansonsten war ich für Vorschläge offen.





Ich habe folgende Prompts genutzt: “what are the best sights to see in Naples that are authentic and not overly touristy” und Give me 10 authentic Neapolitan restaurants in Naples Italy, and the 10 best coffee shops, all in Naples, Italy . Focus on authenticity, not on popularity with American tourists. Perplexity spuckte einige überraschend gute Vorschläge aus. Anschließend habe ich in einem dritten Prompt nach Pubs mit IPA vom Fass gefragt. Diesmal aber nicht mit der Einschränkung “nicht auf amerikanische Touristen fokussieren. Denn wenn es um Bier geht, bin ich genau das.
Wenn Du das nächste Mal Reisetipps brauchst, frag doch mal probeweise Dein Lieblings-Sprachmodell.