Daten-Dribbling mit dem Podcast Fußball MML

Zum Start der neuen Bundesliga-Saison 2022/23 haben wir uns mit dem erfolgreichen Podcast Fußball MML beschäftig. Dieser Podcast zeichnet sich dadurch aus, dass er trotz einer vom FC Bayern dominierten Bundesliga immer wieder witzige Geschichten und Anekdoten erzählt, die die fehlende Spannung an der Tabellenspitze vergessen machen. Fußball in einem Podcast ist ein zuverlässiger Content-Lieferant, da an jedem Spieltag neue Ereignisse geschehen. Die Kunst von Fußball MML besteht darin, ein witziges Infotainment (Information und Unterhaltung) zu kreieren. Nach einer Folge MML sind die Hörer auf dem neusten Stand der Bundesliga und haben beim nächsten Kneipenbesuch ein lustiges Smalltalk-Thema auf der Pfanne.

Aufstellung der Daten-Analyse

Von April bis Mitte Juni 2022 haben wir alle 11 Episoden von Fußball MML transkribiert, also das gesprochene Wort im Podcast in eine schriftliche Version umgewandelt. Auf dieser Grundlage haben wir Methoden des Text-Mining angewendet und dabei einige spannende Erkenntnisse gewonnen. Um die Ergebnisse besser einordnen zu können, zur Erinnerung hier stichpunktartig die wichtigsten fußballerischen Ereignisse im Untersuchungszeitraum: Pokalhalbfinals, UEFA-Pokal Halbfinals, letzter Spieltag der Bundesliga, UEFA-Pokal Finale, Pokal-Finale, Relegation, Finale Champions League und Länderspiele in der Nations League.
Bei der Analyse müssen Abstriche bei der Genauigkeit in Kauf genommen werden, da gerade der Fußball-Fachjargon, Ironie und neue Wortschöpfungen schwierige Themenfelder für eine maschinelle Texterkennung sind. Weiterhin ist es nicht verwunderlich, dass bei der Transkribierung einer Folge MML bis zu 10 unterschiedliche Sprecher identifiziert wurden, weil Uli Hoeneß, Helmut Kohl und Reiner Calmund gefühlt gleichzeitig von Micky Beisenherz imitiert werden.

Spitzenreiter

Alle drei Moderatoren Micky Beisenherz, Maik Nöcker und Lucas Vogelsang haben Lieblingsvereine. Diese Fanliebe spiegelt sich in der Liste der Club-Nennungen wider. An erster Stelle steht Borussia Dortmund (Micky Beisenherz‘ erster Lieblingsverein). Auf Platz zwei folgt dicht dahinter der polarisierende FC Bayern München. Zwar hält sich die Sympathie bei den Moderatoren für die Bayern in Grenzen, doch kommt ein Podcast über die Bundesliga nur schwer am „FC Hollywood“ vorbei; zumal die Protagonisten beim Rekordmeister immer wieder für unterhaltsamen Gesprächsstoff sorgen. In fünf von 11 Episoden war der FC Bayern der meistgenannte Verein, was und uns später zu der Frage führt: Haben Episoden mit hohem FC Bayern-Anteil eine bessere oder schlechtere Stimmung? Die Hertha von Lucas Vogelsang landet auf dem dritten Platz. Das Spitzentrio vereinigt ca. 50% aller Vereinsnennung auf sich. Maik Nöckers St. Pauli schafft es hinter dem UEFA-Pokal-Gewinner Eintracht Frankfurt auf Platz 5.

Stimmungsanalyse der Episoden

„Die scheiß Stimmung, für die seid ihr doch zuständig und nicht wir.“ (Uli Hoeneß)

Basierend auf einer Datenbank werden Wörtern positive Score-Werte und negative Score-Werte zugewiesen. Die Summe der positiven Score-Werte je Episode geteilt durch die negativen Werte geben einen Hinweis, welche Episode besonders fröhlich oder wann die Stimmung etwas schlechter war.

Es ist naheliegend zu erwarten, dass Episoden mit einem hohen Anteil an FC Bayern-Nennungen von der Stimmung negativer sind als andere. Diese Hypothese lässt sich nicht entkräften, aber auch nicht so richtig bestätigen. Der Stimmungs-Index und FC Bayern-Nennungen korrelieren nur leicht negativ mit einem Wert von -0,13. D.h., Episoden mit hohem Anteil an Bayern-Nennungen haben eine leicht negativere Grundstimmung.
Der Stimmungs-Index korreliert jedoch sehr deutlich negativ mit der Anzahl der Nennungen eines anderen Vereins: Hertha BSC Berlin. Die Hertha korreliert mit einem Wert von -0,56 mit dem Stimmungs-Index. Also je häufiger die Hertha in einer Episode genannt wird, desto schlechter ist die Stimmung in der Episode. Aufgrund der Vielzahl an verpassten Möglichkeiten der Berliner zum Saisonende den Weg in die Relegation zu verhindern, ist es nicht verwunderlich, dass die Stimmungslage des Hertha-Fans Lucas Vogelsang öfters in die negative Richtung ausschlug.

Über alle untersuchten Episoden MML hinweg liegt die Stimmung bei einem Faktor von 2,19. Es werden also 2,19-mal mehr gewichtete positive Äußerungen getätigt als negative. Um den Faktor besser bewerten zu können, haben wir vier Folgen der Drinnies (Deutscher Podcast-Preis Gewinner 2022 in der Kategorie Bestes Talk-Team) ebenfalls analysiert. Die Drinnies haben über vier Folgen im gleichen Zeitraum einen Faktor von 1,61. Diesen Durchschnittswert der Drinnies unterschreitet nur die MML Episode „Emir und die Detektive“ mit einem Wert von 1,40. Ein Inhalt dieser Episode: die WM in Katar …

Abpfiff

Die Ergebnisse sollten nicht überstrapaziert werden, da es gerade für Ironie noch keine maschinelle Messgröße gibt. Jedoch sind mit dem Stimmungsvergleich je Episode interessante Ableitungen möglich.

Die Ergebnisse grafisch dargestellt in diesem PDF.