Softwarebilliger.de
Softwarebilliger.de

Wie Big Data alles über Fußball verrät und Weltmeister macht

Der strengste Schiedsrichter? Die meisten Tore nach einer Einwechslung? Solche beeindruckenden Infos haben Sportreporter natürlich nicht im Kopf. Big Data liefert ihnen solche Infos und macht aus Teams sogar Weltmeister.

Welcher fiebernde Fußballfan möchte nicht wissen, ob seine mit 0:3 in der zweiten Halbzeit in Rückstand geratener Lieblingsverein das Spiel noch drehen kann? Hat die Wende jemals zuvor schon einmal ein Team geschafft? Treue Fans klammern sich ja in dieser Lage an jeden Strohhalm und sie suchen Halt in Statistiken. Und die kann ein Fußballreporter auch ohne weiteres liefern. Man staunt, welche Daten ein solcher Kommentator vermeintlich im Kopf hat. Im Kopf? Nicht ganz, denn beeindruckendes Detailwissen kommt im heutigen Geschäft des Sportreporters schließlich aus dem Computer.

Doch wie kommen die vielen Hunderttausend Informationen aus den letzten 50 Jahren eigentlich zusammen? Julian Risch und Moritz Finke haben eine Lösung entwickelt und sind dafür vom Verein für Medieninformation und Mediendokumentation mit einem Preis ausgezeichnet worden. Die beiden 25–jährigen sind Studenten des Hasso–Plattner–Instituts (HPI) und haben unter anderem Tweets, Wetterdaten und Online–Videos aus den letzten 50 Jahren Fußballgeschichte zueinander in Beziehung gebracht. Daraus leiten sie jene Fakten ab, die Reporter dann wie aus dem Ärmel schütteln und Laien mächtig beeindrucken.

So lässt sich beispielsweise blitzschnell ermitteln, dass in der Zeit zwischen der ersten Bundesliga–Saison 1963/64 und der Saison 2011/12 Matthias Scherz die meisten Tore nach der Einwechslung erzielte – insgesamt 19. Jürgen Kreyer mit 6,23 Karten pro Spiel der strengste Schiedsrichter war und Borussia Dortmund in der Saison 1995/1996 die meisten Tore in der ersten Halbzeit erzielte, nämlich 32. "Es gibt zum Fußball zwar viele verschiedene Datenquellen, aber die Informationen sind fast immer unstrukturiert und können nicht ohne Weiteres verknüpft werden", erklärt Risch. Das sind beispielsweise Online–Texte von Journalisten, Youtube–Videos oder Beiträge aus sozialen Medien. Sie müssen, um in Statistiken berücksichtigt werden zu können, erst aufbereitet werden, bevor sie dann automatisiert in Beziehung zueinander gesetzt werden.

Um eine Datengrundlage für die jeweiligen Querverbindungen zu erstellen, greifen die beiden Informatiker auf die DBpedia zurück: Dieses Gemeinschaftsprojekt des Hasso–Plattner–Instituts und mehreren anderen Universitäten extrahiert strukturierte Informationen aus internationalen Wikipedia–Artikeln. Der Datenbestand des HPI–Projekts umfasst insgesamt 575 Mannschaften, 21.000 Spiele und 40.000 Spieler aus der Champions League sowie der 1. und 2. Bundesliga.

Beide Wissenschaftler können sich auch sinnvolle Verknüpfungen mit vielen weiteren Datenquellen vorstellen: "Es wäre beispielsweise möglich, die Einwohnerzahl des Geburtsortes mit in die Statistiken einzubeziehen. Mittels Geodaten kann ermittelt werden, in welchen Städten oder Ländern bestimmte Spieler oder Teams besonders erfolgreich sind", sagt Finke. Doch das ist noch Zukunftsmusik.

Keine Zukunftsmusik sondern heute schon Realität ist dagegen der Einsatz von Big Data bei der Deutschen Fußballnationalmannschaft. Bei der Fußball–WM 2014 in Brasilien kamen erstmals Datenbanken zum Einsatz, die das eigene Spielverhalten und das der Gegner blitzschnell analysieren konnten. Das DFB–Team setzte damals eine Vorabversion von SAP Match Insights ein. Durch die Analyse von Spielszenen konnte Mithilfe der SAP–Technologie der durchschnittliche Ballbesitz der deutschen Spieler vor dem Abspiel von 3,4 Sekunden auf 1,1 Sekunden verkürzt werden. Das soll die Brasilianer (die der DFB ebenfalls mit SAP Match Insights gründlich analysiert hatte) im Halbfinale so verwirrt haben, dass Deutschland scheinbar mühelos den Gastgeber bezwang und schließlich Fußballweltmeister wurde.

Natürlich hat sich SAP damit geschmückt, den Fußballweltmeister gemacht zu haben. Kein Wunder, wurde doch Europas größter Softwarehersteller SAP von Hasso Plattner mitgeründet, dem Namensgeber und Stifter des Instituts, an dem der Unternehmer die beiden Preisträger Julian Risch und Moritz Finke forschen lässt.

Bildquelle: obs/HPI Hasso–Plattner–Institut/HPI/K. Herschelmann

Die mit einem * markierten Felder sind Pflichtfelder.