Ich habe mir in der Winterpause die Zeit genommen, meine bereits bestehende Datenbank zur 2. Bundesliga neu aufzubauen. Das hat verschiedene technische Gründe, welche hier keinen interessieren werden. Ausschlaggebend für den jeweiligen Leser ist lediglich, dass dieses mir ermöglicht hat neue Grafiken zu gestalten, die ich hier teilen möchte. Diese kann ich nun jederzeit für alle Mannschaften der 2. Bundesliga erstellen. Zugleich wird die Datenbank mit jedem Spieltag aktualisiert, was es mir erlauben wird, die Saisonleistung der jeweiligen Mannschaften über insgesamt 54 Metriken immer wieder neu zu bewerten. Inwieweit ich diese Option in den nächsten Wochen und Monaten wahrnehmen werde, ist noch offen und zu diesem Zeitpunkt möchte ich mich auch gar nicht mit allen Mannschaften der Liga befassen. Stattdessen werde ich erklären, wie diese Grafiken zu lesen sind und am Ende die zum HSV mit euch teilen, um dabei zu zeigen was statistisch bei der Leistung und dem Spielstil zu erkennen ist.
Aber zunächst sollte klargestellt werden, dass es sich bei diesen Daten nicht um endgültige Tatsachen handelt, die den letzten Beweis zur Leistung und dem Spielstil einer Mannschaft bieten. Vielmehr sind es Indikatoren oder Indizien, die auf Dinge hinweisen. In der Regel benutze ich solche Indikatoren, um zweierlei zu tun.
- Meine subjektive Wahrnehmung durch objektive Metriken bestätigen bzw. widerlegen.
- Beim Schauen von Spielen nach Gründen für den Stand der Daten suchen.
Zahlenchaos organisieren
Ich habe die erwähnten 54 Metriken in vier Kategorien aufgeteilt: Chancen, Ballbesitz, Verteidigen, und Torwartspiel. Dabei unterscheide ich beim Ballbesitz und dem Verteidigen zwischen Leistungsdaten und Stildaten, die eher, aber nicht ausschließlich Indikatoren für den Spielstil sind. Die Chancengrafik befasst sich ausschließlich mit Leistungsdaten, obwohl auch hier auf gewisse Stilunterschiede hingewiesen wird (z.B der Anteil von vorgelegten Schüssen oder die durchschnittliche Schussdistanz). Zudem ist die Grafik zum Torwartspiel eine Mischung aus Leistung und Spielstil. Ihr seht schon, es ist nicht immer einfach statistisch zwischen Leistung und Stil zu unterscheiden. Denn letztlich weist ein hoher Wert in einem Stil-Bereich (z.B. Ballbesitz) auch darauf hin, dass man in diesem Aspekt gewisse Qualitäten hat (z.B. technische Qualitäten mit dem Ball). Zugleich bedeutet ein niedriger Wert (z.B. Anzahl von Zweikämpfen) nicht automatisch, dass einer Mannschaft die Qualität beim Verteidigen fehlt. Das Gegenteil ist sogar möglich, aber mehr dazu im nächsten Absatz. Dennoch ist es sinnvoll, diese Unterscheidung zu machen, um nicht alle Werte auf die gleiche Weise zu interpretieren und um Trugschlüsse zu vermeiden, wie z.B. die Idee, dass Mannschaften mit über 50% Ballbesitz auch automatisch die besseren sind. Letztlich entstehen durch die erklärte Unterteilung sechs Grafiken. Manche der aufgezeigten Metriken sind für jeden sehr leicht zu verstehen. Denn jeder wird wissen was ein Tor, Schuss, Pass oder Zweikampf ist. Es gibt aber auch ein paar Metriken, die nicht für jeden sofort offensichtlich sein werden. Deshalb habe ich in solchen Fällen eine kurze Beschreibung unten rechts in den Rand geschrieben. Trotzdem: Wer Fragen hat, darf sie mir gerne stellen. Denn letztlich geht es mir darum, dass wir zusammen verantwortlich und ehrlich mit solchen Daten umgehen.
Grafiken lesen
Nun zu den Grafiken. Simpel ausgedrückt sind die Radare eine Darstellung, wie hoch (oder niedrig) eine Mannschaft bei den einzelnen Metriken einzustufen ist. Das Radar ist somit eine Art Rangliste, die aber mehrere Kriterien im Verbund auswertet. Bei den Leistungsgrafiken kann grundsätzlich davon ausgegangen werden, dass mehr Farbe eine bessere Leistung bedeutet. Bei den Stilgrafiken ist wiederum etwas mehr Interpretation gefragt. Hier geht es nicht um ein Einfaches Gut oder Schlecht, sondern um den Zusammenhang. Zum Beispiel ist St. Pauli eine Mannschaft, die nur sehr wenige Zweikämpfe führt (Radar 1). Dabei sind sie in der Defensive aber sehr stark (Radar 2), was daran liegt, dass sie sehr gut im Raum verteidigen und Gegner es grundsätzlich schwer haben durch die Linien zu kommen, um sich Chancen zu erspielen. Dies lässt sich durch Daten aber kaum direkt darstellen, weshalb ich mich auch etwas auf Metriken verlassen muss, die gegnerische Aktionen messen. Ein Beispiel dafür sind die „Spiele ins offensive Drittel“ die eine Mannschaft zugelassen hat. Je weniger das sind, desto besser. Und somit habe ich die Rangfolge bei solchen Werten auch umgekehrt berechnet, wodurch ein niedriger Wert besser (mehr Farbe) und ein hoher Wert schlechter ist (weniger Farbe).
Statistische Anpassungen
Zu guter Letzt muss ich noch kurz etwas zu ein paar Anpassungen sagen, die ich an den rohen Daten von FBref und Wyscout vorgenommen habe. Da jede Mannschaft mit unterschiedlich viel Ballbesitz spielt, ist es sinnvoll, dass bestimmte Metriken danach angepasst (oder bereinigt) werden. Zum Beispiel hat eine Mannschaft mit mehr Ballbesitz auch mehr Möglichkeiten Pässe zu spielen, Schüsse abzugeben oder ins Dribbling zu gehen. Und umgekehrt haben Mannschaften mit weniger Ballbesitz auch mehr Möglichkeiten in Zweikämpfe zu gehen, Fouls zu begehen oder Bälle abzufangen. Aus diesem Grund habe ich die tatsächlichen Werte danach angepasst, wie sie aussehen würden, wenn die jeweilige Mannschaft 50% Ballbesitz hätte. Ausnahmen für diese Bereinigung sind Prozente und Anteile (wenn ein Wert durch einen anderen dividiert wird). Denn in solchen Fällen würde der bereinigte Wert gleich aussehen.
Der HSV in Zahlen
Mit diesen Hintergrundinformationen können wir uns die HSV-Daten aus der Hinrunde nun etwas genau anschauen. Beginnen möchte ich dabei mit den Metriken zu dem Erspielen und der Verwertung von Torchancen (Radar 3).
Torchancen
Stumpf ausgedrückt, zeigt dieses Radar sofort, dass der HSV in diesem Bereich eine sehr gute Leistung geliefert hat. Dabei möchte ich daran erinnern, dass Tore, Schüsse, PSxG und npxG alle nach dem Ballbesitz bereinigt wurden, wodurch diese Werte beim HSV niedriger sind als die Tatsächlichen. Dennoch ist man in den letzten zwei Werten ligaweit zweiter und erster. Zudem ist positiv anzumerken, dass man sich einen großen Anteil seiner Schüsse durch direkte Vorlagen erspielt hat, was auf ein hochwertiges kreatives Passspiel hinweist. Weniger überzeugend sind die Tore und Vorlangenverwertung. Bei den Toren liegt dies anteilig an guten Torwartleistungen der Gegner, was hier aber nicht dargestellt wird, weil es wenig mit der Leistung des HSV zu tun hat.
Vorlagenverwertung
Ein weiterer Faktor könnte die Vorlagenverwertung sein. Hierfür benutze ich zwei Metriken von FBref und berechne die Differenz (xAG und xA). Ein negativer Wert bedeutet hier, dass zwischen dem Abspiel von einem Vorlagengeber und dem Schuss die Wahrscheinlichkeit eines Tores geringer wird. Ausschlaggebend könnten hier z.B. eine schlechte Ballannahme oder zu viele Ballkontakte vom Torschützen sein. Nun hat der HSV zwar einen positiven Wert, dieser ist jedoch im Vergleich zur Liga relativ klein. Zugleich ist anzumerken, dass dies ein Durchschnitt ist und somit auch eine große Abweichung bestehen könnte. Was bleibt, ist, dass die Wahrscheinlich auf ein Tor durch den ballannehmenden Spieler im Schnitt zwar leicht größer wird, aber nur relativ geringfügig und somit auch nur ein durchschnittlicher Mehrwert besteht.
Wer die Unterschiede zwischen PSxG, xG, xAG und xA noch nicht kennt, dem rate ich den folgenden Absatz zu lesen.
Differenzieren zwischen PSxG, xG, xAG und xA
In allen vier Fällen wird die Wahrscheinlichkeit berechnet, dass eine gegebene Aktion zu einem Tor wird. Der Unterschied ist letztlich wann diese berechnet wird und welche Kriterien in Betracht gezogen werden. Beim PSxG (Post-Shot expected Goals) geht es um den Schuss selbst. Wenn ein Schuss nicht auf das Tor geht, ist die Wahrscheinlichkeit automatisch bei null, während Schüsse ins obere Eck des Tores eine wesentlich höhere Wahrscheinlichkeit haben, dass sie zu einem Tor werden. Im Gegensatz dazu befasst sich der xG-Wert nicht mit dem Schuss, sondern mit den Umständen in denen der Schuss abgegeben wurde (z.B. Entfernung vom und Positionierung zum Tor, Spieler die zwischen Tor und Torschütze stehen). Sehr ähnlich zum xG ist der xAG, mit dem Unterschied, dass hier nur der xG nach einer Passvorlage berechnet wird (nicht jeder Schuss wird vorgelegt). Somit geht es beim xAG weiterhin um die Schussumstände. Da diese jedoch sowohl von dem Spieler abhängen, der eine Vorlage angenommen hat und dem Vorlagengeber, wird der xA-Wert herbeigezogen. Hier wird stattdessen die Wahrscheinlichkeit berechnet, dass eine Vorlage zu einem Tor wird. Dadurch lässt sich die Qualität der Schussvorlage isolieren, ohne dass sie von der Ballannahme des Torschützen abhängt.
Ballbesitz
Als nächstes möchte ich das HSV-Spiel im Ballbesitz etwas genauer betrachten (Radar 4 und 5). Dabei fällt wieder mal auf, dass man in der Hinrunde in fast allen Bereichen sehr gute Leistungen gebracht hat.
Sicherheit im Ballbesitz
Zwei Bereiche bei denen man nicht zur Elite der Liga gehört sind zum einen die Sicherheit im Ballbesitz und zum anderen die sogenannten Smart Passes. Ersteres berechne ich hier als die Anzahl der Ballberührungen pro Fehlkontrollen und Ballverluste. Dass man in diesem Bereich eher zum Durchschnitt der Liga gehört, könnte anteilig auch eine Erklärung für die enttäuschenden Verteidigungswerte sein, die ich später besprechen werde (Radar 6). Denn bei fehlender Sicherheit gegen den Ball, ist die Sicherheit im Ballbesitz doppelt wichtig. Zum einen, weil ein Gegner ohne Ball auch kein Tor schießen kann. Zum anderen, weil Umschaltmomente nach Ballverlusten einen besonders verwundbar machen, wenn der Zugriff zum Gegner nicht gut ist und keine kompakte Struktur geschaffen wurde.
Smart Passes
Bei den Smart Passes handelt es sich um eine von Wyscout erfasste Pass-Aktion, die wie folgend definiert wird: Ein kreativer Pass, mit dem versucht wird, die gegnerischen Verteidigungslinien zu durchbrechen, um einen deutlichen Vorteil im Angriff zu erzielen.
Warum dieser Wert beim HSV eher durchschnittlich ist, will ich hier nicht endgültig bestimmen, auch weil ich mir selbst nicht absolut sicher bin, was wiederum die Möglichkeit bietet das in den Spielen genauer zu beobachten. Teilschuld könnte jedoch sein, dass der HSV einen relativ hohen Fokus auf Ballführungen legt. Sowohl im Aufbau und Übergang als auch beim Eindringen in den gegnerischen Strafraum, verlässt man sich häufiger als andere Mannschaften auf Ballführungen anstatt zu passen. Dass man darin zugleich sehr effizient Räume für sich gewinnt (Radar 4), gibt einem Recht bei diesem Ansatz.
Effizienz bei raumgewinnenden Aktionen
Diese Effizienz, sowohl bei raumgewinnenden Ballführungen als auch bei raumgewinnenden Pässen, will ich hier auch kurz erklären. Ich benutze dafür die vorhin erwähnten Fehlkontrollen und Ballverluste, welche ich hier jedoch nicht zusammen mit dem Ballbesitz berechne. Stattdessen definiere ich die jeweilige Effizienz wie folgend:
- Anzahl von raumgewinnenden Ballführungen pro Ballverluste
- Anzahl von raumgewinnenden Pässen pro Fehlkontrollen
Ich vermute hierbei zweierlei:
- Dass Ballverluste durch gegnerische Zweikämpfe eher bei Ballführungen entstehen.
- Dass Fehlkontrollen eher bei der Annahme von Pässen geschehen.
Spielstil am Ball
Mit dem obigen Vermerk auf den relativ großen Fokus den Ball durch Ballführungen zum Tor des Gegners zu bewegen, gab es schon den ersten Hinweis auf den Spielstil des HSV. Dieser Aspekt bestätigt sich nochmal durch die ligaweit größte raumgewinnende Distanz die durch Ballführungen zurückgelegt wurde (Radar 5). Und bei der raumgewinnenden Distanz durch Pässe ist genau das Gegenteil der Fall. Zugleich gehen HSV-Spieler relativ häufig in Dribblings.
Mehrere andere Indikatoren sind ebenso bedeutend, wenn auch meistens nicht überraschend. Man hat viel Ballbesitz und dominiert damit besonders durch einen sehr großen Anteil von Ballberührungen im Angriffsdrittel verglichen mit denen des Gegners (Field tilt). Das Passspiel ist im Durchschnitt relativ langsam und die Passdistanz im Schnitt die kürzeste der Liga. Was manche vielleicht überraschen wird, ist, dass Flanken nur einen durchschnittlich hohen Anteil von Spielen in den offensiven Strafraum ausmachen. Häufiger sind es Pässe oder Ballführungen, wobei letzteres beim HSV natürlich eine vergleichsweise große Rolle einnimmt.
Verteidigen
Ich hatte bereits angemerkt, dass die Verteidigungswerte beim HSV nicht besonders gut aussehen (Radar 6). Dass die zugelassenen Tore trotzdem im Vergleich eher durchschnittlich sind, liegt zum einen am Torwart, Daniel Heuer Fernandes, und zum anderen an einer nicht immer guten Chancenverwertung der Gegner (dazu mehr später).
Fehlende Kompaktheit
Zwar ist man gut darin, gegnerische Dribblings in Zweikämpfen zu unterbinden, gewinnt häufig seine Kopfbälle und lässt die Gegner auch nicht allzu häufig in das offensive Drittel (aus Sicht des Gegners) eindringen, wenn sie in diesen aber doch hineinkommen, ist es wohl häufig in Situationen bei denen die defensive Struktur fehlt. Dadurch entstehen die ligaweit meisten Spiele in den eigenen Strafraum und auch Schüsse, die zugleich eine im Schnitt hohe Qualität haben, werden häufig zugelassen.
Intensiv und Proaktiv
Die schlechteste Zweikampfquote der Liga hat der HSV trotz eines Verteidigungsstils, der zu sehr vielen Zweikämpfen führt (Radar 7). Ein großer Anteil von Zweikämpfen im Angriffsdrittel, viele abgefangene Bälle und eine hohe Intensität beim Pressing bestätigen dabei einen meistens sehr proaktiven und vorwärtsdenkenden Verteidigungsstil. Der kleine Anteil von defensiven Aktionen die geklärt wurden, zeigt zudem, dass man den Ball lieber im Spiel hält und auf seine Stärken im Ballbesitz setzt.
Torwartspiel
Beim Torwartspiel sticht wenig heraus, was überraschend ist. Daniel Heuer Fernanes hat auf der Linie eine vergleichsweise gute, aber auch keine exzellente Hinrunde gespielt. Dass er nur selten Flanken pariert und viele kurze Pässe spielt, sollte auch keinen überraschen. Als leichte Enttäuschung könnte es zunächst interpretiert werden, dass er nur durchschnittlich viele Abwehrmaßnahmen außerhalb vom Strafraum hatte und der durchschnittliche Abstand zum Tor bei diesen auch sehr gering ist. Also eher selten Sweeper-Keeper Aktionen der Marke Manuel Neuer.
Geduld und Vertrauen in die Vorderleute
Jedoch muss hier bedacht werden, dass der HSV in seinem Defensivspiel Prinzipien verfolgt, die verlangen, dass der Torwart sich gegen den Ball häufig näher am Tor positioniert (als z.B. Neuer gegen Algerien bei der WM 2014). Anstatt den Strafraum zu verlassen und dadurch das Risiko einzugehen, dass der Angreifer einen leichten und frühen Abschluss bekommt, bleibt der Torwart tiefer stehen. So haben die Verteidiger mehr Zeit doch noch einzugreifen, auch wenn nur um mentalen Druck zu machen und den Angreifer zu einer Entscheidung zu zwingen. Wenn Daniel Heuer Fernandes sich zugleich gut positioniert und den Körper aufrecht hält, kann er so die Schusswinkel für die Angreifer reduzieren, der mit Zeitdruck im Rücken oder störenden Verteidigern nur schwer zu einem effektiven Abschluss kommen kann. Und dies ist letztlich auch ein Grund dafür, warum die Chancenverwertung der Gegner im Schnitt nicht so gut ist.
Fazit
Ich hoffe, dass diese Einweisung in die gezeigten Grafiken und Statistiken allen ein gewisses Verständnis vermittelt haben, wie man Fußballstatistiken interpretieren kann und sollte. Am wichtigsten ist dabei, dies im Zusammenhang mit den tatsächlichen Ereignissen in den Spielen zu tun. Ähnlich haben ich auch nicht nur die Zahlen besprochen, sondern versucht sie etwas in den Kontext der Spielweise des HSV zu bringen.
Für die Rückrunde erhoffe ich mir mit der Zeit eine Entwicklung und im besten Fall, eine Verbesserung im HSV-Spiel auch statistisch beobachten zu können. Es lohnt sich allerdings nicht, dies schon nach den ersten paar Spieltagen zu tun, denn ein Muster lässt sich erst nach mehreren Spielen erkennen.
Und keine Angst: Ich werde nicht immer nur Statistiken analysieren.
Nur der HSV!