Leistungsdaten zur Definierung von Positionen

In meinem letzten Artikel habe ich neun Metriken bzw. Indexe vorgestellt, die dazu dienen sollen Kernkompetenzen von Spielern zusammengefasst darzustellen. Das Ganze hatte zwei Vorteile.

  1. Aus 20 Metriken wurden 9.
  2. Spielerprofile ließen sich ziemlich realistisch visualisieren und das auch ohne den üblichen Vergleich mit anderen Spielern in der gleichen Position.

Letzteres ist mit ein Grund dafür, warum ich diese Metriken weiterentwickeln möchte. Denn in der Analyse von Spielerdaten kann es zu einem aufwändigen Prozess werden, diese Zuordnungen umzusetzen. Zur Veranschaulichung, in der FBref Datenbank zur 2. Bundesliga gibt es aktuell (nach dem 26. Spieltag) 491 Spieler mit Spielminuten. Das ist aber noch machbar und ich habe in meinen Daten tatsächlich jedem dieser Spieler eine Position zugeordnet, unterteilt in Torwart, Innenverteidiger, Außenverteidiger, Zentrale Mittelfeldspieler, Offensive Mittelfeldspieler/Offensive Flügelspieler, Stürmer. Das macht FBref für ihre Balkendiagramme auch so, aber sie teilen diese Zuordnung nicht und somit musste ich eine eigene Lösung finden. Diese habe ich zwar, aber muss sie ggf. anpassen, wenn ein Spieler die Position wechselt und wenn ich eine andere Liste von Spielern benutzten möchte, werden wieder hunderte von Positionszuordnungen gebraucht. Über die Metriken, die ich aktuell entwickle, erhoffe ich mir somit eine flexiblere Lösung zu finden. Dabei soll es auch etwas weniger um klare Positionen gehen und mehr, wie im modernen Fußball üblich, um Rollen. Meine Hoffnung ist, dass es irgendwann möglich sein wird, Rollen/Positionen über die Leistungsdaten selbst zu definieren, um damit letztlich den Vergleich der Leistung ähnlicher Spieler zu befähigen. Ein weiterer Vorteil sollte sein, dass Rollenzuordnungen zuverlässiger sind. Zum Beispiel ist es nicht unüblich, dass ein Innenverteidiger der außen in einer Dreierkette spielt ein Leistungsprofil hat, dass fast dem eines Außenverteidigers ähnelt. Würde selbiger aber ähnlich viele progressive Pässe, Ballführungen usw. als Innenverteidiger in einer Viererkette spielen? Wahrscheinlich nicht. Und somit ist der Vergleich zwischen diesen zwei Innenverteidigertypen auch nicht ideal. Wie gesagt, ich will eine flexiblere und realistischere Lösung finden.

Nun hatte ich im letzten Beitrag aber auch erklärt, dass diese Metriken noch nicht fertig sind und wahrscheinlich sind sie das auch jetzt noch nicht. Trotzdem habe ich sie ein paar Schritte weiterentwickelt und meiner Ansicht nach verbessert. Zunächst gibt es eine kleine Veränderung bei den Metriken zum Druck mit Ball. Anstelle von Progressivem Druck und Druck durch Ballführungen, unterteile ich nun in Druck durch Pässe und Druck durch Ballführungen. Warum? Weil die Fähigkeit in einem Bereich die mögliche Unfähigkeit in dem anderen Bereich nicht überschatten sollte und Umgekehrt genauso. Somit haben wir die folgenden Metriken:

  • Defensive Absicherung
  • Defensiver Druck
  • Ballbesitzsicherheit
  • Druck durch Pässe
  • Druck durch Ballführungen
  • Progressive Anspieloption
  • Passgefahr
  • Kreative Gefahr
  • Schussgefahr

Veränderungen habe ich bei den Metriken vorgenommen, die fett gedruckt sind und zugleich sind es nun sogar 29 Einzelmetriken die hier vereint werden.

Ballbesitzsicherheit

Bei der Ballbesitzsicherheit werden zuzüglich zu den Werten zu fehlkontrollierten und verlorenen Bällen, sowie Fehlpässen, nun auch die dazugehörenden Ballaktionen berücksichtigt. Soll heißen:

  • Verhältnis zwischen der Anzahl von Fehlpässen und versuchten Pässen.
  • Verhältnis zwischen fehlgeschlagenen Dribblings und versuchten Dribblings.
  • Verhältnis zwischen fehlkontrollierten Bällen und Angenommenen Bällen.
  • Verhältnis zwischen verlorenen Bällen und Ballführungen.

Daraus entsteht dann ein Muster der Sicherheit bei Aktionen am Ball, die das Volumen der Aktionen berücksichtigt.

Offensiver Druck

Die zwei Metriken zum “Druck” habe ich dafür etwas vereinfacht. Es geht nun jeweils um progressive Pässe und Pässe ins offensive Drittel, sowie progressive Ballführungen, erfolgreiche Dribblings und Ballführungen ins offensive Drittel.

Passgefahr und Kreative Gefahr

Den Index zur Passgefahr und Kreativen Gefahr habe ich wiederum etwas anpassen müssen, weil dieser ursprünglich für Wyscout-Daten entwickelt wurde, wo ein wert dabei ist, der über FBref nicht ausreichend ersetzt werden kann. Es geht dabei um die sogenannten Smart Passes, die auch wie folgend definiert werden:

Kreativer und durchdringender Pass, mit dem versucht wird, die gegnerischen Verteidigungslinien zu durchbrechen, um einen deutlichen Vorteil im Angriff zu erzielen.

https://dataglossary.wyscout.com/smart_pass

Eine andere Beschreibung wäre vielleicht auch ein linienbrechender Pass. Als Ersatz dafür hatte ich zuvor den Steilpass gewählt. Problem: Zu viele kreative Spieler spielen diesen Pass überhaupt nicht (z.B. Reese). Da ich die Rechnung über den harmonischen Durchschnitt (in letzten Beitrag erklärt) aber nicht aufgeben möchte, sorgt ein Wert von null dafür, dass der Durchschnitt ebenso fast null ist. Und sein wir ehrlich, Reese ist zwar keiner Spielmacher wie Bénes oder Pherai, aber null durch sein Passspiel strahlt er auch nicht aus. Die aktuelle Lösung die ich gefunden habe, ist dass ich den Steilpass und den xA-Wert addiere und als einen Wert im harmonischen Durchschnitt benutze. Zwar ist der xA-Werte keine Aktion an sich, sondern eine Berechnung der Wahrscheinlichkeit, dass vollendete Pässe zu Toren verwandelt werden, aber da die Kombination der zwei Werte bei den Spielern trotzdem noch unter dem des Smart Pass von Wyscout liegt, ist es zumindest keine Übergangslösung, die unrealistisch positive Ergebnisse erzeugen wird. Ich werde mir aber noch weitere Gedanken machen, wie man das Problem besser lösen kann ohne zwei Werte zu vereinen, die eigentlich nicht zusammengehören.

Schussgefahr

Diesem Index habe ich eine weitere Variable hinzugefügt, die “non-penalty expected goals” (npxG). Ähnlich wie beim xA, ist auch der npxG keine Aktion sondern eine Berechnung der Wahrscheinlichkeit, dass aus Schüssen ein Tor wird. Nun befasste sich der Index zu Schussgefahr aber bereits mit dem harmonischen Durchschnitt zweier “gefährlichen” Schüsse. Zum einen, Schüsse auf das Tor und zum anderen, Schüsse die zu weiteren Schüssen führen. Darüber hinaus gibt es aber noch andere Schüsse eines Spielers die gefährlich sein können, weshalb die Anzahl der Schüsse pro 90 Minuten multipliziert mit dem npxG pro Schuss eine Rechnung ist, um die Anzahl der Schüsse auf ihre tatsächliche Gefahr runterzurechnen (z.B. 4,96 Schüsse x 0,13 xG pro Schuss = 0,65). Diese Rechnung ergibt aber logischerweise den gleichen Wert wie der npxG pro 90 Minuten eh schon ist. Und somit ist die Beschreibung der Rechnung hier auch nur eine Erklärung dafür, warum ich es für akzeptabel halte den npxG-Wert im harmonischen Durchschnitt mit Schüssen auf das Tor und Schüssen die zu weiteren Schüssen führen, zu berechnen. Bei den Werten oben handelt es sich um den Spieler Ragner Ache von Kaiserslautern, der zugleich 2,34 Schüsse pro 90 Minuten auf das Tor bringt und 0,62 Schüsse zu weiteren Schüssen führen. Im harmonischen Durchschnitt ergeben das insgesamt 2,5 gefährliche Schüsse pro 90 Minuten.

Zur Veranschaulichung, hier nochmal das gesamte Profil von Ache im Vergleich mit Glatzel.

Oder um ein Paar offensive Flügelspieler zu vergleichen, hier noch Reese gegenüber Dompé.

Und nach dem letzten Spiel gegen Wehen Wiesbaden lohnt sich auch dieser Vergleich zwischen Bénes und Heußer.

Interessant finde ich aber auch diese Vergleich zweier Spieler die beim HSV diese Saison im Konkurrenzkampf hätten stehen können.

Und auch die Außenverteidigerprofile sehen nun wesentlich realistischer aus, besonders im Bezug auf den Index zur Ballbesitzsicherheit.

Und ähnliches ist auch bei den Innenverteidigern zu beobachten.

Benedikt
Benedikt
Artikel: 19

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert