Spordi analüütika on üks kiiremini kasvavaid analüütika suundi ärianalüütikas ning eriti masinõppe valdkonnas. Hetkel on käimas jalgpalli EM ning ärianalüütika poolelt vaadatuna võiks öelda, et lisaks jalgpallile käib samuti võistlus matemaatiliste algoritmide peale. Kuna tänases jalgpallis on oluline leida strateegia kaitse murdmiseks siis selleks võetakse appi algoritmid. Mis pilt avaneb, kui kiigata spordianalüütika eesriide taha?
Esimese võimalusena kasutan selleks otstarbeks juhtiva ärianalüüsi tarkvarafirma QlikTech poolt avaldatud jalgpalli mängude statistika visuaalset andmeanalüütilist rakendust. Kuna sõna „andmed“ tuleneb tegusõnast „andma“ siis huvitusin, et millist uut teavet need EM kohta kogutud andmed võiksid meile pakkuda?
Mitmendal minutil lüüakse väravaid?
Esiteks, keskmine väravate arv on ühtlustunud ja sellel EM on see väiksem, kui eelmistel kordadel – kõigest 1,9 väravat mängu kohta.
Kui uurida, mis minutitel väravaid lüüakse siis selgub, et teine poolaeg ja eriti teise poolaja algus ja lõpp on see aeg, millal pole mõtet kööki võileiba tegema minna. Kui, siis seda võib teha esimesel 5 või siis 10-15 minutil, kui tõenäosus väravaks on 3 korda väiksem, kui näiteks 50-55 minutil. Seega, kui Anu Säärits Jalgpallistuudiost küsib, et ennustage, mis minutitel värav lüüakse siis saate siit veidi oma otsusele tuge. Mulle isiklikult oli üllatus, et lisaminutitel löödud värav pole kuigi erandlik nähtus, see juhtub isegi keskmisest suurema tõenäosusega, kui normaalajal.
Võtsin juurde eraldi allikast jalgpalli maailmameistrivõistluste statistika, kus ilmneb veidi teistsugune pilt – 17 minut ning 75 minut eristuvad. Neist esimese põhjuseks on penaltite arv. EM rakendusest selgub lisaks, et 80% olukordadest penalt lüüakse nn. raamidesse ja 100 penaltist 73 on ka tulemuslikud.
Milline on levinum skoor?
Lisaks uurisin, milline on levinum skoor. Päring interneti arvarustesse andis kätte Inglismaa kõrgliiga statistika, kust selgub, et seal on levinum skoor 1:1 (hundid söönud, lambad terved). Seega arvamine, et levinum jalgpalli skoor on 1:0 ei päde Inglismaal. Ka 0:0 viik polegi nii väga haruldane tänases, tihti kaitsest lähtuva mängustiili korral. Kuid olukord, mis juhtus Eesti meeskonna viimases mängus Portugaliga, kus tuli vastu võtta kaotus 0:7 on väga-väga harv nähtus ehk juhtub ainult tõenäosusega 1 mäng 500’st.
Üldise statistika viimase aspektina tundus huvitav olema fakt, et kollaste kaartide osakaal on mängudes kasvanud hüppeliselt 1996 aasta paiku ning see näitab viimastel aastatel langustrendi. Samas, 3 kaarti mängu kohta polegi nii tagasihoidlik tulemus.
Kas pikkus, vanus või pea mängivad rolli väravate löömisel?
Vaatasin veidi tulemusi ka mängijate poole pealt. Esiteks, kuidas vanus ja skoorimine on seotud. Selgub, et tulemuslikum iga on 28 ja 29 eluea vahel, samas on tõenäoliselt ka teisi tingimusi – nt. treener- mis selle tingivad, sest näiteks Sloveenia meeskond on samas vanuses aga skoori mõistes on nad tagasihoidlikud.
Lisaks vanusele sai uurida veel mängijate pikkusi. Selgub, et üldine trend (mis esineb vist kogu inimkonnal) on see, et mängijad lähevad pikemaks ja seda eriti väravavahid. Samas on erandeid – keskväljaku keskmine pikkus pole aastaid suurenenud, olles küll sel aastal veidi kõrgem kui eelmistel 10 aastal. Seda, kas pikemad ründajad ka resultatiivsemad on, saate ise uurida, jätan midagi ka kodutööks!
Huvitav analüüs oli veel selles osas, et kas värav lüüakse parema või vasaku jalaga või hoopis peaga. Ründajate ja kesktormajate osas pole justkui mingit üllatust – enim väravaid lüüakse parema jalaga. Kui miski mind üllatab siis ainult asjaolu, et peaga löökide osakaal on siiski ainult 25%. Samas, kaitsjate osas on oluliseks just peaga löögid, nemad löövad 2 korda rohkem väravaid peaga, kui ründajad ning keskpoolikud. Siinkohal meenub Eesti koondise pikaaegne kaitsja, nüüdne kalur, Rajo Piiroja, kes oli peavõitluses väga efektiivne ning kellest hiljuti avaldati raamat nimega „Õhuvõitleja“
Kes keda?
Kirjutan seda lugu teisipäeval, kui selgus, et järgmistes nn. surmamängudes lähevad kokku Itaalia ja Hispaania. Vaatasin seetõttu, millist tulemust ennustab arvuti nende omavahelise mängu puhul. See oleks 63% tõenäosust, et Hispaania võidab versus 37% tõenäosusega Itaalia võitu. Eks saame näha!