
X, Y ve Şimdi de Z
13 dk
Gol beklentisi, topa sahip olma oranları, pas dizileri… Futbolu veriler olmadan konuşamaz olduk. Peki bu sayılar ne işimize yarıyor? İşin uzmanlarına sorduk.
Futbolla tanıştığım günden bu yana işin sayı tarafı ile ilgiliyim. 2003'te defterime oyuncuların ligde attığı gol sayılarını yazıyordum, bugünse bir Word dosyasına gol beklentilerini not ediyorum. İçimdeki heveste değişen hiçbir şey yok. Ama aynılarını oyun ve beraberinde gelen eklentileri için söylemek imkânsız. Pazarı iyiden iyiye büyüyen futbol, geçmişe nazaran hemen her departmanda artık daha karmaşık. Peki bu karmaşada gelişmiş verilerin payı var mı? Eğer varsa bu sayılar ne anlam ifade ediyor? Ve en önemlisi, neden futbolu veriler ve sayılar olmadan konuşamaz olduk? Tek bir cevabı olmayan bu soruları elbette tek bir kişiye sormak olmazdı. Bu yüzden mikrofonlarımızı önce Opta Türkiye Şefi Barış Gerçeker'e, daha sonra The Athletic yazarı ve veri analisti Mark Carey'ye ve en sonunda Gençlerbirliği'nde maç analisti olarak görev yapan Çağatay Erküp'e uzattık.
0.92, 1.49, 2.28… Nedir bu xG? Tamam, tüm konumuz gol beklentisi üzerine değil fakat bu kafa karışıklığına da bir son vererek başlasak fena olmaz.
Barış Gerçeker: Gol beklentisinin en basit tanımını, OptaJoe'yu kuran Duncan Alexander'dan duymuştum ilk: "Ortalama bir oyuncunun, ortalama bir maçta attığı şutun gol olma olasılığı." Daha matematiksel tanıma gelirsek yaklaşık 300 bin tane şutun incelemesini yapan gol beklentisi modeliyle karşılaşıyoruz. 300 bin şutun bulunduğu bu havuz, veri olarak toplandıktan sonra belirli kriterlere göre sınıflandırılıyor ve doğru değer bu sınıflandırmalara göre bulunuyor. İlk ve en önemli kriter şutun nereden çekildiği. Pek tabii hangi açı ile ne kadar uzaktan çekildiği de bu kritere ek. İkinci kriter ise şutun hangi bölge ile çekildiği. Ayakla mı kafayla mı yoksa başka bir yerle mi? Üçüncü kritere gelince de oyunun fazı devreye giriyor. Akan oyunda mı geldi bu şut yoksa duran topta mı?
Bu kriterleri göz önünde bulundurarak çektiğin şutu, daha önce çekilmiş 300 bin şut ile kıyaslayıp o şutlardan kaçının gol olduğuna bakıp buna yüzde üzerinden bir değer veriyor model. "Bu şutun değeri 0.03" cümlesindeki 0.03, aslında yüzdesel bir değer. Evet, biz tekil gol değeri verirken ondalıklı bir sayı veriyoruz fakat her kesir, aynı zamanda yüzde olarak ifade edilebiliyor. Bu yüzden "O şutun gol beklentisi 0.03'tü" demek, aynı zamanda oradan çekilen 100 şuttan üçünün gol olduğunu söylüyor. Hani uzaktan bir şut çekilince "Oğlum oradan kaç golün var?" denir ya. Tam da bunun cevabını veriyor xG.
Sayıların yanıltıcı tarafından ötürü veri kullanırken dikkatli olmak gerektiği söylenir hep. Son senelerde gelişen verileri düşününce bu yanılgı payı artmış olabilir. Sizce yeni istatistik kalemlerinde en kullanışlı ve yanıltıcı veri setleri neler?
BG: Aksiyon dizilerini önemli buluyorum çünkü oyun anlamında bana en çok şey anlatanlar onlar. On pas üstü diziler, organize hücumlar ve direkt hücumlar diye en sevdiğim üç kalem var başlıca ama ben bunlara bir takımın ön alan baskısını ne kadar iyi yaptığını gösteren PPDA'yı da ekliyorum. Bu dört kalem, takım bazında bize en çok şeyi anlatan kalemler haline geldi. Yanıltıcı olan ise topa sahip olma oranı. Bizim ligde en azından maç kazanmayla hiç alakası yok. Diğer liglerde topa sahip olma oranın artıkça galip gelme şansın artıyor ama bizim ligde neredeyse topa yüzde 35 sahip olmakla, 65 sahip olmak arasında galibiyet oranı özelinde fark yok.
Mark Carey: Veri analizinde bağlam her şeydir çünkü sayıları bağlamdan çıkarırsanız herkesi her şeye çok rahat ikna edebilirsiniz. Bu yüzden topa sahip olma ve gol yemeden bitirilen maçlar hakkında pek olumlu düşünemiyorum. Her zaman topa sahip olma bölgeleri daha değerli. Üçüncü bölgede ne kadar topa sahip olduğunuz oyunda ne kadar hâkimiyet kurduğunuza daha net ışık tutuyor. Veya kalecileri, gol yemediği maçlara göre öven bir algı var. Peki ya kalecinin önündeki defans hattı sezon boyunca inanılmaz bir iş çıkarttıysa ne olacak? Bir takımın kendi kalesinde gördüğü gol beklentisi üzerinden kaleci kalitesini değerlendirmek bile yetersiz kalırken, gol yenilmeyen maçlar üzerinden kaleci performansı ölçmek yanıltıcı. Yanıltıcı olmayanlara gelirsek gol beklentisini yabana atmamak gerek. Çünkü o maç özelinde futbolda pek mümkün olmayacak kadar net bir imge oluşturuyor kafanızda.
Çağatay Erküp: İsabetli pas sayılarına bu kadar güvenilmesi beni şaşırtıyor. "Çok pas isabetiyle oynadık, çok pas yaptık, bu yüzden iyi işler yaptık" denilebiliyor. Veya bir oyuncu gözlemlenirken pas isabet oranına bakıldığı da oluyor ama ben buna katılmıyorum. Sonuçta bu pas isabet oranlarına birinci bölgede yaptığın paslar da dahil. Onun yerine bu pasların yüzde kaçı baskı altındaydı, yüzde kaçı üçüncü bölgedeydi veya yüzde kaçı hat koparan paslardı gibi bakmak ve ona göre isabeti eşitlemek, daha sağlıklı. Bir de şöyle bir durum var Türkiye özelinde, oyunu geriden kurarken bazen iki-üç dakika geçebiliyor. Çoğu takım rakip sahaya oyunu rahat şekilde yıkamadığı ve sete oturamadığı için yarı sahasında çok pas yapabiliyor. Tabii bu da oyuncuların pas isabetlerinin olduğundan yüksek çıkmasına neden oluyor
Birkaç haftadır Twitter'da bir tartışma var. Bir grup, istatistik kullanan kitlelerin verileri futbol dili ile en doğru şekilde sunması gerektiğini düşünüyor. Diğer taraf ise istatistik ve verilerin tanımını bilmeden ana fikrin tam olarak kavranamayacağını. Hatta Liverpool sportif direktörü Michael Edwards, "Kendimi veri analistleriyle teknik ekip arasındaki köprü, hatta bir çevirmen olarak görüyorum" demişti. Katılır mısınız bu görüşüne?
BG: Bir yazarın, okura ve bir veri analistinin teknik direktöre o bilgiyi en iyi şekilde satması gerekli. Diyelim ki NBA'de analiz ekibinde çalışıyorsun ve oyuncuna rakibi nasıl savunmasıyla ilgili analizlerini aktarıyorsun. "Dört numaralı oyuncuyu sırtına aldığın zaman, bu oyuncu her zaman sağına dönüyor ve ondan sonra şuta kalkıyor. Sen gerekirse solunu riske at" diyebilirsin ve oyuncu da sana inanabilir. Ama tuttuğu oyuncu, ilk hücumda soluna dönerse bittin demektir. O saatten sonra o oyuncuyu hiçbir şekilde ikna edemezsin. Ama ilk iki topta sağına dönerse ve oyuncun ikisinde de sayıyı engellerse, oyuncu bir sonraki maçtan önce sen gitmeden yanına gelir.
ÇE: Geçmişte analizini kendisi yapan, hatta rakibi dahi kendisi izleyen bir hocamız vardı. O, zaman zaman analizi yaptığı için ben de maç öncesinde yanına dikkatini çekebilecek verilerle gidiyordum. Verilerden bahsettikten sonra benzer bir noktaya gelmişti sohbet. "Tamam, veriyi getirmişsin ama bana bunu çevirmen lazım" demişti. Çok doğru bir noktaydı çünkü hocalar genelde saf istatistiklerle ilgilenmiyorlar. Ben de bu konuşmamız sonrasında verileri çevirerek, hocaların anlayabileceği şekle sokarak paylaştım hep. Orta sahada baskı metrikleri düşük bir oyuncu için oyuncunun sayılarını anlatmak yerine "Hocam, rakip oyuncu Mehmet çok fazla geri koşu atan biri değil, eğer biz merkezde 3'e 2 kalabilirsek daha iyi olur" demeyi tercih ediyorum şimdilerde. Bu yüzden Edwards'ın verdiği örnek doğru.
MC: Kesinlikle, mükemmel örnek. Profesyonel kulüplerde çalışan birkaç arkadaşım da aynısını söylüyor. Hatta ne oyuncular ne de analiz ekibi bu verilere esas adlarıyla hitap ediyorlarmış. Yani bırakın "Rakip takım 0.66 gol beklentisi yaratıyor" demeyi, gol beklentisini bile cümle içinde çok kullanmıyorlarmış. Bu terimler yerine "Rakip, çok kaliteli yerlerden şut pozisyonlarına giriyor" tarzı cümleler seçiyorlar. Çünkü teknik adamlar hafta içinde kafalarını verilere odaklayarak geçiremezler, bir hafta boyunca takımın getirdiği onlarca farklı sorumlulukla ilgilenmek zorundalar. Bu yüzden keskin bir filtrelemenin önemli olduğunu düşünüyorum. Neyin önemli olduğunu, neyin önemli olmadığını filtrelemek, esas mesele bu.
Peki takımlar veri analizini ne kadar kullanıyor? Yani bir teknik direktörün veya bir takımın maç taktiklerini ya da oyuncu transferlerini verilere bakarak düzenlediğini düşünüyor musunuz?
ÇE: En azından benim verileri inceleyerek maç analizimi şekillendirdiğim oluyor. Hatta direkt maç maç örnekler verebilirim. Bu sezona (Mert) Nobre Hoca ile başlamıştık ve saha içinde farklı şeyler üzerinde çalışıyorduk. Video ve veri analizleri onlardan birkaçıydı. Hatta bir hafta yaptığımız video analizlerde o haftaki rakibin, santrforuna çok uzun top attığını ve o santrforun da hava toplarını sayı olarak lig ortalamasından çok fazla indirdiğini gördük. O zamana kadar hep dörtlü savunma oynamıştık ve eğer bu maça da iki stoperle çıkarsak rakip santrforun fiziğinden dolayı sıkıntı yaşayabileceğimizi ve tek adamla kalmanın bize sıkıntı yaratabileceğinden bahsetmiştik. Hoca da benzer şeyler söyledi ve rakip oyuncunun arkaya sektirebileceği topları süpürmesi için oraya bir üçüncü stoper ekledi.
Daha da eskiye gideyim… İbrahim Hoca (Üzülmez) alt ligde çalıştığımızda gelir gelmez veriler hakkında soru sormuştu. Kaydettiğim verileri onunla paylaşmıştım ve ilk dikkatini çeken nokta merkezden yediğimiz gollerin fazlalığı olmuştu. Hoca gelene kadar bizim takım merkezden en çok gol yiyen takımdı. Hoca bu problemi görünce takımı 4-5-1'e, zaman zaman da 4-6-0'a benzer bir yapıda oynattı ve merkezi kalabalık tuttu. Birlikte on maç çalıştık ve yedisini kazandık, 22 puan topladık. Muhtemelen o on maç bizi üst lige çıkaran en kilit periyottu.
MC: Ben bu soruya daha tersten yaklaşıyorum. Neden kullanmasınlar ki? Milyonlarca dolarların döndüğü bir pazarda size galibiyeti getirmek için yardım edebilecek araçları kullanmamayı tercih etmek ve kendinizi sınırlandırmak, benim çok anlayabileceğim bir şey değil. Bu sadece bir araç. Veri kullanan insanlar "Futbol bilgisayarlar tarafından oynansın ve her şey istatistik kâğıdından belli olsun" demiyor. Hatta futbolda istatistiği ve futbolu değerli kılan en temel şey şans unsuru. Futbolu bilinmez olduğu için seviyoruz. Şu ana kadar konuştuğumuz binlerce sayıyı bir saniyede yerle bir edebilen bir unsur var futbolda. Ama siz çok çalışarak, karar mekanizmanıza verileri ve bilimi dahil ederek bu şans oranını minimize edebilir, bilinirliğin ihtimalini yükseltebilirsiniz. Golf efsanesi Gary Player'ın dediğin gibi "Ne kadar çok çalışırsam, kendimi o kadar şanslı hissediyorum." Aslında tüm mesele bu.