【科學分析】足球的最佳射門位置
引言
足球是世界上最受歡迎的體育運動,每四年舉行一次的國際足聯俱樂部(FIFA)世界杯足球賽更是吸引了全世界無數球迷觀看。一場足球比賽中最激動人心的時刻莫過于射門和進球,而射門和進球也是一支球隊能否獲勝的關鍵。一記射門能否進球得分取決于多種因素,這些因素不僅包括運動員本身的球技,也包括射門所在位置。

射門位置離球門越遠,越不容易進球。因此,一記超遠吊射也常常為人津津樂道。2022 年波蘭足球聯賽扎布熱對戰(zhàn)坡根的比賽中,足球老將波多爾斯在中場線附近以一記超遠吊射破門得分(圖 1)。著名球星貝克漢姆和魯尼也用中場吊射的方式進過球。

此外,射門位置的球門視角也極大影響著進球的難易程度,正對著球門方向的射門進球的幾率要大于兩邊。雖然小視角射門得分的難度很大,但在足球比賽中也是出現過的。例如,在 2010 年世界杯巴西對戰(zhàn)朝鮮的小組賽中,麥孔在底線附近接近零度視角的情況下射門得分(圖 2)。

甚至球門視角為零的角球直接射門得分的情況也是存在的。例如,在2019/20 賽季西班牙超級杯半決賽皇家馬德里對戰(zhàn)克瓦倫西亞的比賽中,克羅斯就用角球直接射門得分(圖 3)。著名球星貝克漢姆和亨利也完成過角球得分的名場面。
圖 4: 不同球門距離和不同球門視角的位置相同球門距離的位置可能有著不同的球門視角,而相同球門視角的位置也可能有著不同的球門距離(圖 4)。不同的射門位置對進球的影響有多大?或者說如果在某個特定的位置射門,進球的預期概率是多少?本文將從理論和統(tǒng)計兩個角度分別建立模型回答這個問題。
模型
理論模型
射門位置到球門距離和射門位置的球門視角是影響射門能否得分的兩個重要因素。為研究球門距離和球門視角對能否進球的影響,本文建立了如圖 5 所示的坐標系。球門寬度為 = 7.32 m,射門位置 (, ) 到球門(線中點)的距離為 ,到兩根球門柱的距離分別為 和 ,球門視角為 。
圖 5: 射門位置的球門距離和球門視角射門位置到球門的距離可以很容易地由射門位置的坐標 (, ) 表示射門位置的球門視角 也可以由射門位置的坐標 (, ) 表示[1]。由正弦定理可知由上式及余弦定理可得如果假定 b/2" style="outline: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">,則上式中的 和 均可表示為 和 的函數因此有根據三角函數關系容易解得接下來,本文定義得分勢函數來表示一記射門得分的難易程度。如上所述,得分勢函數中的主要參數應該是球門距離 和球門視角 。直觀上很容易理解,射門位置離球門越近,進球就越容易。因為球在飛行的過程中速度會降低,球在空中飛行的距離越長,球到達球門的速度和力量就越小,就越容易被守門員守住。此外,射門位置離球門越遠,球在空中飛行的時間就越長,留給守門員的反應時間也就越長。另一方面,球門視角越大也就越容易得分。因為球門視角越小,越不容易瞄準。因此,得分勢函數 可以定義為與球門距離 成反比,與球門視角 成正比[1]:根據上式可以繪制出圖 6 所示的得分勢函數及其等勢線。得分勢函數反映了在不同位置射門時進球的相對難易程度。
圖 6: 得分勢函數及等勢線在同一條等勢線上的位置射門進球的難易程度相當,而勢越大的位置射門進球越容易。例如,在圖 6 中的綠線上各位置射門進球的難易程度相當,在綠色等勢線上各位置射門進球的難度要高于紅色等勢線。
統(tǒng)計模型
需要注意的是,理論模型給出的得分勢函數反映的是得分相對難易程度,并不是一記射門能否得分的直接概率。為了驗證理論模型的合理性,以及計算球場上不同位置射門的得分概率,需要統(tǒng)計大量真實的足球比賽數據。本文接下來的分析使用了由 Wyscout 收集的足球比賽事件數據集[2]。該數據集記錄了七個賽事(西甲、意甲、德甲、英超、法甲、2018 年 FIFA 世界杯、2016 年歐洲杯)整個賽季的所有比賽事件(傳球、射門、犯規(guī)等)的時空數據(包含事件的有關位置、時間、結果、球員和特征等信息)。數據集中各事件的位置都由一對坐標 (, ) 表示, 和 是 范圍內的整數。 坐標表示事件發(fā)生點到對方球門底線邊界的距離(以百分比表示),而 坐標表示事件發(fā)生點到場地右側邊界的距離(以百分比表示)。
圖 7: 各位置的射門次數由于本文主要關注于射門的位置和射門的結果(是否得分),因此將球場在長度和寬度方向等間距地劃分為 50 50 個格子,并統(tǒng)計了每個格子中發(fā)生射門事件的次數 ,結果如圖 7。然而,一個格子射門的次數多并不意味著進球的次數多。為此,本文還統(tǒng)計了每個格子中發(fā)生射門事件且得分的次數 ,結果如圖 8。
圖 8: 各位置的進球次數由此,可以計算出每個格子中射門的得分頻率結果如圖 9,如果統(tǒng)計的射門事件足夠多,那么每個格子中射門的得分頻率 將趨于得分概率 。顯然,由于有限的數據,本文獲得的得分頻率圖并不光滑連續(xù)。
圖 9: 各位置的進球頻率但從空間得分頻率圖不難發(fā)現,離球門越近,越正對著球門的位置越容易得分。需要注意的是,圖 9 中靠近邊界的少量格子存在一些高頻率的異常格子。這實際上是由于發(fā)生在這些格子中的射門次數很少,不具有統(tǒng)計意義。例如某個格子中只發(fā)生一次射門,并且這次射門進球了,那么該格子的進球頻率就會為 1。
為了估計空間上每個位置射門的得分概率,需要對得分頻率進行擬合[3,4]。根據前文理論模型的分析,某個位置射門得分的難易程度與該位置到球門距離 和球門視角 有關。為此,本文由各格子的坐標 計算出了各格子的球門距離 和球門視角 。并在此基礎上擬合進球概率 對 和 的依賴關系。這個問題中,進球與否是離散的二分類因變量,而球門距離 和球門視角 則是連續(xù)的自變量。對于因變量為二分類或多分類時,邏輯回歸[5]是非常重要的模型。邏輯回歸模型的表達形式為邏輯回歸是通過極大似然估計求解常數項 和偏回歸系數 ( =1, 2, , ),基本思想是當從總體中隨機抽取 個樣本后,最合理的參數估計量應該使得這 個樣本觀測值的概率最大。邏輯回歸模型的概率表達式為邏輯回歸可以很容易由 MATLAB 函數 glmfit[6]實現。因此,本文選用邏輯回歸模型對進球概率與球門視角 和球門距離 進行分析。首先,本文單獨考慮進球概率對兩個因素的各自依賴關系。利用邏輯回歸,可以得到進球概率與球門視角 的依賴關系:相應的擬合結果如圖 10 所示。從圖中不難看出,當球門視角逐漸由 0 增大到 120 時,進球概率也從幾乎為 0 增加到接近 1。
圖 10: 球門視角與進球頻率的邏輯回歸類似地,可以得到進球概率與球門距離 的依賴關系:相應的擬合結果如圖 11 所示。從圖中不難看出,進球概率隨著球門距離的增大,逐漸趨于 0。距離球門超過 20 米的位置射門進球就比較困難了。
圖 11: 球門距離與進球頻率的邏輯回歸接下來,本文考慮進球概率同時對球門視角 和球門距離 的依賴關系。利用邏輯回歸,可以得到:相應的空間概率分布如圖 12 所示。從概率圖中不難看出,球門距離越近、球門視角越大的位置越容易射門進球。對比圖 12 和圖 6 不難發(fā)現,邏輯回歸得到的空間概率分布與理論模型給出的得分勢函數具有很大的相似性。圖 12 中 = 30% 等概率曲線與圖 6 中 = 1 等勢線與幾乎一致。但兩圖也有一些區(qū)別,圖 6 中的等勢線都通過兩個球門柱,但圖 12 中較小概率(7%)的等概率曲線與底線的交點并不在門柱位置。
圖 12: 考慮 和 的進球概率在此基礎上,本文還綜合考慮了射門位置到底線的距離 、到側邊的距離 、球門距離與球門視角的積 等多種因素對得分概率的影響。通過對各擬合結果的比較分析,本文最終得到并選擇如下模型作為射門得分概率的最優(yōu)模型:相應的空間概率分布如圖 13 所示。從圖中不難看出,最優(yōu)模型的等概率曲線都經過門柱。這與角球直接射門得分的事實并不矛盾,因為本文所統(tǒng)計的射門都是發(fā)生在正常進攻過程中的,并不包括角球射門的情況。實際上,動態(tài)攻守過程中,在底線附近直接射門進球是極為困難的。
圖 13: 考慮 、 和 的進球概率通過等概率曲線可以看出,把球盤帶到綠線以內射門,進球的概率就能超過 7%。而把球盤帶到紅線以內再射門,進球的概率就能超過 15%。
結論
不同的射門位置有著不同的球門距離和球門視角,射門位置很大程度地影響著能否進球?;谏溟T位置的球門距離和球門視角,本文分別從理論和統(tǒng)計兩種角度建立模型研究了在不同位置射門的進球預期概率。在理論模型中,本文構造了得分勢函數。得分勢函數能給出不同位置射門時進球的相對難易程度。為了得到不同位置射門得分的概率,本文對足球比賽事件數據進行了統(tǒng)計分析,應用邏輯回歸模型對進球概率與球門視角、球門距離等因素的依賴關系進行了擬合,并最終給出了空間概率圖和等概率曲線。
本文的結果給出了球場各位置射門得分的預期概率,這可以告訴球員更應該在哪些位置射門??傮w而言,與我們的直覺是一致的:射門位置到球門距離越近、越正對著球門,射門進球的機會越大。當然,這個概率并不適用于所有球員,但得分概率圖可以讓所有球員了解到不同位置射門得分的難易程度,以便球員權衡自身能力和對方防守情況做出合理的決策。此外,得分概率圖的梯度方向還為球員指明了進攻方向。例如,圖 13 中綠線附近射門得分的機會是 7%,而沿梯度方向跑幾步到達紅線附近再射門就可以使得分機會翻倍。
附錄
點擊文章左下角“閱讀原文”獲取本文 PDF 版和附件。
參考資料
[1]César A Morales. A mathematics-based new penalty area in football: tackling diving. Journal of sports sciences, 34(24):2233–2237, 2016.
[2]Luca Pappalardo and et al. A public data set of spatio-temporal match events in soccer competitions. Scientific data, 6(1):1–15, 2019: https://doi.org/10.6084/m9.figshare.c.4415000
[3]David Sumpter. Mathematical modelling of football, 2020: https://uppsala.instructure.com/courses/28112
[4]David Sumpter. Soccermatics: Mathematical Adventures in the Beautiful Game Pro-Edition. Bloomsbury Publishing, 2017. 238–241.
[5]Wikipedia contributors. Logistic regression — Wikipedia, the free encyclopedia, 2022: https://en.wikipedia.org/wiki/Logistic_regression
[6]MathWorks. glmfit: Fit generalized linear regression model. 2022: https://www.mathworks.com/help/stats/glmfit.html
本文授權轉自數學模型,謝絕二次轉載!
免責聲明:自媒體綜合提供的內容均源自自媒體,版權歸原作者所有,轉載請聯系原作者并獲許可。文章觀點僅代表作者本人,不代表環(huán)球物理立場。環(huán)球物理
ID:huanqiuwuli環(huán)球物理,以物理學習為主題,以傳播物理文化為己任。專業(yè)于物理,致力于物理!以激發(fā)學習者學習物理的興趣為目標,分享物理的智慧,學會用物理思維去思考問題,為大家展現一個有趣,豐富多彩的,神奇的物理。
投稿請聯系14511055@qq.com

掃描二維碼推送至手機訪問。
版權聲明:本文由財神資訊-領先的體育資訊互動媒體轉載發(fā)布,如需刪除請聯系。