人工智能與世界杯: 大數據如何改變足球?
原標題:人工智能與世界杯: 大數據如何改變足球?
慧天地”關注
??
文章轉載自微信公眾號協(xié)同感知與知識服務, 原創(chuàng):張喵喵,版權歸原作者及刊載媒體所有。
在卡塔爾世界杯足球賽期間,球員們有更多基于大數據的方式來證明和爭取自己首發(fā)的時間。在每場比賽終場哨聲響起的幾分鐘內,賽事組織者將向每位選手發(fā)送詳細的表現數據。前鋒將能夠展示他們的無球跑動,創(chuàng)造機會卻被隊友忽視的頻率。后衛(wèi)將擁有關于他們在面對對方球員的逼搶多少次成功傳球的數據。這是數字對人類運動的最新入侵?,F在,數據分析有助于指導一切,無論是球員的轉會還是訓練強度,基于大數據的人工智能甚至可以推薦在球場上的球員最佳位置決策。
這些詳細的對抗數據是哪里來的?與可穿戴背心可以感知球員運動、GPS可以跟蹤位置,特制的球鞋可以計算每只腳的射門次數。此外,球場上多個角度的攝像機可以捕捉更多,從頭球到球員控球的時間。為了理解這些數據,大多數專業(yè)足球隊都會聘請數據分析師,包括從頂級公司和實驗室(例如計算巨頭微軟和位于瑞士日內瓦附近的歐洲粒子物理實驗室 CERN)中挑選出來的數學家、數據科學家和物理學家。
頂級數據分析師的加入正在改變比賽的打法:前鋒遠距離射門的頻率降低,邊鋒傳球給隊友而不是傳中,教練們癡迷于在球場上贏得控球權,上述這些戰(zhàn)術轉變都得到了教練直覺強有力的支持?!按髷祿_創(chuàng)了足球的新時代”,德國科隆體育大學的體育科學家 Daniel Memmert 說。“它改變了球隊的理念和行為,改變了他們分析對手的方式,以及他們培養(yǎng)人才和尋找潛在球員的方式?!?/span>
大數據改變體育運動的最著名案例之一來自另一種比賽。奧克蘭運動隊的經理比利·比恩依靠球員統(tǒng)計數據在 2002 年以有限的預算打造一支獲勝的棒球隊。比恩根據有關球員表現的詳細數據招募球員,包括之前被低估的衡量標準,例如擊球手上壘的頻率。然而足球的數據分析則難得多,棒球是一種自然而然的走走停停的比賽,一次只有一支球隊試圖得分,棒球統(tǒng)計數據一直在定期收集并進行大規(guī)模研究。相比之下,足球是一種流暢且低得分的“入侵”游戲(在這種游戲中,領土經常被占領和放棄),而且很難記錄誰做了什么以及它如何影響結果。幾十年來,足球統(tǒng)計學家只傾向于關注進球數和失球數,并尋找一種方法對它們進行建模以進行預測。
這種方法的變體今天仍然被用來預測比賽的結果。英國牛津大學的流行病學家開發(fā)了一個假設進球數和失球數圍繞平均值分布的數學模型,該模型正確預測意大利將在 2020 年歐洲杯國際錦標賽中擊敗英格蘭,它還正確地預測了歐洲杯八強中的六只球隊。開發(fā)了 2020 年歐洲杯模型的牛津大學博士生 Matthew Penn 認為,統(tǒng)計比賽預測比許多人意識到的要準確?!澳阆胭x予每支球隊進攻和防守的實力,你可以根據每支球隊的總進球數和對手的相對難度來計算,你最終會得到一大組方程來求解這兩組優(yōu)勢,然后預測每場比賽就變得非常容易了?!盤enn 的模型表明比利時最有可能舉起這個著名的獎杯,其次是巴西(打臉來的可太快了)。
考慮到每支球隊的進攻和防守實力的統(tǒng)計“雙泊松分布”模型認為比利時最有可能贏得世界杯,而巴西在國際足聯(lián)排名中名列前茅。
模型預測排名
捧杯機率(%)
國際足聯(lián)排名位置
1. 比利時
13.88
1. 巴西
2. 巴西
13.51
2. 比利時
3. 法國
12.11
3. 阿根廷
4. 阿根廷
11.52
4. 法國
5. 荷蘭
9.65
5.英格蘭
6. 德國
7.24
6. 意大利?
7. 西班牙
6.37
7. 西班牙
8. 瑞士
5.29
8. 荷蘭
9. 葡萄牙
3.78
9. 葡萄牙
10. 烏拉圭
3.36
10. 丹麥
11. 丹麥
3.17
11. 德國
12. 英格蘭
2.56
12. 克羅地亞
13. 波蘭*
2.33
13. 墨西哥
14. 克羅地亞
1.46
14. 烏拉圭
15. 墨西哥
0.67
15. 瑞士
*國際足聯(lián)排名第26;
教練們更感興趣的是關于球場上發(fā)生的事件以及球員對這些變化產生的影響。足球分析師長期以來一直在記錄此類信息。最成功的是,一位名叫查爾斯·雷普 (Charles Reep) 的會計師在 1950 年代的大部分時間里都在英格蘭觀看比賽,并對諸如傳球位置和傳球順序等因素進行了基本觀察。Reep 甚至使用他的數據來分析團隊表現并提出戰(zhàn)略和戰(zhàn)術建議。在英超的狼隊,在他的幫助下引入了一種直截了當、尖銳的踢球風格,這種風格不接受側身傳球,并在五年內贏得了三個聯(lián)賽冠軍。
現代技術使此類數據的獲取和分析變得更加容易,以至于大多數頂級俱樂部和許多國家隊在十多年前就開始聘請數據分析師。許多分析師將布倫特福德足球俱樂部最近取得的一些成功歸功于一種內部算法,該算法可以對不同聯(lián)賽的球員進行評分,并幫助球隊招募被低估的球星。利物浦足球俱樂部的數據團隊,包括前歐洲核子研究中心和英國劍橋大學的物理學家,已經建立了一個模型,可以評估球員在球場上的行為是否更有可能進球。在與西班牙豪門巴塞羅那足球俱樂部的合作中,葡萄牙里斯本大學的體育科學家去年發(fā)表了一項分析,分析了一場比賽中不同類型傳球的機會能持續(xù)多長時間。
數據分析師會在賽前準備報告,提供另一支球隊球員的屬性,然后制作一些圖表來展示他們的比賽方式以及他們在控球方面的表現。然后提出一些戰(zhàn)術技巧或改變的建議。在最近的一場比賽之前,牛津城的分析師發(fā)現對方左后衛(wèi)的頭球統(tǒng)計數據不佳。建議大前鋒站在球場的右側,最終贏得了比賽。這同樣也是經驗豐富的球員或教練肉眼可以輕松獲得的洞察力,但是數據卻是客觀的,不會存在偏見。
商業(yè)公司提供了相當多的球員運動信息,這些公司記錄了大約 3,000 場主要比賽的事件,包括運球、傳球和鏟球。起初,此類數據是手動記錄的,但現在通常使用計算機視覺的人工智能 (AI) 來完成。這些數據帶有匯總統(tǒng)計數據,例如每位球員的傳球完成率。
電視攝像機拍攝了 2019 年女足世界杯期間挪威和英格蘭之間的比賽。圖片來源:Catherine Ivill/FIFA/Getty
今年早些時候,英國華威大學數學本科生喬安娜·馬克斯 (Joanna Marks) 與賓夕法尼亞大學合作開發(fā)了一個模型,使用這些原始數據來評估牛津聯(lián)所有球員的傳球實力——這種詳細分析通常在公司提供的原始數據中進行深度挖掘來獲得。
“你需要考慮他們嘗試什么樣的傳球。你不能只考慮完成率,因為有些傳球要困難得多,這個模型有助于讓球隊做好準備,因為如果你知道對手在球場的某個區(qū)域傳球非常好,那么你就會知道需要對這個區(qū)域進行重點盯防。”拉維·拉米尼 (Ravi Ramineni) 曾在 Microsoft 擔任數據分析師,之后于 2012 年轉到美國職業(yè)足球大聯(lián)盟 (MLS) 俱樂部華盛頓西雅圖海灣人隊擔任類似工作。他的首要任務之一是使用有關球員跑多遠的 GPS 數據來優(yōu)化他們的訓練和備戰(zhàn)。在訓練期間收集這些數據,可以幫助球員判斷訓練太多或太少,以防止受傷。
這些方法到底有用嗎?缺乏確定性引發(fā)了所有關于數據在運動成功中的作用的說法的問題:沒有對照實驗來檢查功效。盡管如此,拉米尼尼說,西雅圖的教練們對他的分析持開放態(tài)度,無論是在訓練中還是在后來判斷球員的實力時。
分析師現在越來越關注當球員沒有球時會發(fā)生什么(無球跑動)。這更加困難和昂貴,因為它需要專用攝像頭,不僅要跟蹤主要動作,還要密切關注沒有直接參與的球員,并每秒標記他們的位置大約 25 次。提供此類數據的公司往往會與國家聯(lián)賽簽訂獨家協(xié)議,這使得外部人士難以訪問。如果從南美或歐洲為美國職業(yè)足球大聯(lián)盟尋找一名國際球員,很難獲取他們的無球數據。人工智能的出現,漸漸的改變了這種情況。利用人工智能來預測拍攝比賽中球員的動作,即使他們沒有被攝像機直接捕捉到(球員不在電視畫面內)。這意味著數據公司可以使用不受限制的比賽廣播鏡頭為世界各地的球員提供全面的場上和場下分析。這樣的預測模型是由位于倫敦的谷歌旗下人工智能公司 DeepMind 的研究人員與利物浦足球俱樂部數據團隊合作開發(fā)的。通過這種應用程序,你可以提出有關戰(zhàn)術或反事實的問題。對于比賽中的一個特定事件,該模型可以產生數千種不同的模擬,模擬可能發(fā)生的情況。所以,你可以開始說說那段比賽的進攻動作有多好。
一段動畫將球員在足球比賽中的真實動作(進攻方,深藍色;防守方,深紅色)與預測離機球員路徑的模型的預測進行了比較?;疑幱皡^(qū)域是電視攝像機的視野 (FOV),它跟隨球(黑線)。對于 FOV 之外的玩家,該模型預測攻擊者(綠色)和防御者(橙色;實際的鏡頭外位置分別為淺藍色和粉紅色)的位置,通過這種預測的方法獲得球員在球場上的實時位置與無球跑動情況。圖片來源:DeepMind
俱樂部的數據團隊往往不會分享有關他們正在做的事情的細節(jié)或效果如何的信息,這是各個俱樂部的殺手锏。利物浦擁有足球界最大、最發(fā)達的分析部門之一,DeepMind恰好需要構建深度學習模型所需的這些資源。足球是一項變化很大的運動,球隊經常在不該輸的時候輸,在不該贏的時候贏,這帶來了相當多的不確定性。DeepMind 的計算機科學家 Karl Tuyls 表示,離機建模工作是創(chuàng)建虛擬的、AI 驅動的助理教練的第一步,該助理教練使用實時數據來指導足球和其他運動的決策制定。你可以想象人工智能會觀察上半場的表現,并建議改變陣型,這樣可能會做得更好。這種方法在遠離球場的地方也很有用,例如在繁忙的城市街道上模擬自動駕駛汽車和行人的軌跡等任務。
人工智能同時也在改變其他運動,莎拉·拉德 (Sarah Rudd) 是前微軟數據科學家,在為倫敦俱樂部從事分析工作近十年后于去年離開阿森納足球俱樂部,她垂涎賽車產生的大量觀測數據,這些數據可以幫助支持團隊調整和提高其性能。她非常關注一級方程式賽車,擁有那種水平的數據會很棒,足球中還有很多東西沒有被衡量,或者正在被衡量,但科學家還沒有想出如何從中獲得更多的知識與洞察力。下一個進步可能是顯示球員方向的數據,甚至是如何轉移重心的數據。跟蹤數據可能仍未達到人們想要的粒度,你還不能獲得球員為了讓防守者失去平衡,晃倒防守球員或讓守門員稍作停頓而做的小步或重心轉移。
即使是利物浦的 AI 驅動分析也會因對球員位置的不完全了解而做出錯誤的判斷。模型可能會說這名球員做了一件壞事,因為他應該在此時開始跑步,但他沒有,但這可能是因為他剛剛被絆倒并躺在球場上。隨著現代足球淹沒在數據中,數字如何改變了比賽?招聘可能是獲得最大收益的地方,另一個領域是定位球策略。然而從數據分析中得出的一個明確教訓是,球員不應該在離球門很遠的時候射門。如果你看看世界上任何一個聯(lián)賽,十年前球員射門的距離要遠得多,這一切的改變是因為數據分析人員開始建議,為什么要從那里射門?遠射只有 2% 的機會!許多球隊現在也不鼓勵球員嘗試向禁區(qū)進行長距離傳中,因為統(tǒng)計數據顯示大多數傳中都是毫無意義的。隨著生成的數據量不斷增長,數據分析的工作機會也會不斷加,人工智能與數據分析將會遍布足球這項運動,為俱樂部、球員和觀眾提供更高水平的技戰(zhàn)體驗。
(改編于Nature News Feature文章)
薦讀
專業(yè)說 | 武漢大學測繪學院閆利副院長:空天科技新測繪,時空信息新發(fā)展
不再局限游戲!虛擬現實融合千行百業(yè),進入爆發(fā)期!
2022年最新版地理學/生態(tài)學/環(huán)境科學領域高質量科技期刊分級目錄
《慧天地》敬告
《慧天地》公眾號聚焦國內外時空信息科技前沿、行業(yè)發(fā)展動態(tài)、跨界融合趨勢,發(fā)現企業(yè)核心競爭力,傳播測繪地理信息文化,為時空信息類相關專業(yè)學子提供日常學習、考研就業(yè)一站式服務,打造政產學研金服用精準對接的平臺。
《慧天地》借鑒《讀者》辦刊理念,把時空信息領域的精華內容匯聚到平臺上。我們高度重視版權,對于精選的每一篇推文,都會在文章開頭顯著注明出處,以表達對作者和推文引用平臺版權的充分尊重和感謝;對于來源于網絡作者不明的優(yōu)質作品,轉載時如出現侵權,請后臺留言,我們會及時刪除。感謝大家一直以來對《慧天地》的關注和支持!
——《慧天地》運營團隊
投稿、轉載、商務等合作請聯(lián)系
微信號:huitiandi321
郵箱:geomaticshtd@163.com
編輯:于瑞凱 審核:王其軒
指導:萬劍華教授返回搜狐,查看更多
責任編輯:
掃描二維碼推送至手機訪問。
版權聲明:本文由財神資訊-領先的體育資訊互動媒體轉載發(fā)布,如需刪除請聯(lián)系。