国产露脸精品国产沙发|极品妇被弄得99久九精品亚洲|亚洲va成精品在线播放人|日韩精品久久久免费观看

    
    

        <delect id="w59je"></delect>

            當(dāng)前位置:首頁(yè) > 足球資訊 > 正文內(nèi)容

            數(shù)據(jù)分析實(shí)例——足球運(yùn)動(dòng)員數(shù)據(jù)集(1)

            杏彩體育2年前 (2023-03-01)足球資訊180

            又開(kāi)始做實(shí)例了~在本次數(shù)據(jù)集中,包含了2017年所有活躍的足球運(yùn)動(dòng)員的個(gè)人數(shù)據(jù),包括身高體重等基本數(shù)據(jù),以及力量、速度、技巧等多個(gè)指標(biāo)。C羅、梅西、內(nèi)馬爾,到底誰(shuí)比較厲害呢?答案我們可以從數(shù)據(jù)中獲得。(有意思~)

            數(shù)據(jù)來(lái)源:

            本次數(shù)據(jù)集的來(lái)源是kesci,提供者是Ustinian,想自己動(dòng)手試試的同學(xué)可以去了解一下~

            下面開(kāi)始我們的實(shí)例學(xué)習(xí)之路~

            一、了解數(shù)據(jù)集

            下面是和鯨社區(qū)中,對(duì)數(shù)據(jù)集的描述,主要包括了:數(shù)據(jù)集的主要內(nèi)容、以及數(shù)據(jù)內(nèi)的各個(gè)標(biāo)簽的中文注釋。

            (1)數(shù)據(jù)內(nèi)容:

            2017年所有活躍的足球運(yùn)動(dòng)員。

            (2)數(shù)據(jù)說(shuō)明(標(biāo)簽名):

            Name 姓名

            Nationality 國(guó)籍

            National_Position 國(guó)家隊(duì)位置

            National_Kit 國(guó)家隊(duì)號(hào)碼

            Club 所在俱樂(lè)部

            Club_Position 所在俱樂(lè)部位置

            Club_Kit 俱樂(lè)部號(hào)碼

            Club_Joining 加入俱樂(lè)部時(shí)間

            Contract_Expiry 合同到期時(shí)間

            Rating 評(píng)分

            Height 身高

            Weight 體重

            Preffered_Foot 擅長(zhǎng)左(右)腳

            Birth_Date 出生日期

            Age 年齡

            Preffered_Position 擅長(zhǎng)位置

            Work_Rate 工作效率

            Weak_foot 非慣用腳使用頻率

            Skill_Moves 技術(shù)等級(jí)

            Ball_Control 控球技術(shù)

            Dribbling 盤(pán)球(帶球)能力

            Marking 盯人能力

            Sliding_Tackle 鏟球

            Standing_Tackle 逼搶能力

            Aggression 攻擊能力

            Reactions 反擊

            Attacking_Position 攻擊性跑位

            Interceptions 搶斷

            Vision 視野

            Composure 鎮(zhèn)靜

            Crossing 下底傳中

            Short_Pass 短傳

            Long_Pass 長(zhǎng)傳

            Acceleration 加速度

            Speed 速度

            Stamina 體力

            Strength 強(qiáng)壯

            Balance 平衡

            Agility 敏捷度

            Jumping 跳躍

            Heading 投球

            Shot_Power 射門(mén)力量

            Finishing 射門(mén)

            Long_Shots 遠(yuǎn)射

            Curve 弧線

            Freekick_Accuracy 任意球精準(zhǔn)度

            Penalties 點(diǎn)球

            Volleys 凌空能力

            GK_Positioning 門(mén)將位置感

            GK_Diving 撲救能力

            GK_Kicking 門(mén)將踢球能力

            GK_Handling 撲球脫手幾率

            GK_Reflexes 門(mén)將反應(yīng)度

            (3)導(dǎo)入數(shù)據(jù):

            import numpy as np import pandas as pd df = pd.read_csv(rC:\Users\Administrator\Desktop\zuqiu8543\football.csv)

            (4)查看數(shù)據(jù)基本信息:

            df.head()
            df.shape

            查看數(shù)據(jù)缺失情況:

            df.isnull().sum()

            從運(yùn)行結(jié)果可以看到,出現(xiàn)數(shù)據(jù)缺失的特征總共有六列,而主要缺失的有兩列,分別是:National_Position 國(guó)家隊(duì)位置、National_Kit 國(guó)家隊(duì)號(hào)碼,出現(xiàn)缺失的原因,有可能是部分球員并沒(méi)有在國(guó)家隊(duì)里服役,因此也就沒(méi)有相應(yīng)的號(hào)碼和位置。同時(shí),由于‘Club 所在俱樂(lè)部’、‘Club_Position 所在俱樂(lè)部位置’、 ‘Club_Kit 俱樂(lè)部號(hào)碼’、 ‘Club_Joining 加入俱樂(lè)部時(shí)間 ’、‘Contract_Expiry 合同到期時(shí)間’這5項(xiàng)指標(biāo)也不在我們的研究范圍之內(nèi)。

            因此,針對(duì)以上缺失值,我們不做處理。(對(duì)我們接下去的數(shù)據(jù)分析和可視化沒(méi)有影響的~)

            二、進(jìn)行簡(jiǎn)單數(shù)據(jù)分析

            (1)查看球員的身高、體重的具體信息

            首先我們使用head( )查看一下:

            df[[Weight,Height]].head()

            可以看到,我們的數(shù)據(jù)是帶有‘kg’、‘cm’等單位的,因此我們先對(duì)這些單位進(jìn)行移除,同時(shí)修改數(shù)據(jù)類(lèi)型,以方便后面的操作。

            (忘記應(yīng)該怎么做的同學(xué)可以看這里)

            df[Height]=df[Height].apply(lambda x:x[0:-3]) df[Weight]=df[Weight].apply(lambda x:x[0:-3]) df[[Height,Weight]]=df[[Height,Weight]].astype(int)

            我們可以查看修改后的數(shù)據(jù):

            df[[Weight,Height]].head()

            使用agg()查看所有球員身高、體重的均值和最值:

            df[[Height,Weight]].agg([mean,max,min])

            可以看到,數(shù)據(jù)集中的球員平均身高達(dá)到了181cm、平均體重75kg。

            上述操作的主要目的是想讓大家暖一下手,下面才是我們對(duì)這個(gè)球員數(shù)據(jù)集分析的真正開(kāi)始。

            作為非專(zhuān)業(yè)球員(嘻嘻,球迷or足球愛(ài)好者),我們當(dāng)然還是更想看看能不能從數(shù)據(jù)反映出球員的個(gè)人實(shí)力。所以下面我們就要進(jìn)行深入分析。

            三、通過(guò)球員數(shù)據(jù),鑒定球員能力

            在我們的球員數(shù)據(jù)集中,總共有這么兩項(xiàng)數(shù)據(jù):Rating 評(píng)分、Skill_Moves 技術(shù)等級(jí),這兩項(xiàng)數(shù)據(jù)就是我們的主要研究目標(biāo)。我們將圍繞這兩項(xiàng)數(shù)據(jù),建立研究需求。

            研究需求:

            分值(Rating)高低的評(píng)分依據(jù)是什么?如何構(gòu)建評(píng)分依據(jù)?

            技術(shù)等級(jí)(Skill_Moves)的評(píng)價(jià)標(biāo)準(zhǔn)是什么?如何構(gòu)建評(píng)價(jià)標(biāo)準(zhǔn)?

            對(duì)研究需求的初步解讀:

            首先我們還是先對(duì)我們的目標(biāo)列加深認(rèn)知:

            (1)分值(Rating):

            df[Rating].unique()
            df[Rating].nunique()

            可以看到,分值(Rating)這一目標(biāo)值是連續(xù)型的,總共有49個(gè)不同值。

            (2)技術(shù)等級(jí)(Skill_Moves):

            df[Skill_Moves].unique()
            df[Skill_Moves].nunique()

            可以看到,技術(shù)等級(jí)(Skill_Moves)更像是分類(lèi)型的,總共有1-5五個(gè)等級(jí)。

            進(jìn)行球員分析前的須知:

            總所周知,足球場(chǎng)上總共有11個(gè)球員,大致可以分為兩類(lèi),分別是:1個(gè)守門(mén)員,及非守門(mén)員(前鋒、中場(chǎng)、后衛(wèi)),守門(mén)員的能力與非守門(mén)員的能力肯定是有區(qū)別的,因此我們?cè)谕ㄟ^(guò)球員數(shù)據(jù)鑒定球員能力時(shí),不能按照同一套標(biāo)準(zhǔn)。

            對(duì)于守門(mén)員,我們更多的考究他的護(hù)框能力,與其他非守門(mén)員球員是截然不同的。

            我們可以通過(guò)查看數(shù)據(jù),進(jìn)一步觀察守門(mén)員和非守門(mén)員能力的差異:

            我們提取出7列特征:

            Name 姓名Preffered_Position 擅長(zhǎng)位置Speed 速度Finishing 射門(mén)Freekick_Accuracy 任意球精準(zhǔn)度Shot_Power 射門(mén)力量GK_Diving 撲救能力GK_Reflexes 門(mén)將反應(yīng)度

            接著,我們查看前五名球員的這些數(shù)值差距:

            df[[Name,Preffered_Position,Speed,Finishing,Shot_Power,GK_Diving,GK_Reflexes]].head()

            在上面五位球員中,前四位是非守門(mén)員,第五位是守門(mén)員。

            從數(shù)值上,可以明顯看出區(qū)別。(忘記各個(gè)特征中文名的同學(xué)可以去上面看哦,我就不改數(shù)據(jù)表了)

            下面開(kāi)始正式分析球員能力值的評(píng)分標(biāo)準(zhǔn)~

            1、守門(mén)員的評(píng)分標(biāo)準(zhǔn)

            在數(shù)據(jù)集中,GK是表示守門(mén)員(門(mén)將)的意思,同時(shí),主要有5個(gè)特征用于衡量守門(mén)員的能力,分別是:

            GK_Positioning 門(mén)將位置感GK_Diving 撲救能力GK_Kicking 門(mén)將踢球能力GK_Handling 撲球脫手幾率GK_Reflexes 門(mén)將反應(yīng)度

            因此,我們可以將這幾列特征提取出來(lái),連同球員得分及技能等級(jí),繪制成一個(gè)新數(shù)據(jù)表——門(mén)將數(shù)據(jù)表。

            df_GK = df[[Name,Rating,Skill_Moves,GK_Positioning,GK_Diving ,GK_Kicking,GK_Handling,GK_Reflexes]][df[Preffered_Position]==GK]

            查看表格情況:

            df_GK.head()

            查看一下技能等級(jí)(Skill_Moves)的分級(jí)情況:

            df_GK[Skill_Moves].unique()

            可以看到,在所有守門(mén)員中,技術(shù)等級(jí)只有1和2兩個(gè)等級(jí)。

            我們進(jìn)一步查看等級(jí)的個(gè)數(shù):

            df_GK[Skill_Moves].value_counts()

            可以看到,在技術(shù)等級(jí)為1的球員有2002個(gè),等級(jí)為2的只有1個(gè),差距太大,這里其實(shí)L考慮過(guò)做數(shù)據(jù)平衡化,但是效果不是很好。

            綜合考慮后,決定在考量守門(mén)員的能力時(shí),僅考慮分值(Rating)這一項(xiàng)數(shù)據(jù),不考慮技術(shù)等級(jí)(Skill_Moves)。

            (由于在數(shù)據(jù)表中,球員的單項(xiàng)特征的得分越高,證明這名球員的這項(xiàng)能力更突出,也就是說(shuō),這里的特征均屬于數(shù)值類(lèi)型,而不是類(lèi)別型特征。因此,在這里我們不需要進(jìn)行one-hot獨(dú)熱編碼。)

            可以看到,特征列都是數(shù)值型的。

            下面,我們將結(jié)合這五項(xiàng)特征,使用機(jī)器學(xué)習(xí)的方法技巧進(jìn)行分析。(這里總共分為幾個(gè)部分,由于篇幅原因,可能會(huì)將所有內(nèi)容分為幾篇文章。)

            一、回歸樹(shù)

            首先,我們使用決策樹(shù)中的DecisionTreeRegressor(回歸樹(shù))進(jìn)行分析。

            1、將數(shù)據(jù)集分割成訓(xùn)練集和測(cè)試集

            導(dǎo)入做決策樹(shù)相應(yīng)需要的包:

            from sklearn import tree from sklearn.model_selection import train_test_split

            首先,將原數(shù)據(jù)集按特征和目標(biāo)進(jìn)行分割:

            df_x=df_GK.drop(labels=[Name,Rating,Skill_Moves],axis=1) df_y1=df_GK.loc[:,Rating]

            然后,使用train_test_split將數(shù)據(jù)分成訓(xùn)練集和測(cè)試集。

            注意~在這里我們指定了拆分系數(shù)為0.3,也是說(shuō)將7/10的數(shù)據(jù)作為訓(xùn)練集,剩下3/10的數(shù)據(jù)作為測(cè)試集。

            #指定評(píng)分為目標(biāo)時(shí): X_train, X_test, Y_train, Y_test = train_test_split(df_x,df_y,test_size=0.3)

            下面開(kāi)始建模,并進(jìn)行數(shù)據(jù)訓(xùn)練:

            reg = tree.DecisionTreeRegressor(random_state=0) reg = reg.fit(X_train, Y_train)

            查看一下在測(cè)試集上的準(zhǔn)確度(將經(jīng)過(guò)訓(xùn)練集訓(xùn)練后的模型,應(yīng)用到測(cè)試集里,并查看擬合的得分情況)

            score = reg.score(X_test, Y_test) score

            可以看到,擬合度是比較高的,也就是說(shuō)這里我們可以借助回歸樹(shù)對(duì)球員評(píng)分進(jìn)行預(yù)測(cè)。

            2、同時(shí),我們也可以畫(huà)出決策樹(shù).(但是如果考慮實(shí)際問(wèn)題的話(huà),這里其實(shí)并不建議這么做)

            import graphviz reg = tree.DecisionTreeRegressor(random_state=0) reg = reg.fit(X_train, Y_train) dot_data = tree.export_graphviz(reg ,out_file = None ,class_names=["球員評(píng)分"] ,filled=True ,rounded=True ) graph = graphviz.Source(dot_data) graph

            除此之外,我們也可以利用隨機(jī)森林回歸、線性回歸、邏輯回歸包括支持向量機(jī)等方法,進(jìn)行模型擬合及預(yù)測(cè),當(dāng)然了,使用每種方法的步驟與注意點(diǎn)均有些許不同,這些我也將會(huì)在下次為大家說(shuō)明。

            以上便是<數(shù)據(jù)分析實(shí)例——足球運(yùn)動(dòng)員數(shù)據(jù)集(1)>的內(nèi)容,感謝大家的細(xì)心閱讀,同時(shí)歡迎感興趣的小伙伴一起討論、學(xué)習(xí),想要了解更多內(nèi)容的可以看我的其他文章,同時(shí)可以持續(xù)關(guān)注我的動(dòng)態(tài)~

            掃描二維碼推送至手機(jī)訪問(wèn)。

            版權(quán)聲明:本文由財(cái)神資訊-領(lǐng)先的體育資訊互動(dòng)媒體轉(zhuǎn)載發(fā)布,如需刪除請(qǐng)聯(lián)系。

            本文鏈接:http://www.thecityplacetownhomes.com/?id=64400

            “數(shù)據(jù)分析實(shí)例——足球運(yùn)動(dòng)員數(shù)據(jù)集(1)” 的相關(guān)文章

            今日足球卡塔爾世界杯預(yù)測(cè)推薦:烏拉圭VS韓國(guó)

            今日足球卡塔爾世界杯預(yù)測(cè)推薦:烏拉圭VS韓國(guó)

              比賽時(shí)間:2022-11-24 21:00   球場(chǎng):教育城體育場(chǎng) 1      世界杯H組第1輪: 烏拉圭VS韓國(guó)   在塔瓦雷斯教練的帶領(lǐng)下,烏拉圭男子足球隊(duì)在過(guò)去的20年里重返強(qiáng)隊(duì)行列。在過(guò)去的三屆世界杯中,該隊(duì)都進(jìn)入了四強(qiáng)、八強(qiáng)和十六強(qiáng),...

            世界杯競(jìng)彩足球推薦2串1 世界杯F組[1] 比利時(shí) VS 摩洛哥

            世界杯競(jìng)彩足球推薦2串1 世界杯F組[1] 比利時(shí) VS 摩洛哥

             “競(jìng)彩足球推薦世界杯卡塔爾籃球推薦二串一如果我只是一名西甲聯(lián)賽球迷,競(jìng)彩足球推薦我會(huì)很喜歡德甲這一場(chǎng)英超的比賽,亞冠但作為法甲籃彩推薦皇馬的意甲教練,我必須C羅考慮球隊(duì)很早就丟了歐洲杯兩個(gè)球?!?  尤文圖斯比賽結(jié)束之后,亞冠內(nèi)馬爾安切洛蒂的梅西這句話(huà)實(shí)際上準(zhǔn)確地描述了曼城這場(chǎng)曼...

            球探比分k球捷報(bào)比分:萊切斯特城VS諾丁漢森林

            球探比分k球捷報(bào)比分球探比分k球捷報(bào)比分 03:00  英超  萊切斯特城VS諾丁漢森林    萊斯特城由于財(cái)政危機(jī)主力出走、沒(méi)錢(qián)引援,自然也沒(méi)錢(qián)解雇教練。聯(lián)賽1平6敗積1分墊底。7場(chǎng)打進(jìn)10球的進(jìn)攻尚能排在聯(lián)賽中游,防守端糟糕,場(chǎng)均...

            為什么朋友都說(shuō)球探體育比分, 真的這么好用嗎?有什么不一樣的功能嗎?

            為什么朋友都說(shuō)球探體育比分, 真的這么好用嗎?有什么不一樣的功能嗎?

            12月9日,在樊振東奪得新加坡世界杯總決賽第五個(gè)男單金牌之后,他成為了新的世界杯先生: 1)之前是馬琳,拿到了4個(gè)世界杯男單冠軍。 這是很了不起的成就,要知道,馬龍和張繼科也才2個(gè)男單冠軍,而大名鼎鼎的王勵(lì)勤,1個(gè)世界杯男單冠軍都沒(méi)有;...

            足球比分:暴力鳥(niǎo)成中超第一外援 135場(chǎng)49球 能力強(qiáng)職業(yè)態(tài)度優(yōu)秀

            足球比分:暴力鳥(niǎo)成中超第一外援 135場(chǎng)49球 能力強(qiáng)職業(yè)態(tài)度優(yōu)秀

            如果讓大家評(píng)選出目前中超最有親和力的外援,那大唱國(guó)歌,用中文大喊:“有沒(méi)有信心!”的保利尼奧,一定是目前最有人氣的球員之一了。當(dāng)初的那場(chǎng)亞冠比賽,現(xiàn)在應(yīng)該還回蕩在每個(gè)恒大球迷的眼前。當(dāng)恒大優(yōu)勢(shì)不在,甚至被魯能在加...

            中國(guó)足彩網(wǎng)競(jìng)彩27日推薦:看好比利時(shí)取得兩連勝

            中國(guó)足彩網(wǎng)競(jìng)彩27日推薦:看好比利時(shí)取得兩連勝

              世界杯 比利時(shí)VS摩洛哥   比賽時(shí)間:2022-11-27   21:00   球場(chǎng):阿圖瑪瑪球場(chǎng)   比利時(shí)的黃金一代已經(jīng)在逐步謝幕,球隊(duì)的新老交替還在繼續(xù),后場(chǎng)實(shí)力較為有限,中場(chǎng)則坐擁德布勞內(nèi),阿扎爾等悍將。盧卡庫(kù)目前存在傷...

            ?