進階數據搭配各種情境找出每場投打WPA為正的可能性

在瞬息萬變的棒球世界裡,勝敗乃兵家常事,但總有一些球員彷彿擁有魔力,他們的存在似乎能為球隊帶來更多勝利。我們可能會聽過"這名球員有英雄命"、"又是XXX"這樣的流傳,但這些印象式的判斷往往缺乏具體的數據支撐。那麼,有沒有一種簡單的方法,能夠從數據的迷霧中撥開雲霧,找出那些真正能為球隊帶來勝率累積的常勝將軍呢?本文將帶領各位讀者,利用2024年的進階數據與新數據與WPA在各種情況下的數值變化進行分析,簡單的辨識出那些長期而言,能為球隊貢獻正向勝率累積的球員,抑或是在謎團一片的情況下,能有比較中性的方式試著辨識而出。

圖/古林睿煬,2024年中華職棒WPA累積值最高的選手

WPA是甚麼?WPA(Win Probability Added)是一個用來評估球員在比賽中對球隊勝率影響的進階數據。它的計算基於比賽中每一個動作發生後球隊勝率的變化。例如,一位打者在關鍵時刻擊出全壘打,可能會大幅提高球隊的勝率,這樣的貢獻就會反映在他的WPA數值中。相反地,如果投手在滿壘的情況下被打出安打,導致球隊勝率下降,那麼他的WPA會顯示為負值。

與傳統的棒球數據不同,WPA能夠將球員的表現與比賽的情境結合起來,突出那些在關鍵時刻做出重大貢獻或犯下致命錯誤的球員。這使得WPA成為一個另類的量化指標,用來衡量球員在不同情境下的實際影響力。

需要注意的是,WPA的變化並不是固定的,而是取決於比賽當下的具體情境。例如,雙方比數、比賽的局數、壘上的跑者情況等都會影響每個結果對勝率的改變。同樣是一支全壘打,如果發生在比分接近的第九局,它對球隊勝率的提升會比在領先較多時的初期局數更為顯著。這些情境因素決定了每個動作的影響力,因此WPA能夠相對真實地反映出球員在特定時刻對比賽勝負的重要性。

藉由這個契機,我們不妨來探討WPA與哪些傳統或進階數據具有較高的相關程度,或許可以更具體地理解這項指標的價值。這邊會用到R平方的概念,R平方(R-squared)是一種統計指標,用來衡量兩個變數之間線性關係的強弱,數值介於0到1之間。數值越接近1,代表線性關聯性越強。例如在棒球中,若某數據與WPA的R平方高達0.7,就表示70%的WPA變異可以用這個數據通過線性模型解釋,顯示它們線性關聯性很高。但需注意,R平方不代表因果關係,也可能無法捕捉非線性關係。

投手符合規定投球局數的部分(共11位):

從下方圖表中可以看出,加總後的整體WPA與投手的RE24、三振率(K%)、以及被打者的OPS+呈現高度相關,代表投手若能有效壓制對方攻勢並掌握比賽節奏,其WPA數值自然也會顯著提高。雖然RE24(Run Expectancy 24)是根據24種出局與壘上狀態,計算單一打擊事件前後的跑分期望值變化,專注於得分貢獻,不直接受勝負機率的影響,主要是針對得分期望值進行計算。但符合規定局數的投手皆為先發投手,都是在零比零這種天平還沒明顯傾斜狀況下開始,因此還有一定的參考性。此外,值得注意的是,+WPA(也就是對球隊勝率正貢獻的部分)與投手所累積的「局數」有顯著正相關,說明能長時間穩定投球的投手,更容易累積正面的WPA數值。反之,-WPA與LOB%(殘壘率)有些許聯動關係,投手若無法有效的在壘上有人的時候解決打者,亦即掉分的情況增加了,也會間接影響到勝率的下滑,但因為這些有可能包含到落後或是大幅度落後的狀態,就算最後真的掉分了,對整體的-WPA累積也不會來的平常多,成為殘壘率的相關性沒有到非常高的原因。

後援投手的部分(取樣為大於10局的投球並且先發的場次不超過總場次的一半,共71位):

從下方圖表可以發現,多數進階數據與WPA的R平方值都偏低,顯示出後援投手的WPA累積與單一數據項目之間的線性關聯並不顯著。這或許反映了後援投手樣本數相對較小,且出賽情境更為片段和極端,相對難以抓出強相關性,也間接的反應出RE24的R平方從0.8左右降至不到0.5。唯一比較明顯的部分是局數的累積與正或負的勝率有一定程度的關聯性,代表即便是後援角色,能夠投較多局數的投手仍有更多機會為球隊貢獻勝率,不管是正的還是負的皆是如此。

勝利組投手的部分(取樣為同隊裡面中繼點最多的兩人與後援點最多的,共18位):

做這樣的取樣並沒有讓這些數據有明顯提升線性的關連性,雖然可以知道這些重要牛棚角色的WPA總和相加是正的(+6.8),但有可能只是因為這些角色的位置本來就有比較大的波動性加上處在這些位置的球員們本身就代表著教練團對其的信任。

因此我們換一個思路繼續進行探討,用局數與分差狀態為重點進行分析。在平手狀態下,大方向只要完成一局的投球並且沒有失分,越靠後的局數越能取得較大的WPA,這剛好呼應前面開頭時文字所敘述的部分。比較特別的是7、8兩局的客隊投手相較於主隊投手若能順利渡過該半局的話,會有比主場投手更高的WPA。

在一分差的情況,領先狀態下的客隊投手在6、7局明顯有很高的WPA可以賺取,若是進入到8、9兩局的狀況,不管是誰領先都有很高的WPA差值,反之落後的一方就算能不掉分吃完該局能拿到的WPA也不多。

兩分差與一分差的差別只在於8、9兩局若是主場領先的話,反而拿不到多少的WPA。

前面都是闡述沒有掉分下順利拿下該局的狀態,接著就來看該局掉分時的WPA變化(如下表)。也可以很明顯看到越後面局數掉分的話WPA損失的越多,呼應至文章的開頭。並且也可以發現到客場先發投手掉分相比於主場投手掉分來看,WPA損失的還比較多。後半段的7、8、9局抑或是如此,相比於可拿下的WPA,掉分所損失的WPA來的不成比例。這也間接說明了牛棚投手是個吃力不討好的工作。

WPA變化_對應局數123456789
領先一分後掉一分-主場投手-4-3-8-8-11-14-11-23
領先一分後掉一分-客場投手-6-11-11-11-13-14-17-24
平手掉一分-主場投手-4-5-6-11-11-15-15-24
平手掉一分-客場投手-6-10-11-14-10-12-21-26
落後一分再掉一分-主場投手1-5-5-3-3-10-6-4
落後一分再掉一分-客場投手-9-5-4-11-3-9-9

打者的部分(符合規定打席共29位) :

下方圖表顯示,OPS+和wOBA與RE24的R平方值最高,約0.7左右,雖然沒有到非常線性,但還是有一定的參考性,尤其是OPS+非常容易取得,在沒有wOBA與RE24的數值下,就會是一個重要的參考基準。這邊只有wOBA這項數據是唯一一個WPA比+WPA有更佳的參考性的數值,代表著加權過後的數字更貼合實際球場的狀況也代表著更有貼合勝率總和的可能性。相比之下,一樣有著不少擁護者的數據RC(Runs Created),則特殊的呈現WPA與+WPA的相關程度差距過大的現象,要知道棒球也算是比得分的運動,所以在+WPA的表現上面有著不低的相關程度,是可以理解的。但因為沒有參考到比賽情境的關係,就有可能是導致最後WPA的相關性降低過多的原因。此外,像BABIP(滾地安打率)和BB/K(保送三振比)與WPAR平方值較低(約0.1),顯示它們的線性關聯性較弱,非常不適合直接用來挑選穩定貢獻的球員。

回頭驗證,魔鷹在此名單當中,OPS+和wOBA與RE24皆排在首位,WPA為1.9落在當年度的第五名,若是把WPA的前四名一併確認的話,在這三項數據當中都在前三分之一的排名,都算是相對可以接受的位置。

各項排名(X/29)OPS+wOBARE24WPA
林泓育7661
林立23102
邱智呈3223
許基宏6794
魔鷹1115

總結

由於這是由2024年的數據進行整理與分析,所以在今年的賽季初期來說,若是預期成績不太變動的情況下,可以直接當作參考,若是選手們明顯進步或是退步的地方有對應到上述提及的重點數據,就需要重新慎重的納入考量當中,尤其是牛棚投手的定位與近期狀態,是有著很高的影響性。

長期來說,從投手的角度來看,有實績的先發投手毫無疑問是首選的球員,若要從這些先發投手當中再篩選出總和的勝率較高的存在,則是建議從RE24和三振率與被OPS+這三者數據都很優秀的組合挑出。若是要挑牛棚投手的部分,則沒有像先發投手有那麼好的線性相關性呈現,頂多就是從RE24這項數據還是可以看出大方向為WPA越高的呈現RE24普遍也有不錯的數值。

若是換成局數與分差的相關數據來切入牛棚投手的選擇,客隊贏球的可能性比較高的話就可以選擇近期火燙且有機會上場的牛棚投手,若是主隊贏球機率比較高的情況,就會比較難抉擇,因為領先一分與兩分呈現出來的最多WPA就會分別落在6、7局與8、9局,這就要搭配雙方球隊的得分能力。筆者的話則還是會選擇近況比較好的牛棚投手或是佈局投手。

由於上述的這些分析都是以局為單位,只考慮到分差比較小的情況,若是將分差加大則會更逼近極端值,若是安穩地拿下該局,WPA其實不會增加多少,因此參考兩分差的部分即可。

野手的部分,除非短期火燙到不得不選。長期來看的話,wOBA和OPS+與RE24都是可以交互考慮的數據,尤其是wOBA的部分,又經過符合中職狀況的加權,綜合過後的線性度算是最高的,可以當作首要參考,在藉由OPS+與RE24輔之。

最後我想說的是,WPA的小遊戲在棒球季來臨的時候,不只是在冷冰冰的數據上注入了活力,也多了一份互動上的趣味,本文也藉此進行簡單的分析讓大家有機會更了解整體的相關性,也請大家好好享用這份野球革命獨有的快樂。

作者資訊

臉書搜尋「聽 棒賽的聲音!

Podcast搜尋「聽~棒賽的聲音!」

Apple & Spotify & KKBOX 皆有上架

我是Michael~我們下回見~

發佈留言
Scroll to Top