大家好我是野球革命的工程師 LiHsuan。日前,台灣棒壘球科學研究會 宣布舉辦第二次台灣棒球數據分析競賽,而在 8/10 下午,研究也在銘傳大學基河校區舉辦了說明交流會,讓有興趣的參加者可以來更了解這次競賽的內容,以及能獲得主辦單位以及前一次獲獎者的經驗分享。有鑒於有其他有興趣的人可能當天不克前往,就由我來幫大家整理一下這次說明會的內容,希望能幫助到無法前往的大家。
競賽賽制與注意事項說明
首先是由研究會的 陳書瑋 秘書長來介紹這次競賽的賽制及注意事項,當天秘書長也有介紹這次一起協助舉辦的銘傳大學教授們,提供使用場地讓這次競賽能更順利。
這次競賽相較於上一屆,多提供了一些新方向讓大家嘗試,像是模擬自己是職棒制服組的角色,要如何獲得適合的資料來完成洋將的簽約,以及如何使用既有資料,來完成預測模型幫助球隊。
在評分標準的部分,第一階段的書面審查,秘書長提供了非常詳細的評分說明,尤其是在使用數據的方法以及如何正確利用準確的數據進行數據分析的分數佔比非常重要。參賽者在提交自己的書面結果前務必要十分注意。另外假設進入第二階段,由於將進行口頭報告,除了上述的提到的注意重點外,在報告時的表達能力,又會更為吃重,所以各位在簡報方面也需要額外用心。秘書長也特別提到,因為各隊只有 15 分鐘的報告時間,如何在有限的時間內,呈現最完整又能讓人理解的內容,會是脫穎而出的關鍵。
上屆得獎者經驗分享
說明會邀請到上次的得獎者 王皓 來分享他的經驗。他先是分享了他上一屆的得獎內容,是關於 Cody Bellinger 在 2023 賽季回春的原因以及是否能維持成績的成果發表,並且他還有做了這個主題的後續觀察。除此之外,他也分享了他在參加第一屆後的感想,主要為受到其他參賽者的啟發,像是關於短打效益的問題,當天也有發表他對於短打的另一個看法。最後她也提供了許多能運用數據的想法給大家參考,也許就會是其他人這次比賽可以思考的方向,許多內容都可以去他的個人網站上觀閱。
王皓個人網站:Baseball is Beautiful – 棒球數據分享 (wordpress.com)
灼見運動數據經驗分享
接下來是由灼見運動數據的 徐樂 執行長分享他個人從事運動產業的經驗,以及目前其公司底下正在運行的產品與合作對象。灼見運動數據主要負責的內容為國家隊的情搜,並且也有與職棒球團有合作。他們開發的情蒐系統包含電子好球帶與平板的操作介面,幫助球隊進行情蒐的工作,且運用電子好球帶蒐集資料的成果,進行各式各樣的電腦視覺實驗,像是跑者跑壘狀況,3D 進壘點等。此外,他們也有利用這些數據,在社群媒體上提供分析給各位參考,也是可以成為這次競賽的思考方向。
灼見運動數據粉專:https://www.facebook.com/statsinsight
野球革命經驗分享
我們野球革命營運長 鄭凱駿 也有在這次說明會進行分享,主要內容是我們如何運用棒球數據經營我們社群平台,以及在網站上提供的會員內容,並再次感謝一直以來訂閱我們的同伴,謝謝大家的支持我們才能一直營運下去。這次分享內容也公開了我們與一些中職球團的合作,在棒球數據的其他專業領域也有所耕耘。最後再次跟大家介紹我們放在 Github 上面的公開數據,供大家這次競賽或是其他研究使用。詳細內容可以直接從 Github 頁面上的文件閱讀,也可以從我們之前寫的文章參考。
Rebas Open Data Github:rebas-tw/rebas.tw-open-data: 台灣棒球進階資料庫|原始數據共享計劃 (github.com)
Open Data 介紹文章:【Open Data釋出和官網更新】台灣棒球原始數據共享計畫 | Rebas 野球革命
總結
這次說明會除了能知道競賽的資訊,也能獲得數據分析經驗者的歷程及相關產業的現況,最重要的我覺得是會後的交流活動,大家可以向講者問問題,我們也能了解現在大家的需求是什麼。以後有類似的活動真的很推薦大家有機會就多多參與。雖然這次很可惜沒有能以線上的方式讓更多人參與,但希望這篇文章能幫助到不克前往的大家。最後我也再整理一下當天我參與活動有人問我 Open Data 的相關疑問在下方,如果有任何問題也非常歡迎私訊我們粉專,或是寄信到我們的信箱:rebastaiwan@gmail.com 與我們聯繫,又甚至是直接在 Github 上面發表 Issues 也是完全沒問題的。很感謝大家耐心閱讀完這篇文章,我們下次有機會再見。
Open Data 問題整理
Q: 是否有即時資料或可使用的 API
A: 目前公開 API 還在開發與訂定規範中
Q: 如果要製作預測模型怎麼使用 Open Data 去實現
A: 把 PA 資料整理成一維陣列,並可以利用 PA 結果當成 label 或是把逐球資料整理成一維陣列,根據球種或是擊球結果分析
Q: 如何看打席中的出局數、壘包狀況等資料
A: 可以從文件中的 PA 文件尋找欄位說明,像是壘包狀況代表就是 bases
欄位,不過要注意壘包狀況我們是用數字代號代替各種情況
Q: 是否有上次競賽的資訊
A: 可以從研究會 FB 貼文獲得資訊,下方留言還有上一屆的各組簡報供各位參考:https://www.facebook.com/share/p/bYMZoHCLw64e4EzC/