본문 바로가기

프로야구 데이터

2. 스탯캐스트의 투구 데이터 분포

 스탯캐스트 데이터에서 투구에 대한 정보로 x, y, z 축에 대한 속도(vx0, vy0, vz0) , 가속도(ax, ay, az), 실제로 포수에게 도달하는 지점과 공기저항이 없을 때 이론적으로 포수에게 도달하는 지점의 차이인 pfx값을 제공한다 (글 1-1 참고). 2008년도부터 2018년도까지의 메이저리그 정규리그 스탯캐스트 데이터에서 존재하는 17가지의 구종 중 전체 투구 수의 95.7%를 차지하고 있는 7가지 구종(포심 패스트볼(FA), 투심 패스트볼(FT), 컷 패스트볼(FC), 싱커(SI), 커브(CU), 슬라이더(SL), 체인지업(CH))으로 위의 투구정보를 살펴보고자 한다. 아래 그래프들은 각 구종 별 300,000개의 데이터로 구성되어 있으며 우투수는 1,503,058개 좌투수는 596,942의 투구 수로 그린 그래프다.

 

아래의 그래프들을 보면, 우투수와 좌투수의 던지는 방향으로 인해 속도(vx0, vy0, vz0) , 가속도(ax, ay, az), pfx가 x축에 대해 서로 반대임을 확인할 수 있다. 

 

 다음으로 스탯캐스트 데이터에서는 연도별 경향을 확인할 수 있다. 위의 세가지 그래프에서 가장 확연하게 구분되는 커브(빨간색)와 흔히 '직구'라고 불리는 포심패스트볼의 구속에 대해 확인하였다.

메이저리그의 포심 패스트볼과 커브의 구속, 빨간 선은 그 해의 평균 구속이다.

이 경향을 보면 메이저리그의 투수들의 평균 구속이 증가함을 확인하였다. 

(2010년부터 2016년도까지의 흰 부분은 한 특정값에 대해 측정을 하지 못한 부분은 측정 장비에 대한 결함으로 생각하고 있다. 2017년부터는 PITCHf/x에서 스탯캐스트로 발전)