본문 바로가기

프로야구 데이터

(5)
4. 투수와 타자의 플래툰 시스템에 따른 구종 구사비율 플래툰 시스템은 우투수에 강한 좌타자를 대결시키거나 좌투수에 강한 우타자를 대결시키는 것을 말한다 (반대로 좌타자에 강한 우투수, 우타자에 강한 좌투수로도 말함). 이에 따라 투수들이 사용하는 구종 구사율이 어떻게 다른지 살펴보고자 한다. 2008년도부터 2018년도까지 11년동안의 투구 수는 각각 우투수와 우타자 3,175,248개, 우투수와 좌타자는 2,965,106개, 좌투수와 우타자 1,656,670개, 좌투수와 좌타자의 경우는 684,629개다. 이 데이터에 의해 각 플래툰에 따른 구종 구사율은 아래와 같다. 이 그래프를 보면 포심패스트볼(FF), 투심패스트볼(FT), 컷 패스트볼(FC), 싱커(SI), 커브(CU)는 플래툰에 상관없이 비슷한 비율로 사용하는 구종인 것을 확인할 수 있다. (그래..
3. 아메리칸 리그와 내셔널 리그의 구종 구사비율 본 글은 아메리칸 리그와 내셔널 리그의 변화구 구사율의 차이를 보기 위해 작성하였다. 사용한 데이터는 2008년도부터 2018년도까지 메이저리그의 정규리그 데이터를 이용하였으며, 구종이나 팀 이름이 없는 데이터를 제외한 7,757,422 투구를 이용하였다. 아메리칸 리그 15팀의 총 투구 수는 3,980,070개, 내셔널 리그 15팀의 총 투구 수는 3,777,352개다. 두 리그의 총 투구 수 대비 각 구종들의 구사율을 살펴보면 아래와 같다. 그래프는 비율 별 오름차순으로 정렬하였다. ( FF : 포심 패스트볼, SL : 슬라이더, SI : 싱커, CH : 체인지업, FT : 투심 패스트볼, CU : 커브, FC : 컷 패스트볼, KC : 너클 커브, SF : 스플리터, IB : 고의사구, KN : 너..
2. 스탯캐스트의 투구 데이터 분포 스탯캐스트 데이터에서 투구에 대한 정보로 x, y, z 축에 대한 속도(vx0, vy0, vz0) , 가속도(ax, ay, az), 실제로 포수에게 도달하는 지점과 공기저항이 없을 때 이론적으로 포수에게 도달하는 지점의 차이인 pfx값을 제공한다 (글 1-1 참고). 2008년도부터 2018년도까지의 메이저리그 정규리그 스탯캐스트 데이터에서 존재하는 17가지의 구종 중 전체 투구 수의 95.7%를 차지하고 있는 7가지 구종(포심 패스트볼(FA), 투심 패스트볼(FT), 컷 패스트볼(FC), 싱커(SI), 커브(CU), 슬라이더(SL), 체인지업(CH))으로 위의 투구정보를 살펴보고자 한다. 아래 그래프들은 각 구종 별 300,000개의 데이터로 구성되어 있으며 우투수는 1,503,058개 좌투수는 596..
1-1. 스탯캐스트 데이터 설명 1 (pfx_x, pfx_z) 스탯캐스트 데이터에서 투수의 투구에 대한 칼럼으로 구속 , x, y, z에 대한 속도와 가속도, 2017년도부터 투수가 공을 놓는 위치, 공의 스핀 등을 제공한다 (x, y, z축은 아래 그림과 같다.). 이 중 pfx_x, pfx_z는 각 x축 z축 상에서 공이 실제로 포수에게 도달하는 지점과 공기저항이 없을 때 이론적으로 포수에게 도달하는 지점의 차이를 나타낸다. 또한 각 축 상의 '공의 꺾임', '공의 변화'라고도 부른다. pfx_x, pfx_z값을 측정된 각 x, y, z축 상의 속력으로 유도하는 글이 있다 [1]. 이 글에서는 타자가 공에 반응을 시작하는 지점인 포수에서 40ft(15.24m) 떨어진 곳으로부터 포수에게 도달할 때까지 공기저항이 없는 시스템을 고려하여 이론적으로 공이 도달하는 위..
1. 야구 데이터(PITCHf/x & 스탯캐스트) 야구데이터는 2008년 투구를 추적하는 PITCHf/x 시스템으로부터 시작해서 2017년 투구, 타자, 수비를 모두 기록할 수 있는 스탯캐스트 시스템으로 발전하여 현재까지 기록되고 있다. 메이저리그에서는 오픈소스로 데이터를 제공하고 있으며, 국내 야구에서는 프로야구 공식기록통계 업체인 스포츠투아이가 각 구단에게만 제공하고 있다. 1. 방식 2008년부터 2016년까지 사용 된 PITCHf/x 투구 추적 시스템은 홈 플레이트에서 50피트 떨어진 곳에서부터 투구를 추적하며 , 20개의 이미치 촬영을 통해서 투구의 궤적을 찾는다. 스탯캐스트 시스템은 트랙맨(TrackMan)이라고 하는 레이더 시스템을 이용한다. 투수의 손에서 포수의 글러브까지 초당 수천개의 캡쳐를 통해 전체를 측정한다. 2. 데이터 스탯캐스트..