서론
지난 19일 개막해 내년 6월 19일까지 열리는 NBA! 미국 농구 팬들은 관심있게 지켜보실텐데요. 절정의 슛 감각으로 선두를 달리며 'NBA 이 주의 선수'로도 선정된 스테판 커리 선수가 여기서 맹활약을 펼치고 있죠.
이번에는 농구 경기에서 큰 변화를 가져올 수 있는 NBA의 3점슛에 관해 데이터로 분석해보고자 합니다.
첫 번째 NBA 시즌은 1949-1950 시즌이었지만, 1979-1980 시즌이 되어서야 3점슛이 도입되었다고 합니다. 현재 NBA 3점 선은 22피트로 코너에서 가장 짧으며 나머지 3점 호는 23피트 9인치라고 해요. 선수들이 더 높은 빈도로 이러한 슛을 시도하는 데에는 약간의 시간이 걸렸고, 이제는 시간이 지남에 따라 점점 횟수가 늘고 있죠. 지난 10년간 훈련과 연습을 통해 슈팅의 정확도가 높아졌고, 시도 빈도도 급격히 높아져 공격과 수비 전략을 완전히 바꾸는 계기가 되었다고 볼 수 있어요.
이번 분석에서는 1) 리그 전반의 슈팅 동향을 분석해 가장 효율적인 슛 유형을 결정하고, 2) 슛 전략과 팀의 성공, 즉 승리 간의 연관성을 알아보는 것을 목표로 합니다.
여기서 이해당사자는 1) 영입할 선수를 결정하는 팀 소유자/총괄 관리자/스카우트 담당자, 2) 공격 및 수비 전략을 수립하는 코치, 3) 어떤 유형의 슛을 연습하고 개선할 것인지에 대한 결정을 내리는 선수가 될 것입니다.
데이터 정제
데이터는 개별 csv파일로 구성되어 있으며, 각 파일에는 NBA 시즌의 모든 플레이가 포함되어 있습니다.
(https://sports-statistics.com/sports-data/nba-basketball-datasets-csv-files/)
각 csv파일로부터 각 행이 단일 플레이이고 각 열이 해당 플레이의 속성인 Pandas Dataframe을 만들었습니다. 데이터 프레임은 응축되었고, 경기 설명과 팀 같은 열의 하위 집합만 사용되었습니다.
플레이 묘사는 “James 27’ 3PT Jump Shot (9PTS) (RONDO 5 AST)”와 같은 문자열이었습니다. 정규식 등을 이용해 슛 타입(3점 중 2점), 슛 비거리, 슛 결과(성패) 등을 추출했습니다. 그리고 나서 분석에 사용할 새로운 열을 데이터 프레임에 만들었습니다.
데이터 분석
리그 전체의 추세
지난 10년간 3점슛 시도 빈도가 어떻게 변화했는지를 먼저 분석했습니다. 아래 그림1은 2010-11 시즌부터 2018-19 시즌까지 리그 전체 슛 시도 중 2점슛과 3점슛이 차지하는 비율을 보여줍니다.
전체 슛 시도 중 3점슛이 차지하는 비중은 2010-11년 20%에서 2018-19년 30%로 높아진 걸 확인할 수 있네요. 선수들이 주로 쏘는 코트 영역이 대부분 2점슛으로 구성되어 있다는 점을 감안하면 전체 슛 시도 중 30% 이상이 3점슛이라는 통계는 상당히 높은 것 같습니다.
(그림1: 연도별 2점슛과 3점슛 시도 비율)
그림2는 후프에서 모든 슛 거리에서 2019-20 시즌 동안 모든 슛 시도 횟수를 보여줍니다. 두 개의 봉우리가 있는 것은 분명한데, 첫번째 봉우리는 0-3피트이고 다른 봉우리는 23-27피트입니다. 이 봉우리들은 각각 바스켓 근처와 가장 짧은 3점 슛 거리에 해당합니다. 두 최고점들 사이는 확실히 움푹 파여있는 것을 볼 수 있는데요. 이는 중거리슛에 해당하며, 대부분의 NBA 팀들의 공격 전략에서 서서히 벗어나고 있는 것을 알 수 있네요.
(그림2: 슛 거리 별 슛 시도 횟수)
슛 시도 분포는 슛 거리에서의 효율성과 밀접한 관련이 있을 가능성이 높기 때문에 다음으로 이러한 추세를 조사했습니다. 그림 3은 슛 시도 대비 슛의 비율을 나타내는 필드 골 백분율(FG%)을 0-40피트 거리의 함수로 나타냅니다. 가장 높은 FG%는 바스켓 근처에 있었는데요. >70%는 0-1피트, >60%는 2피트였습니다. 이 FG%는 4피트 지점에서 40%로 빠르게 붕괴했죠. FG%는 4~30피트 분포의 나머지 대부분에 걸쳐 샷 거리에 따라 크게 다르지 않게 나타났습니다(+/- 몇 퍼센트 포인트).
이것은 슛의 어려움 때문이 아니라 수비 선수들의 위치에 의한 것일 가능성이 높다고 추측되는데요. 3점 시도처럼 멀리 떨어진 슛보다 골대 가까이에서 슛을 날리는 슛이 더 경쟁(수비수가 슈터와 더 가까움)할 가능성이 높기 때문입니다. 사격수에 가장 가까운 수비수의 거리를 포함한 데이터는 이 관찰된 추세를 설명하는 데 도움이 될 것입니다.
(그림3: 슛 거리 당 필드 골 백분율(FG%))
3점슛은 2점슛 1개당 1.5배의 가치가 있는데요. 현재 NBA에서 흔히 쓰이는 통계는 유효 필드골 백분율(EFG%)로 FG% 계산에서 3점슛의 가중치가 1.5배입니다. 그림 4는 EFG% 대 슛 거리를 보여줍니다. 그림 3과 비슷하게, 0-2 피트의 슛이 여전히 가장 효율적입니다. 하지만 이 슛들 이후에는 2점슛보다 가치가 높아 3점슛이 가장 효율적입니다.
결과적으로, 대부분의 선수들은 만약 그들이 바스켓으로부터 2피트 이내에 도달하지 못한다면 3점슛을 시도해야 합니다. 이는 일반적인 전략이며, 좀 더 구체적인 전략은 선수 개개인의 통계를 활용해 선수 개개인에 맞춰질 수 있습니다.
(그림4: 슛 거리별 유효 필드골 백분율(EFG%))
2. 승리와 관련된 팀 동향
리그 전반의 샷 동향을 살펴보았으니, 이젠 샷 통계와 팀 우승 간의 상관관계가 있는지 확인해보겠습니다. 그림 5는 2019-20 시즌 각 NBA 팀들의 승리 횟수 대 그 팀의 3 포인트 비율을 보여줍니다. 전반적인 추세는 없는 것으로 보이며 데이터에 많은 양의 산란이 있습니다. 그림 6은 그림 5와 동일한 데이터를 보여주고 데이터를 두 그룹(플레이오프를 치른 팀과 그렇지 않은 팀)으로 구분하지만 여전히 관찰 가능한 추세는 없는 것으로 보입니다.
이는 3포인트 백분율 통계가 단순하기 때문일 가능성이 높은데요. 3점 비율은 3점 시도 횟수, 2점 시도 횟수 및 2점 백분율을 고려하지 않습니다. EFG%는 이 모든 통계를 가중 평균에 포함하며 각 팀의 슈팅 효율을 더 잘 나타내는 지표가 될 가능성이 높죠.
(그림5: 3점슛 비율 별 승리 횟수)
(그림6: 3점슛 비율 별 승리 횟수, 플레이오프 참가 여부 기준 그룹화)
그림7은 EFG%에 대해 표시된 승리 수를 나타내며, R2 값이 0.59일 때 훨씬 더 나은 선형 추세가 관찰되었습니다. 슈팅 통계만 사용됐고 리바운드, 어시스트, 턴오버, 자유투 비율 등 다른 많은 통계가 무시됐던 점을 감안하면 추세가 꽤 좋네요. 게다가 EFG%가 가장 낮은 팀이 가장 적은 승리 횟수를 기록했고 EFG%가 가장 높은 팀이 가장 많은 승리 횟수를 기록했기 때문에 극단적으로도 꽤 정확합니다.
그림8은 그림 7과 동일한 데이터를 나타내며 플레이오프 팀과 플레이오프 팀이 아닌 팀별로 데이터를 구분합니다. 플레이오프에 진출한 팀은 EFG%가 0.53보다 크지만 플레이오프에 진출하지 못한 팀은 EFG%가 0.53보다 작으며 몇 가지 이상점이 있었습니다. 이 팀 분석은 2018-19 시즌에 거의 같은 결과를 가지고 반복되었습니다.
(그림7: 유효 필드골 백분율 별 승리 횟수)
(그림8: 유효 필드골 백분율 별 승리 횟수, 플레이오프 참가 기준 그룹화)
결론
3점 슛 시도 횟수는 지난 10년 동안 증가했으며(그림 1), 현재 대부분의 슛 시도 횟수는 바스켓 근처에서의 3점 슛 시도 횟수(그림 2)입니다. 가장 효율적인 슛은 EFG%(그림 3,4)를 계산할 때 가중치가 강화되어 골대 근처(0-2피트)가 3점슛 다음으로 많습니다. 팀 분석 결과 3점 대 승률 추이는 없었습니다(그림 5,6). 다만 EFG% 대비 승률 추이가 뚜렷해 대부분의 플레이오프 팀들이 2019-20시즌 EFG%가 0.53보다 높았습니다(그림 7,8).
앞으로 턴오버, FT%, 리바운드 등 다른 통계 카테고리를 포함해 팀 우승 모델을 더욱 탄탄하게 만들 수 있습니다. 또한 개별 선수 기준으로 팀 분석을 하고 남은 시간과 점수를 활용해 어떤 선수가 가장 클러치 성적이 좋은 선수인지 파악할 수 있죠. 이 데이터 세트엔 포함이 안 되어 있지만, 각 샷 시도 위치와 가장 가까운 수비수까지의 거리를 나타내는 데이터도 있습니다. 이 데이터를 추가로 활용한다면 선수의 위치와 가장 가까운 수비수와의 거리에 대한 함수로서 EFG%의 예측 모델을 만드는 데 사용될 수 있을 것입니다.
(출처: NYC data science https://nycdatascience.com/blog/python/the-3-point-shot-in-the-nba-analysis-of-trends-and-correlations-with-team-success/)
Comments