포지션의 경계 변화, 그리고 센터의 역할
이런 글을 써보고자 했던건 사실 조금 되었는데, 그동안 진득하게 글을 쓸 시간이 부족하여 못하고 있다가, 주말을 맞이해 써보려고 합니다.
다만 사용하는 올시즌 데이터는 처음 기획했던 시기에 준비한 것이여서 약간 지난 데이터라는 점은 양해를 부탁드립니다. (대략 7-8경기 정도 전이라고 보면 될것 같아요)
본 글의 목적은, "현재 NBA에서 각 포지션의 역할이 어떻게 정해져있는 지"에 대한 기본적인 고찰을 해보는 것입니다. 이과정에서 몇가지 데이터 처리 방식들이 들어가는데 하나하나 설명드리는게 도움이 될 것 같진 않고, 그냥 의미만 파악하시면서 가볍게 넘어가시는게 좋을 듯 합니다.
올시즌 basketball-reference에서 제공하는 전체 선수들중 500분 이상 출전한 선수들의 TS%, 3PA ratio, FT ratio, ORB%, DRB%, AST%, STL%, BLK%, TOV%, USG% 을 사용하여 포지션에 따라 어떠한 형태의 플레이들을 하고 있는지 Clustering하는 과정을 우선적으로 진행했습니다.
이 과정에는 Self-organinzing map (SOM; 자기조직화지도) 을 사용하였는데 이는 고차원의 데이터를 2차원의 격자로 끌어내리는 dimension reduction과 clustering을 동시에 해주는 방법입니다.
비슷한 스탯 양상을 기록하는 선수들은 같은 cluster로 묶이게 됩니다.
(미리 정한 cluster의 숫자는 12개입니다.)
18-19 시즌 500분 이상 출전한 선수는 293명이었고, PG와 SG가 60+명으로 포워드나 센터에 비해 상대적으로 많았습니다. 이것만으로도 현재가 가드의 시대란 걸 알수가 있죠..
눈에 가장 먼저 보인 점은, 센터 포지션의 플레이 다양성이 매우 낮다는 것입니다.
적어도 3-4개의 플레이 타입이 다양하게 공존하는 다른 포지션에 비해 9번 유형에 의해 독점적으로 점유되어 있는 것을 볼 수 있습니다. SF, PF 라인은 포지션 중에서도 특히나 다양한 유형의 선수들이 고루 포진해 있었습니다. Versatile forward가 사랑받는 시대임을 반영하는듯 합니다.
30년전 88-89 시즌과 비교하면 확실히 센터의 역할이 얼마나 한정되었는지 확인할 수 있는데,
30시즌 전에는 PG가 가장 정형화된 플레이를 하는 포지션이었습니다.
마치 현대의 센터를 보는듯하죠
기준 출전시간을 넘긴 선수들 숫자자체도 현재보다 적고, PG, SG 비율도 현재보다 차이나게 적습니다.
반면 센터는 크게 3종류의 타입으로 나눠지고, 플레이 타입의 종류 및 비율이 PF와 센터간에 차이가 거의 나지 않았습니다. 하지만 18-19 시즌 그림을 보시면, 요즘 시대 PF의 플레이 스타일은 센터보단 오히려 SF에 가깝죠. 다양성도 더 높고요.
SF 포지션은 어느 시대에나 가장 다양한 플레이 타입을 보이고 있었네요.
이런 모습은 t-SNE로도 확인이 되는데요, t-SNE는 고차원 데이터를 낮은 차원에서 보기쉽게 나타내주는 방법 중 하나인데 PCA와 유사한 대신 고차원에서의 지역적 구조를 더 잘 유지해주는 장점이 있습니다.
(밑의 그림에서 점 하나하나가 한명의 선수이며, x축 y축의 값 자체는 의미가 없습니다. 서로간의 거리와 분포가 이 기법에서 보고자하는 핵심 정보입니다)
보시면,
앞선 SOM에 의한 clustering 결과와 마찬가지로, 적당한 면적으로 PF와 거의 동일한 구역에 퍼져있던 센터 (주황색)의 분포는 18-19시즌에선 일부 한정된 영역에 국한되어 외로이 떨어져나가 있는 것을 볼 수 있습니다.
또한 88-89 시즌에는 PG->SG->SF->PF/C로 이어지는 연속적이고 점진적인 분포 양상을 보이는데 반해, 현대는 센터를 제외하고는 이러한 포지션 간의 경계가 상당히 모호해진 것을 알 수 있습니다.
다른 포지션과는 달리 센터라는 포지션이 특정 플레이 타입, 한정된 스탯을 담당하는 롤플레이어화되고 있다는 것이죠.
최근 PER이란 스탯이 빅맨에게 유리한 것 아니냐는 말씀을 해주시는 분들이 많은데, 식을 뜯어보면 실제로 그럴 여지가 많이 있습니다.
어시에 의한 득점 비율을 개인 수치가 아닌 팀수치를 이용한다는 점과 오펜리바의 비중이 높은 점 등이 이유가 될 수 있는데요. 재밌는 점은 30년 전과 비교해보면, 그때는 그러지 않았다는 겁니다.
위 그림을 보시면 88-89시즌과 비교했을 때, 유독 센터포지션의 PER이 크게 증가하였습니다.
PER이란 공식자체는 30년 전이나 지금이나 똑같이 적용되는 것인데도, 신기하게도 30년 전에는 빅맨의 PER의 딱히 높지 않았었습니다.
하지만 PER이 빅맨에게 유리한 공식이란 것은 동일하기 때문에, 현재 빅맨들이 그당시보다 일반적으로 더 스탯 생산성이 뛰어나다고는 할 수 있으며, 이는 현대 빅맨이 수행하는 한정된 롤이 특히 PER을 기록하기에 좋은 상황이라고도 볼 수 있습니다.
다른 포지션은 PF를 제외하곤 대개 감소하는 추세인데, 아무래도 이건 PER이 정말 감소했다기 보단 센터의 PER이 너무 높게 나오기 때문에 리그 평균을 15로 맞추는 PER 특성상 반대급부로 감소했을 가능성이 큽니다.
물론 그와중에 PER이 유독 유의미하게 감소한 SF 포지션은 현대 농구에선 스탯 생산성이 떨어진 포지션이라고 봐야겠죠. SF 포지션 내에 다양한 타입의 선수들이 생겨났다는 건 어떻게든 특정 롤을 수행해내면 (ex. 수비, 3점, 득점 etc), 윙 플레이어들은 낮은 생산성으로도 현재 로스터에서 충분히 살아남을 수 있어졌다고 볼수 있습니다.
보시다시피, 센터 (보라색)는 소수의 특정 cluster, 즉 한정된 스탯 유형 (or 플레이 스타일)에 국한되어 나타나고 이들이 대체로 높은 PER을 기록하고 있습니다.
이러한 빅맨의 스탯 상승은 비단 PER만의 현상은 아닙니다.
WS/48에서도 나타나죠.
빅맨이 캐리하기 어려운 시대라고들 말합니다.
PER, WS/48이 모두 상승했음에도 말이죠.
저는 오히려 저런 전반적인 스탯 상승이 빅맨이 캐리하기 어려운 시대를 만들었다고 생각합니다.
이 그림은 "포지션"별로 각각의 PER을 normalizaiton해서 분포를 본것입니다.
위에서 살펴봤듯 30년 전과 비교해서 센터의 전반적인 PER은 상승하였지만, 이는 센터 포지션 전체가 상승 한 것이기 때문에, 포지션끼리 PER의 분포를 비교해보면 차이가 없습니다.
(박스 플랏의 저 박스의 세로 길이를 비교해서 봐주시면 됩니다)
다르게 말하면 포지션내에서 상대적으로 딱히 잘하지 않는 센터들도 상당히 좋은 생산성을 나타낸다는 말입니다. "대체 가능"하다는 거죠. 르브론의 자리는 메꾸기 힘든데도 AD의 빈자리는 타팀에서 방출된 선수인 오카포가 웬만큼 메꿀수 있는 것처럼요.
반면 PG, SF, 특히 SF 포지션은 30년 전과 비교해서 대단히 큰 차이입니다.
실제 표준편차나 CV (변동계수)를 구해보면 더 극명하게 드러나고요.
이는 쉽게 말하면, 센터는 한정된 롤플레이를 하는 전반적으로 좋은 생산성의 "상수"라면,
SF와 PG는 다양한 플레이 타입이 공존하면서 포지션 내 선수별 생산성 격차가 큰 "변수"가 되는거죠
상수는 변수를 설명하지 않는다고 하죠.
우리가 승리로 향하는 여러 변수들이 있다고 할때, 센터는 "우수하게 플레이 하고 있음에도" 변수보단 상수에 가까운 존재가 되어버렸다는 생각이 듭니다.
각각의 클러스터가 어떤 식으로 다른지 궁금합니다!