Xp
자동
NBA Maniazine
/ / / /
Xpert

새로운 스탯을 소개합니다, RAPTOR

 
20
  5226
Updated at 2019-11-28 12:58:01

 

지난 10월 FiveThirtyEight.com에서 새로운 스탯을 소개했습니다.

새로운 스탯의 등장은 언제나 반갑죠, 

한 번 신나게  번역해보고자 합니다.

 

https://fivethirtyeight.com/features/introducing-raptor-our-new-metric-for-the-modern-nba/

 

----------------

 

FiveThirtyEight은 2015년부터 NBA 예측 모델을 운영하고 있다. 

우리는 Elo rating을 도입했고, CARMELO 선수 예측 시스템을 접목하여 CARM-Elo 시즌 예측모델도 구축했다. 몇 년에 걸쳐 예측 모델을 검사, 수정했지만 언제나 BPM (Box Plus/Minus)이나 RPM (Real Plus-Minus)같은 다른 스탯에게 밀렸다!


하지만 올해는 다르다! 

 

랩터! (RAPTOR), Robust Algorithm (using) Player Tracking (and) On/off Ratings! 

(선수 트랙킹과 온오프 레이팅을 사용한 강력한 알고리즘!!) 이는 FiveThirtyEight의 새로운 NBA 스탯이다. 우린 몹시 흥분되어있다! 왜냐하면 우리가 직접 스탯을 만들어냈다는 것 뿐만 아니라 이 스탯은 우리의 오랜 두 가지 목적을 이뤘기 때문이다.

 

1. 전통적인 박스스코어 스탯으로는 알 수 없었던 "플레이어 트랙킹 스탯"과 "play-by-play"와 같은 현대 농구 데이터를 활용하여 대중에게 공개된 스탯을 만들자 (*구하는 식과 과정이 숨겨진 RPM을 저격하는 듯 합니다, 올시즌 데이터는 아직도 공개되지 않았죠

 

2. 실제 NBA 팀들이 선수 평가하는 방법을 반영하자 

NBA 팀들은 스페이싱, 수비, 슛 크리에이션을 높게 평가하며, 상대적으로 전통적인 빅맨 스킬을 저평가한다. RAPTOR는 이런 사항들을 유사한 방법으로 평가한다, 이는 우리 그렇게 만들려고 의도해서 그런것이 아니라 실제 그런 스킬의 중요성이 자료에서 자연스럽게 나타나기 때문이다. 

 

RAPTOR는 제임스 하든, 스테판 커리와 같이 ball-dominant한 선수를 지극히 높게 평가하며, 카와이 레너드나 폴조지 같은 공수겸장 스윙맨을 고평가한다. 반면 센터와는 애증관계에 있는데, 사실 이들은 다른 스탯 체계에선 과대평가를 받곤 한다 (* 최근 센터 포지션이 PER과 WS/48의 inflation이 있는 것은 저도 실제 확인한 바 있습니다). 다만 요키치나 엠비드같은 현대 센터나 고베어와 같은 수비 중추는 여전히 높게 평가한다.

 

 

이 기사는 RAPTOR가 어떻게 작동하는지에 대한 하이라이트를 다룰 것이다. 심화 설명을 원한다면 방법론적인 설명에 대한 링크를 제공하겠다. https://fivethirtyeight.com/features/how-our-raptor-metric-works/

 

이제 랩터의 특징을 설명하겠다.

 

- BPM, RPM처럼, RAPTOR는 마진 스탯이며 선수가 리그 평균 선수에 대비하여 100번의 팀포제션 당 미치는 수비-공격 공헌을 수치화한 것이다. Offensive RAPTOR가 +2.1인 선수는 그가 플로어에 있을 때 팀의 100번의 공격포제션에서 +2.1점을 더하는 것이며, 마찬가지로 defensive RAPTOR가 +3.4인 선수는 팀 실점을 3.4점 줄이는 효과를 준다는 의미이다. 

 

- 마진 스탯들은 공통적으로 가진 뚜렷한 한계점들이 있으며 RAPTOR도 예외는 아니다. 마진스탯들은 선수의 퍼포먼스가 선형적 (linear)이며, 가산적(additive)이라고 생각한다. 즉 단순히 선수 개인의 수치를 합산하면 팀 퍼포먼스를 이룬다고 생각하는 것이다. 달리 말하면 RAPTOR는 (그리고 다른 마진 스탯들 역시) 코칭, 팀 시스템, 그리고 팀메이트간의 시너지를 고려하지 않는다.

(* 이부분은 마진스탯을 보시는 분들이 반드시 알고계셔야 하는 부분인데, 마진스탯이 아무리 라인업에서 다른 선수의 영향을 제거하는 과정을 거쳤다고 하나, 특정 라인업, 소위 좋은 라인업에서 선수 개인의 퍼포먼스가 향상되는걸 반영하지 못합니다. 즉 여전히 라인업의 영향이 남아있을 수 밖에 없다는 것입니다. )

 

- RAPTOR는 선수를 평가하는 두 가지 요소가 섞여있다. 하나는 "박스 스코어" 요소로 개별 선수의 트래킹 스탯과 play-by-play 데이터에서 추출한 것이며 다른 하나는 "on-off" 요소로 선수가 코트에 있고, 없을 때의 팀 퍼포먼스를 평가하는 것이다.

 

- "Box" RAPTOR를 구하는데 포함된 변수들은, RAPM (Real adjusted plus-minus)를 잘 예측하는 지를 통해 선별되었다. (* RAPM에 대한 설명은 제가 이전에 마진스탯의 역사에 대해 설명했던 글을 참조하시면 도움이 될 것 같습니다.) 

https://nbamania.com/g2/bbs/board.php?bo_table=maniazine&wr_id=183723&sca=&sfl=mb_id%2C1&stx=tapcal&page=2

 

이는 사실상 BPM이 사용한 것과 동일한 방식이나, RAPTOR는 선수의 play-by-play 스탯과 트랙킹 스탯을 추가로 사용했다는 강점이 있다. 

 

일례로 공격에 있어서 BPM이 전통적 1차스탯인 득점을 사용하는 것에 더해 RAPTOR는 선수의 득점이 얼마나 다른 선수의 어시스트에 의해 이뤄졌는지, 그리고 그 어시스트가 얼마나 가치있는지도 고려하였다. 또한 오펜리바의 가치를 세분화하여 적용하였고, 포제션 소유 시간, 컨테스트 3점 개수와 같이 코트 스페이싱을 측정할 수 있는 여러 요소를 포함했다. 

 

수비적으로는 얼마나 자주 상대 슈터에게 최근접해있는 선수였는지, 그리고 그때 상대 슛이 얼마나 들어갔는지, 얼마나 많은 득점과 오펜리바를 허용했는지, 얼마나 많은 오펜스 파울을 유발했는 지등의 요소를 추가로 고려하였다. 


- RAPTOR의 "온-오프"요소는 선수가 코트에 있을때 팀 퍼포먼스를 평가하며, 특정 선수가 가장 오래 같이 뛰는 코트메이트들이 그 선수가 없을때 어떤 퍼포먼스를 보이는지, 그리고 교체 선수가 기존 코트메이트들이 없을 때 어떤 퍼포먼스를 보이는 지 등이 게임의 강도를 보정하여 고려된다. 물론 약간 얼빠진 소리처럼 들리는 것은 알지만 사실 계산은 생각보다 쉽다. 결과값은 RAPM과 높은 연관성을 보이며, RAPM보다 훨씬 빠르게 안정화되어서, 수 년동안의 데이터도 믿음직하게 처리할 수 있다.

 

- 하지만, 종합적으로, RAPTOR는 "on-off" 요소보다  "박스스코어" 요소에 더 가중치를 준다. out-of-sample 데이터 검사에서, "on-off" 스탯이 유용한 정보를 제공하긴 했으나 "박스스코어" 요소에 비해 선수 평가에 있어서 상당한 노이즈를 포함하고 있었다. (* 팀 마진에 비해 귀책이 뚜렷한  개인 박스스코어 스탯의 비교우위라고 할 수 있겠습니다.)

 

-18-19 시즌 누가 가장 뛰어난 선수였는지를 평가하는 방식으로 적용했을 때, RAPTOR는 상당히 기술적인(descriptive) 스탯이었다 (*기술적이라는 표현이 통계학이 생소하신 분들께는 조금 친숙하지 않을 수 있는데,  "과거, 혹은 현재"를 단순 설명하듯 평가한다는 의미가 있습니다. What happened? 정도가 되겠고, 이게 트렌드를 반영하는 변수를 포함함으로써 What will happen?이라는 Predictive 시점으로 나아갈 수 있습니다. 일반적으로 RPM 스탯은 에이징 커브와 윙스팬등을 추가적인 변수로 고려하여 이 선수의 "향후" 퍼포먼스를 "예측"하는 목적이 있는 다분히 predictive한 스탯입니다). 

 

RAPTOR의 "기술적 (descriptive)"인 면은 위에서 설명한 것처럼, 이 수치가 오롯히 선수의 온-오프 퍼포먼스에 의지하기 때문이다. 이 스탯은 선수의 신장, 체중, 나이 등의 다른 요소를 사용하지 않는다.

 

- 하지만 RAPTOR는 실제 팀과 선수의 미래 퍼포먼스를 예측하는데 사용될 수 있다. 실제 현재 NBA 예측 시스템 (* FiveThirtyEight에서 제공하는 플옵 가능성 테이블 등이 매니아에서도 종종 보이죠)은 현재 RAPTOR에 의해 돌아간다 (우리는 기존 예측 시스템인 CARMELO라는 브랜드 이름을 교체하였다..비록 대부분의 코드는 CARMELO에서 따왔지만..*멜신..). RAPTOR로 구동된 예측모델은 신장, 나이, 드랲 포지션, 그리고 심지어 최근 올느바 수상실적을 이용한다 (올느바 실적은 예측력을 향상시킨다!). 

 

예측모델은 기술적 RAPTOR와는 약간 다른 가중치를 사용하는데 이는 특정 수치는 유독 운에 많은 영향을 받기 때문이다. 우리는 RAPTOR의 예측용 버전을 PREDATOR라고 명명했다 (PREDictive rApTOR). (*이 사이트 운영진들은 작명에 참 많은 힘을 쏟는듯 합니다..)

 

- RAPTOR는 대중에게 공개된 데이터만을 사용하여 만들어진다. 사실 RAPTOR를 개선할수 있는.. 특히 온볼 디펜스와 관련된 공개되지 않은 트랙킹 스탯들이 있다고 한다. 그런 데이터들이 접근가능해져서 RAPTOR를 향상시킬 수 있게 되길 소원한다.

 

- 기존의 CARMELO나 DRAYMOND와 같은 엉뚱, 기발한 약어처럼, RAPTOR라는 이름은 18-19 토론토 랩터스를 기념하여 만들어졌으며, 이는 기존 FiveThirtyEight의 예측 모델이 "토론토가 골스를 이길 것이라고 정확히 예측하였기 때문이다!" (사실 그땐 우리도 이 결과를 완전히 믿지 못했다)

 

 

 RAPTOR 완성버전은 13-14 시즌부터 제공되는데, 이때가 NBA 선수의 트랙킹 스탯이 온라인에 제공되었을 때이다. 우리는 또한 76-77 시즌까지 돌아볼 수 있는 Approximate RAPTOR를 만들었는데, 훨씬 제한된 데이터만을 사용할 수 있었다. 

 

13-14 시즌부터 최소 1000분 이상 플레이한 선수들이 아래 테이블에 제공되며, 보다시피 RAPTOR는 커리, 하든, 레너드, 크리스폴과 같은 퍼러미터와 윙플레이어를 사랑한다. 물론 요키치, AD, 드레이먼드 그린과 같은 몇몇 프론트코트 선수들 역시 높게 평가되기도 한다. 

 

(*스크린샷을 첨부하긴 하지만 이건 직접 링크로 들어가서 찾아보시는게 나을듯 합니다)

https://fivethirtyeight.com/features/introducing-raptor-our-new-metric-for-the-modern-nba/ 

 

박스요소와 on-off요소로 나눈 디테일 RAPTOR를 원한다면, 파일을 다운로드하길 바란다. (https://github.com/fivethirtyeight/data/tree/master/nba-raptor; *슬슬 번역이 귀찮아지네요..)

 

------------------

이후 감사 문장들은 생략하도록 하겠습니다.

 

 

 

 

19-20 시즌 RAPTOR도 현재 제공중입니다.

https://projects.fivethirtyeight.com/2020-nba-player-ratings/

 

Total RAPTOR 순위는

1위 버틀러 11.0

2위 하든 10.9

3위 돈치치 10.4

4위 안테토쿤보 9.8

5위 바튼?! 9.3

6위 르브론 8.6

7위 KAT 8.6

8위 해럴 8.2

9위 레너드 7.6

10위 베인즈 6.6

11위 AD 6.3

12위 아이작 6.3 

(13위 와그너! 6.2)

 

이렇게 되는데, 직접 들어가서 보시면 느끼시겠지만, introduction 글의 설명처럼 합산이나 on-off RAPTOR보단 박스 스코어 RAPTOR가 더 체감과 유사하긴 하네요. 

 

박스스코어 RAPTOR 순위는,

1위 돈치치 11.7

2위 버틀러 11.2 (버틀러 당신은...)

3위 하든 10.0

4위 타운스 9.5

5위 쿤보 9.1

6위 해럴 8.5

7위 AD 8.1 

8위 카와이 7.7

9위 르브론 7.7

10위 바튼 7.6

 

참고로 on-off RAPTOR 1위는 시아캄입니다!  

18
Comments
2019-11-28 10:40:22

바튼!!!!

WR
2019-11-28 10:43:04

훌륭한 2옵션 요키치

2019-11-28 10:45:24

와그너나 바튼이 요즘 워싱턴과 덴버 경기 보면 눈에 띄는데 꽤 그걸 잘 나타내주네요.

 

좋은 설명 감사하고 잘 보겠습니다.

WR
1
2019-11-28 10:46:33

말씀해주셨던 게 기억나서 일부러 와그너까지 끊었습니다!

2
Updated at 2019-11-28 10:47:49

538이 농구쪽 진출한후로.. 이쪽은 뭐랄까 공신력스러운 가공스탯이 되고 있죠  대형 언론매체도 엄청 많이 가져다쓰고, 현지 칼럼러들도 많이 들고오는 지표라서 알고 계시면 도움 많이 되실 지표입니다.

좋은글 감사합니다

WR
1
2019-11-28 10:48:50

글에서 절치부심한게 느껴지더군요. 특히 이사람들 네이밍 센스는 너드같아서 마음에 듭니다. 

2019-11-28 11:47:16

잘봤습니다!

WR
2019-11-28 15:45:43

감사합니다

2019-11-28 11:50:36

엉덩이가 멀쩡한 바튼은 무서운 선수군요
요키치 더 분발해야겠습니다

WR
2019-11-28 15:46:02

요키치가 다소 부진한 와중에 어떻게 이리 잘나가나 싶더니 바튼이 있었네요! 

2019-11-28 12:52:55

538의 작명센스가 또 빛을 발하네요.^^

멋진 설명과 소개 정말 감사합니다. 자주 찾아보는 스탯이 될것 같아요.

작명에 걸맞게 시아캄이 돋보이는 점도 대단하네요.

WR
1
2019-11-28 15:46:16

좋게 봐주셔서 감사합니다

Updated at 2019-11-28 15:06:09

이름 보자마자 카멜로가 떠올랐습니다 이분들 작명 센스가.....
바튼은 사랑입니다. 작년에 욕했던 게 너무 미안해질 만큼 너무 잘합니다.

WR
2019-11-28 15:47:43

이 사람들은 이름 지을때 스탯 만드는 것 만큼 고민했을 것 같네요. 

저도 바튼이 이렇게 잘하고 있는줄 이번 글 번역하면서 알았습니다. 

덴버 키 플레이어였다니.!

Updated at 2019-11-28 16:15:08

흥미로운 글 감사드립니다. 잘 몰라서 그러는데, 538이라는 곳은 스포츠 통계 전문 기업인가요?

WR
2019-11-28 21:44:46

원래는 투표 예측하는 사이트였는데 인기를 얻더니 스포츠에도 뛰어든 것으로 압니다.

WR
1
Updated at 2019-11-28 17:51:34

그거면 된겁니다
사실 탑10에서 끊으려는데 밑에가 자꾸 눈에 밟히더라고요. AD부터해서..

2019-11-28 18:01:23

레이커스의 우승한다면 KENTAVIOUS라는 스탯이 만들어질 것을 기대해봅니다

nyk
55
3911
24-04-23
nykphi
31
3397
24-04-21
miaphi
42
7593
24-04-18
bos
77
9938
24-04-16
min
82
15146
24-04-16
atlbkn
40
6644
24-04-13
por
69
16575
24-04-12
hou
33
12173
24-04-08
orl
43
8105
24-04-10
dalsac
48
8496
24-04-05
dal
57
20283
24-04-04
gswind
89
11316
24-04-02
hou
62
11162
24-03-23
bos
125
31415
24-03-18
atlgsw
91
23084
24-03-18
bosden
59
7826
24-03-16
den
125
26206
24-03-14
lal
44
8910
24-02-24
den
93
19297
24-02-20
검색 대상
띄어쓰기 시 조건









SERVER HEALTH CHECK: OK