2
Free-Talk
Xp
NBA-Talk
/ / /
Xpert

우리 팀은 라인업 대비 얼마나 잘했을까

 
30
  2340
Updated at 2020-10-20 10:05:29

https://mania.kr/g2/bbs/board.php?bo_table=maniazine&wr_id=210895

지난 글에서 소개한 대로, Bball-index에서는 공격/수비에서의 플레이를 트랙킹하여 공격에서 12가지, 수비에선 7가지 타입으로 분류합니다. 

 

공격은 포지션 (가드/윙 vs. 빅맨), 3점슛 빈도, 3점 시도 유형, 아이솔레이션과 포스트업 빈도, 픽앤롤 활용 정도에 따라 나눠지고, 수비에서는 포지션, 퍼러미터 수비 정도, 헬프 수비, 림 로테이션, 빅맨의 경우 드랍 or 헷지 빈도를 통해 나눠지게 됩니다 (자세한 설명은 지난 글 참조).

 

그렇다면 과연 각 팀은 어떤 타입의 플레이어들로 구성되어있을까요?

 

팀별 선수들의 출전시간을 공격 타입별로 더한 후 팀의 총 경기시간 중 얼마를 차지하는지를 확인해보면 아래와 같습니다. 

 

*왼쪽부터 ORtg가 높은 순서 

 

공격력이 강한 팀일수록 샷 크리에이터, 볼핸들러의 비중이 높다는 것을 알 수 있으며, 특히 ORtg 하위 10개팀 중 7팀은 샷크리에이터의 비중이 거의 없고, 올랜도와 미네소타의 경우 아예 Primary Ball Handler 조차 존재하지 않습니다. (펄츠는 슬래셔로 분류되더군요) 

 

서로간의 유사성을 살펴보면 아래와 같습니다 (큰 점은 플옵 진출팀)

한쪽으로 Ortg가 확 쏠리는 모양새는 없습니다만 플옵에 진출하지 못한 팀들 (작은 점)은 주로 가운데 부근에 옹기종기 모여있긴 하네요.  휴스턴, 레이커스, 보스턴, 오클라호마는 다른 팀과 비교했을 때 상당히 특색있는 공격 라인업을 보유하고 있다고 할 수 있겠네요. 

 

 

그렇다면 과연 12개의 공격 타입 중 어떤 플레이어가 팀 공격력에 유의미한 도움을 줄까요?

 

회귀분석을 통해 각 타입별 출전시간과 팀 Ortg와의 통계적 유의성을 확인해본 결과,

오직 "샷 크리에이터" 만이 유의미하게 팀 공격력을 향상시켰습니다 (p-value =0.006).

 

비록 기준은 넘지 못했지만 Ortg를 올리는 경향성을 보인 타입으로는 신뢰도 순으로

(p-value가 작을수록 더 신뢰도가 높은 것입니다)

 

- Primary Ball Hander (p-value = 0.1399)

- Post Scorer (p-value = 0.1430) 

- Stretch Big (p-value = 0.1435

이렇게 3개의 타입이 나왔습니다. 이외에는 p-value 0.2 미만으로 나오는 타입이 없었네요.

 

 

동일한 분석을 수비에 적용해봤는데요. 먼저 각 팀의 수비 타입별 출전시간 비중은 아래와 같습니다.

 

정규시즌 가장 강력한 수비를 보여줬던 밀워키는 독특하게도 모바일 빅 (헷지수비하는 빅맨)과 헬퍼 (자기 마크맨을 버리고 림수비를 도와주는 선수)가 없고 굉장히 많은 체이서 (슈터, 커터를 따라다니는 수비수)를 보유하고 있습니다. 앵커형 빅맨의 출전 시간 비중이 다른 팀에 비해 높지는 않았습니다만 "질"이 상당히 훌륭하기에 저런 효과를 나타낼 수 있겠죠 (브룩 로페즈, + 퍼러미터 빅 타입의 수비왕 안테토쿤보). 


 

회귀분석을 돌려봤을 때, 공격 타입에 비해 유의미한 결과가 더 많이 나왔는데요!

p-value 순으로,

1. 체이서 p-value = 0.00008 

2. 헬퍼 p-value= 0.000411

3. 윙 스타퍼 p-value = 0.0126

4. Point of Attack (단신 볼핸들러 전담 수비수), p-value = 0.0472

 

이렇게 네가지 타입이 유의미하게 팀 수비력을 향상시켰습니다. 하지만 전체 타입이 7개이므로, 절반 이상인 4가지 타입을 동등하게 중요하다고 생각하기보다는, 탑2 수비타입인 체이서헬퍼에게 집중하는게 좋을 것 같은데요.

 

두 타입의 공통점을 보자면, 체이서는 슈터 or "커터"를 따라다니는 수비수이고, 헬퍼는 자기 마크맨을 떠나서라도 상대 "드라이브인"을 체크하는 선수입니다. 즉, 림을 향한 드라이브인 or 오프볼 컷인을 막아내는 요원을 "충분히" 구성했는지가 좋은 수비팀을 만드는 핵심이라고 볼 수 있겠습니다.

  

 

그렇다면... 과연 실제 우리 라인업은 안녕하실까요?

구성만큼 좋은 퍼포먼스를 보여주고 있는지 확인해봤습니다.

 

 

1. 공격

 

x축은 팀의 공격타입 구성과 출전시간에 따라 "예상"되는 ORtg이고, y축실제 ORtg입니다.

사선보다 높으면? 선수단의 수행력/능력 or 코치의 전술/전략이 뛰어나다는 뜻이고, 낮다면... 그 반대죠ㅜㅜ

가장 크게 향상된 팀은, 바로 댈러스. 원래 예상되는 수치도 리그 탑3 수준인데 실제 찍은 수치는 그걸 아득히 상회합니다. 돈치치의 위엄... 클리퍼스, 유타, 포틀랜드가 또한 기대 이상의 공격력을 보여주고 있네요.

 

애틀란타는 생각보다 구성은 괜찮은데 결과가 나오지 않고 있고, 골스, 뉴욕, 샬럿, 시카고, 새크, 클리블랜드와 같은 플옵 진출 실패 팀들은 대개 공격력이 기대에 못미치는 군요. 플옵 진출팀 중에서는 토론토와 필라델피아, 오클라호마가 구성에 비해 공격 퍼포먼스가 떨어지는 팀입니다.

 

 

2. 수비

 

x축은 마찬가지로 "예상"되는 Drtg, y축은 실제 Drtg입니다. 

눈에 들어오는 팀으로는 토론토와 레이커스, 그리고 멤피스가 있네요. 라인업의 평균적인 기대치를 훨씬 상회하는 수비력을 보여주고 있습니다. 인디애나, 멤피스는 공격에서도 기대 이상이었는데 수비에서도 좋은 모습을 보여줍니다, 특히 멤피스는 플옵 진출엔 실패했지만 선수단 나이 대비 수행 능력이 우수해서 다음 시즌을 기대하게 만드는군요.

 

반대로 기대에 못미치는 팀으로는 샌안, 새크, 애틀, 워싱턴, 그리고 뉴올....이 있겠습니다. (뉴올 수치를 보니 분석은 그럭저럭 제대로된 것같아 기분이 더럽고 좋네요.)

 

새크라멘토의 수치가 공수에서 모두 충격적으로 낮습니다. 라인업의 구성상 선수들의 공헌이 플레이타입 평균 정도만 되었더라도 플옵권 팀 중에서도 상당한 경쟁력이 있어보입니다. 

 

 

3. 마지막으로 Net Rating

클리퍼스가 비록 올시즌 마무리가 나빴지만 구성에 비하면 선수단의 수행력/능력 자체는 훌륭했던 시즌 같습니다. 조직력에 다소 문제가 있었지만 이를 잘 보완할 수 있다면 다음 연도가 상당히 기대되는 팀이 아닐 수 없습니다. 

 

우승팀 레이커스 역시 클러퍼스 못지않게 뛰어난 수행력을 보여줬고, 유타, 인디, 댈러스, 토론토 등이 뒤를 이었습니다. 인디애나는 막판 사보니스의 부상이 뼈아팠네요

 

샌안, 새크라멘토, 시카고, 클리블랜드, 애틀은 어떻게든 보완이 필요해보입니다. 

 

 처음엔 간단하게 시작했는데, 글을 쓰면서 궁금해지는게 늘어서 그림을 추가하다보니 어째 글이 길어졌는데 아무쪼록 지루하지 않으셨기를 바랍니다 :)

19
Comments
2020-10-20 01:13:08

좋은 글 잘봤습니다. 올시즌 킹스가 엄청 꼬인 시즌이라 생각했는데 수치로 보니 정말 끔찍하네요 (나 올시즌 경기 어떻게 본거지...) 다음 시즌에는 보완이 되었으면 좋겠습니다.

WR
Updated at 2020-10-20 01:20:23

토닥토닥 (13위 팀 팬이 12위 팀 팬에게..)

2020-10-20 01:27:34

진짜 올 시즌 썬더 보면 어떻게 플옵 간 건지가 절로 나옵니다

WR
2020-10-20 01:34:20

그래도 예상 Net rating보면 구성 자체는 괜찮은 편이었던 것 같습니다. 볼핸들러의 시대에 나름 트리플 볼핸들러 체제가 꽤 잘 먹혔죠. 개인적으로 루키 베이즐리 선수의 플레이오프 Box RAPTOR 수치가 상당해서 다음 시즌 기대 중입니다. 

2020-10-20 02:15:51

뉴올 갈매기 나가기 전 한 3년 보면 실제랑 예상스탯 간 괴리가 엄청날 거 같네요... ㅠ

클리퍼스의 엄청난 수치와 대비되는 새크의 다른 의미로 엄청난 수치도 무섭네요...

WR
2020-10-20 02:18:00

새크라멘토는 구성만 보면 리그 4위팀이네요; 다만 그 실제 선수의 개인 능력, 전술 적합도 or 완성도, 수행력 등에서 많이 부족했던 시즌이 아닌가 싶습니다. 반대로 말하면 잘만 돌리면 단숨에 치고올라갈 포텐셜이 있는 팀이라는 말도 되고요.

2020-10-20 04:36:30

잘 봤습니다. 

WR
2020-10-20 11:20:45

감사합니다 :)

2020-10-20 10:15:01

흥미로운 글 잘 봤습니다. 

댈러스는 대단하군요. 저 정도의 차이를 만들어 내는군요.

클리퍼스는 수치화 되지 않는 - 부분들이 팀의 경쟁력을 떨어뜨렸다고 봅니다. 

수치가 비슷하면 손해보는 부분이 꽤 있고

특히 플옵같은 경쟁팀과의 대등한 경기에서는 그 틈이 결과에 영향을 미친게 아닌가 생각해 봅니다. 

레이커스는 오히려 반대라 생각되구요.   

WR
2020-10-20 11:21:48

올시즌 댈러스 Ortg가 역대 1위라고 하더군요. 고작 2년차인 돈치치가 이끄는 팀이고 포르징기스가 완전히 터진 모습이 아니었는데도 이정도였으니 내년엔 어떻게 될지.. 기대가 큽니다.

Updated at 2020-10-20 12:48:40

프라이머리 볼 핸들러가 없고, 샷 크리에이터가 약한 팀 필리.

수치상으로도 여러모로 기형적이었네요.

리버스감독이 이부분에 변화를 줄수 있을지 모르겠어요.ㅠ

트레이드로라도 꼭 이 부분이 개선되면 좋겠습니다.ㅠ

좋은 글 정말 감사합니다.^^

WR
2020-10-20 13:06:47

샌안과 유사한 구성으로 나오는데 두 팀다 3점에 문제가 있으니 다소 코트가 빡빡한 문제가 있었습니다. 공격 구성만 보면 거의 밀워키에 준하는 리그 탑5 급이니 그래도 기대해볼만한 것 같습니다. 수비는 기대 이상이었고요!

2020-10-20 13:30:56

좋은 말씀 감사합니다! 리버스 감독과 예거 코치가 잘 다듬어주면 좋겠습니다.^^

2020-10-20 15:18:21

좋은 글 감사합니다.
다만 p-value 에 대한 부분(p-value가 작을수록 더 신뢰도가 높다고 하신 부분)은 잘못 아신 것 같습니다. P-value는 신뢰도의 역수가 아닙니다. H0가 보통 “베타가 0 이다”라고 쓰여지는데 그 H0 가 맞는다는 가정 하에 실제로 데이터에 기반해서 estimate 한 베타 값이 0일 확률이죠. 보통 p-value 가 작으면 그 베타 값이 significant (유의미, 즉 0과 다름)하다고 결론 내리는데, 거기서 해석이 끝나야지, p-value가 큰지 작은지에 따라서 ‘더’ 혹은 ‘덜’ significant 하다고 해석하는건 잘못된 해석입니다.
여기서 ‘X 변수들 중 어느 것이 Y에 가장 큰 영향을 주느냐?’는 질문에 답하려면 p-value가 지정한 알파값보다 작은 X 변수들 중에서 coefficient 값이 큰 순으로 보셔야 합니다.

WR
Updated at 2020-10-21 02:20:37

p-value는 null hypothesis를 기각할 수 없는 게 얼마나 "우연히" 유의한 것처럼 나왔을지에 대한 확률을 말해주는 거죠. 결국 낮을 수록 유의할 확률이 높은 것이므로 p-value에 따른 significance 해석이 틀린 것 같진 않습니다.   


실제로 p-value가 특정 기준치 (일반적으로 0.05) 미만일 경우 significant하다고 표현하고 이는 당연히 p-value 0.05 이상보다 "더" significant한거죠. p-value가 작으면 더 큰 영향을 미치는 것이라고 말할 수 없을 뿐 더 유의한 것은 사실입니다.  

 

실제로 제가 몸담고있는 연구분야에선 -Log10 (p-value)를 하나의 indicator로 논문에도 흔하게 사용하며 manuscript에서도 p-value가 낮은 경우에 more significant하다는 표현을 아무렇지 않게 잘 사용합니다, 당연히 리뷰어 태클도 없고요. p-value가 가장 낮은 dfferentially expresssed gene을 the most significantly altered gene라고 표현하는건 일상적이기까지 합니다. 물론 effect size를 더 좋아하지만요.

 

그리고 아래 부분 effect size와 significance는 말씀하신 대로 항상 일치하는 건 아니니 둘다 소개해드리는게 최상이었겠지만, 대개 비슷한 경향성을 띄고, 저도 처음엔 coefficient까지 함께 소개하려했으나 어차피 결론적으로 차이가 없는데 통계에 대해 잘 모르시는 분들은 오히려 헷갈리거나 지루하게 받아들이시더군요. 결국 읽는 사람들이 궁금한건 그래서 Ortg, Drtg에 중요한 플레이타입과 그 순서이지, 그 수치자체가 아니니까요. 순서에 차이가 없다면 그냥 더 친숙한 p-value가 낫다고 판단했습니다.

2020-10-21 05:52:26

우선, 통계를 오래 해온 사람으로서 보다 정확한 정보를 전달하는게 좋을 것 같아서 적었던거지, 굳이 사소한 흠을 잡고자 하는 의도는 아니었습니다. 그런 식으로 느껴지셨다면 죄송합니다.

 

예전에 통계수업을 들었을 때 교수님께서 하셨던 질문이 떠오르네요.

정확히는 기억이 안나는데, 이런 식이었습니다.

"당첨될 확률이 50%인 복권을 샀다. 이 복권을 긁었을 때 이 복권이 당첨 복권일 가능성은 얼마나 될까?"

저야 당연히 50%라고 생각했었는데, 교수님 대답은 0% 혹은 100% 였습니다.

사실 지금도 이 대답이 잘 이해가 안되긴 한데, 제가 이야기하고자 했던 내용과 일맥상통하는 부분이 있다고 생각되어 적어봤습니다.


말씀하신 논문 같은 경우는 저도 비슷한 경우를 본 적이 있습니다. 제가 몸담고 있는 연구분야는 아니고, 제가 통계석사를 했다보니, 제 지인이 논문을 읽다가 'p-value를 이렇게 해석하는게 맞는거냐?'고 물어봐서 보게 된 경우였어요. 저는 그런 해석은 잘못된 해석이라고 보고, 만약 제가 리뷰하는 페이퍼에 그렇게 해석이 되어 있으면 찝어내겠지만, 사실 새로운 발견이나 contribution이 중요하지, 그런 부분은 마이너한 부분이라 그렇게 적어놓은 논문도 충분히 publish 되는 것은 가능한 것 같습니다. 

 

마지막 부분은 저도 충분히 동의하는 바입니다. 결국 중요한건 내용이지 p-value가 아니니까요.

다시 한 번 좋은 글 감사드립니다. 

WR
2020-10-21 10:50:56

아닙니다. 글에 대한 코멘트는 언제나 환영입니다.

다만 p-value에 대해 말씀하신 부분은 제가 알고 있고, 논문에서 보고, 실제 쓸 때 사용하는 부분과 다르기 때문에 드린 말씀입니다.

 

저는 생명과학 연구자이고 박사학위를 보유하고 있는데, Genome-wide association study (GWAS) 같은 분야는 수만-수십만 명의 유전체에서 single nucleotide polyporphism과 인간의 phenotype의 연관성을 찾는 경우인데 p-value를 significance의 척도로 삼는 경우는 말그대로 일상적이고, 틀렸지만 넘어가는주는 정도가 아니라 가장 기본적인 출발점으로 삼습니다 (물론 effect size도 기본입니다). 통계를 가장 핵심적으로 쓰는 GWAS 계열 학문이 아니더라도 사실 큰 차이는 없긴 하고요.

 

한가지 간단한 사유실험을 해보면,

암환자와 정상인 사이의 유전자 발현 차이를 확인한다고 하고, 여기서 5개의 Differentially expressed genes (DEGs)가 나왔다고 합시다. 

A 유전자 Fold change (FC) = 2.4, p-value = 1.1e-05

B 유전자 Fold change (FC) = 3.9, p-value = 1.1e-04

C 유전자 Fold change (FC) = 1.7, p-value = 1.1e-03

D 유전자 Fold change (FC) = 1.5, p-value = 1.1e-02

E 유전자 Fold change (FC) = 1.9, p-value = 1.1e-01

 

Fold change는 effect size의 역할을 하고 p-value는 significance의 척도로 쓰입니다.

 

threshold alpha를 일반적인 기준인 0.05로 잡으면 유전자 A-D는 significant, E는 non-significant (NS) 입니다. 즉 A-D는 E보다 "더" 유의미하게 변하는 유전자라는 것은 Spurs_CK님도 동의하실 겁니다. 유의하다 vs 유의하지 않다의 Yes or No의 비교는 확실하니까요.

 

근데 분서가가 더 엄격한 기준을 원해서 alpha를 0.01로 바꾸면 이제는 D도 더이상 유의하다고 보지 않게 됩니다. 이제 A-C는 유의하고 D-E는 유의하지 않은데, 이는 A-C가 D보다 "more significant"하다는 뜻입니다. 동일하게  alpha를 0.001, 0.0001로 낮춰감에 따라 A는 B보다, B는 C보다, C는 D, D는 E보다 순차적으로 "p-value 값이 작을 수록 더 유의하다"는 결론에 도달하게 됩니다.

 

이런 사유실험으로도 p-value가 유의함의 정량적 척도가 된다는 증명이 가능합니다. 즉, 본문에서 p-value가 낮을 수록 더 유의하다는 말과 일치하는 거죠.

 

-Log10(p-value) 같은 것은 그냥 보기 편하게 p-value가 작을수록 더 유의하다는 걸 보여주는 방편의 실제 적용예시이며 가끔 보이는게 아니라 정말 정말 정말 많이 사용합니다. 정확히 말씀드리면 mRNA 발현을 비교하는 실험에서 발현차이나는 유전자를 보여주는 논문일 경우 p-value가 제공되지 않는 논문은 없습니다. 실제 "끼친" 영향의 신뢰도를 의미할 뿐 그 영향의 크기를 보여주지 않으니 effect size를 더 중요하게 생각할 뿐, p-value를 통해 유의성의 정량화를 하지 않는 경우도 없다고 보시면 됩니다. 

2020-10-20 21:46:50

킹스는 감독이 수비에 신경을 쓴다고 썼는데도 저 수치가 나온 게 충격적이네요. 선수들의 잦은 부상이 영향을 미쳤을 것 같네요. 스퍼스도 역시 게시판을 달궜던 것처럼 수비력이 총체적 난국.

 

뉴올리언스는 다음 시즌에 수비만 좀 가다듬으면 괜찮을 것 같은데... 가능하겠죠... 

WR
Updated at 2020-10-21 02:21:19

일단 감독이 바뀔테니 한번 기대해봅니다. 페이버스를 못잡으면 더 나빠질수도 있다는게 함정이네요 -_-..

글쓰기
검색 대상
띄어쓰기 시 조건









SERVER HEALTH CHECK: OK