본문 바로가기

SQL 기초

SQL 처음으로 배우기 - 마무리

SQL 쿼리에서 필요한 기본 함수들은 이제 다 배워봤다. 커쇼의 이름이 나온 김에 재미로 한 번 쿼리를 만들어보자. 

추억의 다저스 3인방

클레이튼 커쇼의 이름을 보니, 류현진이 LA다저스에 데뷔했었던 2013년이 생각난다. 당시 다저스에는 세 명의 선발투수진이 있었는데, 국내 팬들 사이에서는 손오공(커쇼), 사오정(그레인키), 저팔계(류현진)에 빗대어졌었다.

출처: 나무위키

 

지난 포스팅에서 (SQL 처음으로 배우기 - JOIN) 클레이튼 커쇼가 2016년에 MLB 최고의 연봉을 받는 선수임을 확인했다. 2013년도에 국내 팬들에게도 잘 알려진 다저스 3인방의 연봉이 어떻게 변해왔는지 알아보자.

 

Lahman Baseball Database 연봉 

잭 그레인키(Zack Greinke)의 연봉은 아래의 쿼리를 통해 확인할 수 있다.

SELECT salaries.yearID
	, salaries.playerID 
	, salaries.salary
	, people.nameFirst
	, people.nameLast
FROM salaries INNER JOIN people ON salaries.playerID = people.playerID 
WHERE nameLast = 'Greinke'
ORDER BY yearID DESC;

쿼리를 돌리기 전에, 잭 그레인키(Zack Greinke)의 선수 경력을 확인해 보고, 쿼리의 결괏값과 비교해 보자. ERA, WHIP 등의 야구 용어는 생략하고, 쉽게 승패 위주로 기술해 보겠다.

  • 2002년에 캔자스시티 로열스의 마이너리스 선수로 데뷔하였다.
  • 그곳에서의 좋은 성적을 바탕으로 2004년 스무살의 나이로 메이저리그에 데뷔하였다. 첫해의 성적은 나쁘지 않았다.
  • 2005년 5승 17패의 성적을 보이며 힘든 시기를 거친다.
  • 대인기피증, 사회불안장애 등으로 2006년은 한 해를 통째로 쉬었다고 한다.
  • 다행히 정신과 치료 등을 거치고 2007년 복귀하여 7승 7패를 기록한다.
  • 2008년에는 13승10패를 기록하며 구단의 기대를 받게 된다.
  • 2009에는 절정의 기량을 보인다. 그 해에 16승 8패를 기록하며 사이영상하였다. 이후로는 구속은 감소하지만, 그에 맞춰 구질을 다양화한 투수로 평가받게 된다.
  • 2010년도에는 10승 14패의 조금 떨어진 실적을 보이다가 밀워키 브루어스로 이적한다. 당시 26세였다.
  • 2011년도는 부상으로 시작했으나, 후반부에는 좋은 기량을 보여 15승 6패로 마무리한다.
  • 2012년도에는 구원투수로 활동하고, 결국 LA 에인절스로 트레이드 된다.
  • 2013년도에는 LA 다저스로 이적하였고, 비슷한 시기에 온 류현진과 같은 팀이 된다. 정규시즌 성적은 15승 4패로 좋은 성적을 보인다. 또한 내셔널리그의 투수부문 실버 슬러거 상을 수상한다.
  • 2014년에는 17승 8패, 200이닝 이상을 소화한다. 시즌 종료 후에 골드 글러브를 수상하여 사이영상, 실버 슬러거, 골드 글러브 상을 받은 몇 안 되는 투수가 되었다.
  • 2015년에는 19승 3패를 기록하며, 여러 방면에서 2009년의 기록을 넘어선다. 45 2/3 이닝 무실점 행진을 하고, 선수 생활 중 최다승을 기록하였으며, 홈런도 2개를 쳤다. 이 해에 또 골드 글러브 상을 받으며 2년 연속 수상하게 된다.
  • 시즌 후에 애리조나 다이아몬드백스로 이적하며 2016년을 맞이한다. 새 시즌 실적은 만족스럽지 못했으나, 또 글 든 글러브 상을 수상하며 3 연속 수상의 기염을 토한다.
  • (이후의 기록은 생략)

나이가 제일 많으니 길다.

 

선수의 경력을 기술한 Narrative와 쿼리를 돌려서 얻은 Numbers가 들어맞는 게 보이는가.

위의 쿼리에서 잭 그레인키의 Last Name (Greinke) 대신에 클레이튼 커쇼의 Last Name (Kershaw)로 바꿔 넣으면 커쇼의 연봉 변화를 볼 수 있다.

커쇼의 경력도 간단히 살펴보자.

  • 2006년도 LA다저스의 마이너리그로 시작하였다. 2008년 시즌 중에 메이저리그로 올라간다. 다만, 그 해에는 5승 5패의 성적을 보인다. 당시에 재기한 박찬호와 선발 경쟁을 하다가 결국 박찬호를 밀어냈었다.
  • 2009년도는 8승, 2010년도는 13승으로 조금씩 나아졌다. 2010년에는 결혼을 했다.
  • 2011년에는 33경기 동안 21승 5패를 기록하며 사이영 상을 받는다.
  • 2012년은 14승 9패로 다소 아쉬웠으며 여전히 LA다저스 제1선발로 잘 쓰임 받는다.
  • 2013년 시즌에서는 류현진과 바로 옆 라커를 쓰게 되고, 국내에 많이 알려지게 된다. 커쇼- 그레인키- 류현진 선발 라인이 형성된다. 시즌 성적은 16승 9패. 그 해에 두 번째 사이영 상을 수상하게 된다.
  • 2014년 성적은 21승 3패를 기록. 2014년 1월에 7년 2억천5백만 불로 다저스와 재계약한다. 시즌 종료 후, 26살의 나이로 3회 사이영 상 수상의 기염을 토한다. 정규시즌 MVP로 선정된다.
  • 역대 투수 최고 계약액인 연봉 3257만 달러가 시작되는 시즌인 점, 득녀하여 집에 아이가 생긴 점 등으로 부진이 예상되었으나, 2015년은 16승 7패 기록하는 등 좋은 성적을 보인다. 사이영 상 수상은 못했으나, 5년 연속 투표순위 3위 이내에 들어간다.
  • 2016년에 최고의 기량을 보여주었으나, 시즌 중간 부상으로 마쳤다. 최종 성적은 12승 4패.
  • (이후 기록은 생략)

2014년 숫자는 도데체 무엇인지..

 

좀 길어지긴 했지만, 보는 김에 류현진의 경력도 보자.

  • 2006년 한화이글스 데뷔 후, 26살의 나이로 2013년에 LA다저스에 입단한다.
  • 2013년 커쇼, 그레인키와 같이 선발 라인으로 있으면서 14승 8패를 기록한다. 참고로 둘은 이미 사이영 상 수상자였다. 하지만 류현진도 전문가들의 기대를 넘는 성적을 보여줬다.
  • 2014년 14승 7패를 기록하며 3선 발의 역할을 잘 소화했다.
  • 2015년에는 어깨 통증으로 인해 등판이 계속 지연됐다. 결국 왼쪽 어깨 관절경 수술을 받고 시즌을 쉰다.
  • 2016년에 복귀전을 치르나, 다시 부상명단에 오른다.
  • (이후 2020년에 토론토 블루제이스로 이적한다)

다저스와의 6년 계약으로 2016년에는 다행히 돈을 받은 듯 한데, 2015도는?

위의 표를 보면, 새삼 커쇼와 그레인키 대비 류현진이 초라하게 느껴진다. 물론 잘 던졌지만, 다른 둘이 너무 대단한 선수였다. 하지만, 현재가 중요하지 않을까.

2022년 연봉은 어떻게 되었을까?

실제 투수에게서 중요한 지표들을 언급하지 않았지만, 대략적으로 흐름은 잡았으리라 본다.

 결론적으로 2022년에는 세 선수가 어떻게 되었을까? 2013년 기준으로는 그레인키 → 커쇼 → 류현진 순의 연봉이었으나, 2022년에는 류현진이 처음으로 그레인키와 커쇼의 연봉을 넘어 2천만 불을 기록하였다. 그레인키는 1년 13백만 불, 켜쇼는 1년 17백만 불이다. 많은 생각이 든다.

 

결론

 여하튼 Lahman database는 SQL 소개를 위해 사용해 봤으나, 내 전문 분야가 아니기에 SQL을 위한 포스팅은 더 이상하지 않으려 한다. 관심분야가 아니니 다른 숫자들에 관심이 생기지 않는다. 선수 경력을 기술하기에도 부끄러울 정도로 미천한 지식이니... 관심이 있어야 더 공부할 생각이 들고, 인사이트에 대한 갈급함도 생긴다.

하지만, 마지막으로 하나 더 언급할 점이 있다.

 위와 같이 데이터를 뽑긴 했는데, 눈에 잘 안 들어온다. SQL의 한계점이 바로 이것이다. 시각화를 위해서는 다른 툴의 도움을 받아야 한다. 어차피 만들어진 목적이 다르기 때문에 비교하기 어렵지만, 이런 점에서 R을 사용하는 편이 낫다. R에서는 자체 시각화 함수를 제공하기 때문에 추출된 데이터를 바로 시각화하여 그래프로 보여줄 수 있다.