본문 바로가기

데이터 분석

데이터 분석1단계: 문제제기 (Ask) - 질문에 대하여

질문의 중요성

지루할 수도 있지만 데이터 분석을 하기 전 원론적인 얘기를 더 길게 해 보겠다.

 

현업에서의 전문 지식을 축적한 사람은 확실히 같은 데이터를 보더라도 어떤 질문이 필요한지, 어떤 것부터 우선되어야 하는지 등을 다른 사람들에 비해 쉽게 알아낼 수 있다. 그렇기 때문에 처음으로 데이터의 세계에 입문하는 사람들의 경우, 본인이 몸 담고 있는 영역의 지식(도메인 지식)을 활용한 데이터 분석부터 시작할 것을 추천한다. 코딩 실력도 좋지만, 본인의 강점을 더 잘 활용하라는 말이다. 

 

데이터 분석 관련 책을 보면 역시나 이론으로 시작해서 코딩은 뒤에 나온다. 데이터가 아니라 경영학 과목 어딘가에 나올 것 같은 얘기들이 초입에 장황하게 나와있다. 학문적으로 전문성 있는 책처럼 보이기 위함이 아니다. 스킬을 배우기 전 밑작업이다. 위에서도 설명했지만, 이런 지식들이 없으면 똑같은 데이터를 보았지만 필요한 정보를 뽑아내지 못할 수 있다. 헛다리를 짚어 엉뚱한 말을 하는 사태가 벌어지기도 한다. 따라서 되도록이면 지루하더라도 넘겨버리지 않기를 추천한다. 

 

다시 한 번 강조하지만 어떤 질문을 하느냐에 따라 전체 데이터 분석이 산으로 갈 수도 있다. 따라서 시작 단계부터 많은 관심을 기울여야 한다. 개인적으로도 매번 데이터 분석 업무에 앞서 '질문 목록'을 작성하다. 최종 보고서의 목차 역할을 하는 각 주제 영역을 나누고, 각각에 대한 질문 목록을 작성하여 필요한 단계를 분석하면 더 체계적이고 빠지는 부분없이 입체적인 결과를 얻기 쉬워진다.

 

내부용 질문과 외부용 질문 

위에서 말한 '질문 목록'은 데이터 분석의 초안을 잡기 위한 질문에 대한 설명이다. 하지만 현실에서의 데이터 분석은 대부분 전사적인 과제이거나, 외부 업체로부터의 의뢰로 시작된다. 즉, 업무 파악도 제대로 안되어 있을 수 있고, 데이터 자체도 생전 처음보는 데이터일 수도 있다. 가끔은 어디서부터 손을 대야 할지 감조차 오지 않을 수 있다. 이럴 때에는 초안으로 작성된 '질문 목록'에 '외부용 질문'을 추가해야 한다. 하지만 본질적으로는 분석을 위한 정확한 대상 파악이라는 틀에서는 같은 질문으로 봐도 무방하다. 

 

  내부용 질문 외부용 질문
대상 팀 내부 또는 본인 협업팀 또는 분석의뢰 주체
목적 분석 업무의 구조화, 개요 작성용  협업팀으로부터 구체적인 내용 확인용

유관부서나 의뢰 주체와의 협업이 필요하다

 

질문은 어떻게 해야 하는가? 어떤 질문을 만들어야 하는가?

 

SMART

질문을 하기 전에 다시 한 번 점검해보자. 누구하고 얘기를 하고 있는지, 관련 분야를 고려 시, 내가 하려는 질문이 SMART한 질문인지 등을 생각해보자. SMART한 질문은 어디선가 많이 들어봤을 것이다. SMART는 목표를 설정하는 가장 널리 알려진 방법이다. 구체적이고(Specific), 측정가능하며(Measurable), 의뢰 가능하며(Assignable), 현실적이며(Realistic), 시한을 정한(Time-limited) 목표를 세워야 한다는 건데, 질문을 위한 SMART는 조금 다르다. 

 

  • Specific (구체적인 질문): 단순하며, 핵심을 찌르는 한 두가지 정도에 초점을 맞춘 구체적인 질문
  • Measurable(측정 가능한 질문): 정량적이고 측정 및 평가가 가능한 답을 구하는 질문
  • Action-Oriented(행동지향적인 질문): 특정한 변화를 의도하고, 구체적인 실행을 유도하는 질문
  • Relevant (연관성이 있는 질문): 해결하고자 하는 문제와 연관성이 깊은 질문
  • Time-Bound (시점을 특정할 수 있는 질문): 분석하고자 하는 주제관련 데이터의 기간을 특정할 수 있는 질문

질문 하나하나가 각 항목들 전체를 만족하기는 쉽지 않지만, '질문 목록'의 질문들이 위의 SMART를 골고루 고려하였다면 분석작업 시작을 위한 방향은 잘 잡혔다고 보면된다.