본문 바로가기

전체 글

(37)
데이터 분석1단계: 문제제기 (Ask) - 질문에 대하여 질문의 중요성 지루할 수도 있지만 데이터 분석을 하기 전 원론적인 얘기를 더 길게 해 보겠다. 현업에서의 전문 지식을 축적한 사람은 확실히 같은 데이터를 보더라도 어떤 질문이 필요한지, 어떤 것부터 우선되어야 하는지 등을 다른 사람들에 비해 쉽게 알아낼 수 있다. 그렇기 때문에 처음으로 데이터의 세계에 입문하는 사람들의 경우, 본인이 몸 담고 있는 영역의 지식(도메인 지식)을 활용한 데이터 분석부터 시작할 것을 추천한다. 코딩 실력도 좋지만, 본인의 강점을 더 잘 활용하라는 말이다. 데이터 분석 관련 책을 보면 역시나 이론으로 시작해서 코딩은 뒤에 나온다. 데이터가 아니라 경영학 과목 어딘가에 나올 것 같은 얘기들이 초입에 장황하게 나와있다. 학문적으로 전문성 있는 책처럼 보이기 위함이 아니다. 스킬을 ..
R? 데이터 분석을 위해 선택할 언어 R이란? 국립중앙과학관에서 정의하고 있는 R은 다음과 같다. R은 오픈소스 프로그램으로 통계/데이터 마이닝 및 그래프를 위한 언어이다. R은 주로 연구 및 산업별 응용 프로그램으로 많이 사용되고 있으며, 최근에는 기업들이 많이들 사용하기 시작했다. 특히, 빅데이터 분석을 목적으로 주목을 받고 있으며, 5000개가 넘는 패키지(일종의 애플리케이션)들이 다양한 기능을 지원하고 있으며 수시로 업데이트되고 있다. R의 장점 R의 가장 큰 장점은 오픈소스라는 점이다. 무료로 사용이 가능함에도 불구하고 컴퓨팅 속도와 데이터 처리 능력, 각종 소프트웨어나 클라우드 서비스, API 등과의 연동, 호환성이 좋다. 언어 자체가 직관적이기 때문에 C, C++ 등에서 고배를 맛본 사람들도 쉽게 도전할만하다. 빅데이터를 위한 ..
데이터 분석 1단계: 문제제기 (Ask) - 문제의 유형들 데이터 분석의 문제들: 개인의 호기심이었던지, 직장 상사가 하라고 시켰던지, 아니면 누군가를 위해 해주고 싶어서 시작했을 수도 있다. 어찌 되었든 데이터 분석을 하게 되었으니, 첫 단계부터 밟아 보자. 앞 선 글 '데이터 분석의 6단계'(https://double-d.tistory.com/3)에서 말했듯이 데이터 분석의 첫 단계는 문제제기를 통한 올바른 문제정의인데, 보통 어떤 유형의 문제들이 나오는지 알아보자. 여기서 보여주는 각 유형별 예시는 다른 유형들과 일부 중복이 있을 수 있고, 대략적인 감을 잡기 위함이다. [유형 1] 예측하기 (Making Prediction) 회사의 경영에 있어 미래 사업환경이 어떻게 될지, 지금 하고 있는 사업 아이템이 미래에서는 잘 팔릴지, 어떤 신사업을 준비해야 할지..
데이터 분석의 6 단계 제목만 보고 벌써 지루해졌을지도 모르겠다. 하지만 그냥 그렇구나 정도로 쉽게 훑어보면서 넘어가자. 읽고 나면 이미 여러 번 해 봤던 과정일 수도 있다. 구글에서 정의하고 있는 데이터 분석의 6단계는 다음과 같다. 문제제기 (Ask) 준비 (Prepare) 처리 (Process) 분석 (Analyze) 공유 (Share) 실행 (Act) 이름을 잘 붙여 놓았지만, 결국 문제나 목적이 있었기 때문에 데이터 준비해서 분석했고, 분석 결과를 누군가와 공유한 후에 잘했는지 못했는지 봤다는 얘기다. 여러 웹사이트를 돌아다니다 보면 일부 단계가 합쳐져 있거나 이름이 다를 수 있지만, 결국 큰 흐름에서는 별 차이가 없다. 이제 각 단계에 대해서 추가 설명을 해보자. 1. 문제제기 (Ask) 구글로 시작했으니, 구글에서..
데이터: 가까이 있는 것은 행복만이 아니다 데이터의 세계 엑셀로 2~3줄 이상의 항목을 입력하고, 거기에 어떤 의미가 있는지 살펴 보았다면 이미 데이터의 세계에 입문한 것이다. 그런 의미에서 대부분의 회사원과 사업하는 사람들은 데이터와 관련된 업무를 이미 하고 있고, '데이터 XXX'라는 이름을 붙여도 된다. 데이터 XXX? 빅데이터, 데이터 사이언스 등의 단어는 뉴스를 통해서 몇 년 전부터 계속 나오고 있다. 그럼에도 불구하고 아직도 관련 인력이 부족하다고 하니, 내가 하고 있는 일들은 데이터 관련 일이 아닌가 보다. 그러니 나도 '데이터 XXX'라는 이름은 멀게만 느껴진다. 멀게 느껴지면 이름은 멀게 두어라. 하지만 데이터의 세계에 발을 디디고 있다는 사실은 변함이 없다. 그러니 당신이 발을 딛고 있는 거기가 어디인지 알아보자. 데이터의 역사..