본문 바로가기

데이터 기본

(11)
오픈 데이터 소스 오픈 데이터 (Open Data) Second 또는 Third-Party 데이터의 가격은 비싸다. 수집하는데 많은 노력이 들뿐만 아니라, 데이터 검수하는데도 적지 않은 주의와 자원이 필요하기 때문이다. 이러한 이유로 일반인들은 데이터 구매에 대한 생각조차 하기 쉽지 않다. 다행히 정부와 학계, 단체에서 제공하는 양질의 오픈 데이터를 무료로 구할 수 있다. 오픈 데이터는 제공하는 주체에 따라 크게 3가지 분류가 있다. 첫째, 정부 주도 공공 데이터이다. 둘째, 기타 범정부 기관 및 학계, 단체 등에서 제공하는 무료 데이터도 있다. 셋째, 사기업에서 제공하는 데이터이다. 대부분의 빅테크 기업이 제공하고 있다. 첫째, 정부 주도 공공 데이터 우리나라 정부도 데이터의 중요성을 강조하면서 몇 년 전부터 공공데이터..
데이터의 삶: 탄생과 죽음 어디 가서 데이터에 대한 공부 좀 했구나라는 소리를 듣기 위해 필요한 정보를 공유한다. 데이터의 생애 주기(Data Life Cycle) 6단계가 있다. 단계는 설명하는 방법이나 기관에 따라 달라질 수 있으나, 큰 틀에서는 비슷하다. 아래 데이터 생애 6단계는 구글 데이터 애널리틱스 과정에서 소개하고 있는 내용이다. 1. 계획(Plan) 데이터 수집 활동 전에 어떤 데이터가 필요하고, 어떻게 수집할 것이며, 수집된 데이터는 어떻게 사용할 것인지, 각 단계에서 누가 관여하고 관리하게 될지 등을 미리 계획한다. 당연한 얘기이지만, 고민 없이 시작된 데이터 수집은 불필요한 업무의 반복을 초래할 수 있다. 또한, 어차피 각 단계를 지나면서 현실적이고 세부적인 문제들에 부딪혀 처음에 계획했던 바와 달라질지언정 계..
빅데이터란? 잠시 쉬어가는(?) 의미에서 우리가 다뤄야 할 데이터에 대해 알아보자. 빅데이터? 온갖 미디어에서 '빅데이터'가 끊이지 않고 나온다. 세상이 정말 그 정도로 데이터가 중요한 세상이 되었을 수도 있다. 아니면 가끔이나마 유튜브에서 검색했던 흔적이 알고리즘의 간택을 받아 튀어나오는 것일 수도 있다. 만약 둘 다라면 딱 한걸음만 옮겨보자. 눈에 자꾸 보이는 김에 그 잘난 세상의 데이터에 발 하나라도 걸쳐보자. 빅데이터 얘기는 계속 나오고, 추천 영상도 나오는데 아직도 뭐가 뭔지 모르겠다. 회사에서 다루고 있는 데이터도 모니터를 부숴버리고 싶을 만큼 PC를 버벅거리게 하는데 혹시 이게 빅데이터인가. 웹을 돌아다니다 보면 빅데이터의 특징을 3V로 설명하거나, 4V, 5V를 늘어 놓는 사람도 있다. Volume (..