본문 바로가기

R

R? 데이터 분석을 위해 선택할 언어

프로그래밍 언어 R

 

R이란?

 

국립중앙과학관에서 정의하고 있는 R은 다음과 같다. 

 

R은 오픈소스 프로그램으로 통계/데이터 마이닝 및 그래프를 위한 언어이다. R은 주로 연구 및 산업별 응용 프로그램으로 많이 사용되고 있으며, 최근에는 기업들이 많이들 사용하기 시작했다. 특히, 빅데이터 분석을 목적으로 주목을 받고 있으며, 5000개가 넘는 패키지(일종의 애플리케이션)들이 다양한 기능을 지원하고 있으며 수시로 업데이트되고 있다. 

 

R의 장점

R의 가장 큰 장점은 오픈소스라는 점이다. 무료로 사용이 가능함에도 불구하고 컴퓨팅 속도와 데이터 처리 능력, 각종 소프트웨어나 클라우드 서비스, API 등과의 연동, 호환성이 좋다. 언어 자체가 직관적이기 때문에 C, C++ 등에서 고배를 맛본 사람들도 쉽게 도전할만하다. 

 

빅데이터를 위한 언어로 R보다는 파이썬을 추천하는 사람들이 많다. 텐서플로우 등 확장 가능성을 염두에 두고, 아예 프로그래밍 언어에 대한 지식이 전무하다면, 파이썬부터 시작하는게 맞을 수도 있다. 그리고 파이썬의 난이도가 더 낮아 R을 시작하기 전에 파이썬부터 시작하는 사람도 있다. 경험 상 순서는 개인의 선호도에 따라 다르다. 하지만 파이썬, R, Java, Hadoop, Apache 등을 다룰 수 있고, SQL까지 한다면 전공이나 경력에 상관없이 데이터 관련 일을 할 준비가 된 것이다.

 

Java는 하기 싫지만 Hadoop을 위해서는 Java가 필요하다. Java API를 이용한 맵리듀스가 유용하기 때문이다

 

 

어쨌든 R의 Shiny App만으로도 충분한 시각화가 가능하고, 빅테이터를 위한 Hadoop, Spark 등의 프레임워크* 연결도 가능하며, AWS (Amazon Web Service), Google Cloud, Microsoft Azure 등 클라우드 서비스 연동도 가능하다. reticulate을 통해 R과의 파이썬을 동시에 사용할 수도 있다.

 

*프레임워크: 개발 과정을 보다 빠르고 편리하게 도와주는 기능을 담은 틀

 

우선 R부터 천천히 시작해서 데이터 분석의 모든 영역을 훑어보기로 하자.

 

R설치파일 다운로드

R은 오픈소스이므로 R Cran사이트(https://cran.r-project.org/)에서 맥 또는 윈도우용을 선택 다운로드한 후 설치하면 된다. R의 공식 사이트(https://www.r-project.org/)에서 'CRAN'을 선택한 후, 본인이 있는 국가의 Mirror를 선택하면 Cran 사이트가 나온다. 

 

1. 운영체제에 맞는 링크를 선택

 

 

2. 'install R for the first time'을 클릭한다.

 

3. 'Download R-X.X.X for ~'를 클릭하면 설치 파일이 다운로드된다.

 

R설치 및 R Gui

설치 파일을 실행시키면 언어 및 설치할 폴더 등을 선택하는 과정을 거친다. 설치가 완료된 후에 R을 실행시키면 R Gui가 실행된다. 

 

R Gui를 보면 윈도우 메모장 같이 생긴 Console 화면만 보이기 때문에 적잖이 당황스러울 것이다. 그래서 우리는 통합 개발환경(IDE, Integrated Development Environment)을 제공하는 R Studio를 추가로 설치해야 한다. 

 

R Studio 설치

1. R Studio 공식 사이트(https://www.rstudio.com/)에서 'Product'를 선택하면 여러 제품들 중에서 'R Studio'를 선택한다.

 

 

 

2. R Studio Desktop을 클릭한다. 공짜로 사용할 수 있는 'Open Source Edition'을 선택해도 기능에 제한이 없으므로 굳이 돈을 내면서 'RStudio Desktop Pro'를 선택할 필요는 없다. 

 

운영체제에 맞는 설치 파일이 다운로드되면, 실행 후 적절히 설치한다.