일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- R 배우기
- r
- Data Scientist
- 데이터 사이언티스트
- data engineer
- R 설치
- 데이터 사이언스
- 데이터 구조
- 빅데이터
- 파이썬
- Python
- 데이터 엔지니어링
- data science
- 데이터 엔지니어
- Today
- Total
To be a Data Scientist
#0. R로 시작하기 본문
# R 기본 정보
R은 통계학에서 사용되던 언어 S를 오픈 소스로 구현한 언어이다. 다양한 통계분석과 그래프 작성 등을 위한 프로그래밍 언어인 동시에 다른 소프트웨어를 개발할 수 있는 개발 환경으로의 역할도 할 수 있다. 최근 데이터 사이언스의 발전과 함꼐 R은 굉장히 주목을 받고 있다. R은 오픈소스이며 완전히 무료지만 다른 상용 통계프로그램(SPSS, SAS, Minitab 등)에 비해 성능이 크게 뒤지지 않기 떄문이다. 게다가 활성화되어있는 R 사용자 커뮤니티를 통해서 정보를 얻기 쉬우며, 통계와 그래픽에 관련된 기능 확장, 고유한 언어 내장 프로그램 기능과 내장 통계함수 제공 등 R의 장점은 무궁무진하다.
# R 설치하기
R은 앞서 말했듯이 완전히 무료이고, 인터넷에서 쉽게 다운받을 수 있다. R은 기본(base)시스템과 패키지(package)로 구분된다. 기본 시스템은 R을 작동시키는 시스템이고, 패키지는 분석기법을 의미한다. 패키지는 다 다운받기 보다는, 필요할 때 마다 필요한 프로르램을 다운받는 편이 효율적이다.
설치파일은 CRAN(Comprehensive R Archive Network) 사이트(https://cran.r-project.org/)에서 받을 수 있다.
컴퓨터의 사양에 따라 알맞은 프로그램을 설치하면 된다. 필자는 윈도우를 사용하므로, 윈도우 버전을 설치하였다(Download R for Windows).
여기서 base 혹은 install R for the first time을 클릭한다. 이후 컴퓨터 사양에 맞는(32bit 혹은 64bit) 가장 최신 버전을 다운로드받는다.
** Contrib은 응용분야별 소프트웨어(R 패키지)를 다운로드받을 수 있고, Rtools에는 R 패키지를 만들기 위한 도구를 다운로드 받을 수 있다.
** R 패키지가 사용자들에 의해서 작성되는 만큼, 항상 옳은 것은 아니니 주의가 필요하다.
# R 실행
R을 설치 후, 아이콘을 더블 클릭하면 R이 실행된다.
R console 이라는 윈도우 창이 활성화되며, " > " (R 프롬프트) 라는 기호가 나타난다. 프롬프트 바로 뒤에 명령문을 치고, Enter를 치면, 명령문이 실행된다. 즉, 기본적으로 R은 대화형 처리방식(interative mood)를 따른다. 하지만, 스크립트를 통해서, 일괄처리 방식(batch mood)도 구현할 수 있다.
>> 일괄처리방식 구현하기
1. 내부함수 source( )
우선, 메모장에 실행하고자 하는 명령문들을 입력 후, 이 스크립트를 txt파일로 적당한 폴더에 저장한다. 그런 다음, 함수 source( )에 스트립트 파일의 경로를 명시하여 실행한다. 예를 들어, apple.txt 파일에 스크립트를 작성 후 'C:/Users/User1/Desktop/Example'라는 폴더에 저장했다고 가정하자. 프롬프트 뒤에 source("C:/Users/User1/Desktop/Example") 라고 입력후 Enter를 치면, 스크립트 내의 모든 명령문이 한번에 실행된다. 단, source( )를 실행시키면 스크립트 파일의 내용 및 처리결과가 Console 창에 자동으로 출력되지 않는다. 이는 print( )를 이용해서 처리 결과를 개별적으로 출력하거나, source( )에 'echo=TRUE'라는 옵션을 추가해 그 과정을 console 창에서 볼수 있게끔 하여 해결할 수 있다.
2. R 편집기
R 편집기는 '파일-새로운 스크립트''를 통해서 열 수 있다. R 편집기 창에서는 명령문의 입력과 수정을 간편하게 할 수 있다. 메모장에 입력하듯이 명령문을 다 입력후, 실핼할 때에는 '편집-전부 실행하기'를 클릭해, 스크립트 내의 모든 명령문을 실행시킬 수 있다. 하지만 특정 명령문을 선택하여 실행하고 싶다면, 실행하고 싶은 명령문을 마우스를 이용하여 선택한 후 Ctrl과 R를 동시에 누른다.
** 스크립트에는 프롬프트(>)를 입력하지 않는다.
#R 종료
R을 종료할 떄에는 닫기 버튼을 클릭하거나 q( )을 입력한다. "작업 공간 이미지를 저장 하시겠습니까?"라고 묻는 팝업 창이 뜨고, 이에 저장 여부를 선택하고나면 R은 종료된다.