R이나 파이썬(Python)을 이용한 데이터분석의 장점은 오픈소스라는 점이다.
오픈소스는 세계의 여러 개발자들이 알고리즘을 개발코드로 만들어서 패키지로 등록해 놓으면
사용자들이 직접 코딩을 하지 않고도 다양한 알고리즘 패키지를 가져다 쓸 수 있다.
통계분석 패키지도 설치할 수 있고, 그래프를 그리는 패키지도 설치할 수 있고, 머신러닝 패키지도 다운받아서 쓸 수 있다.
< 패키지 리스트 확인 >
R에는 수 천개의 패키지가 등록되어있고, 전체 패키지 리스트는 홈페이지(https://cran.r-project.org/)에서 확인할 수 있다.
< 패키지 설치 >
패키지 설치는 install.packages("패키지명") 을 입력하면 된다.
인터넷에서 다운 받는 것이므로, 컴퓨터가 인터넷에 연결된 상태여야 한다.
패키지를 설치하면서 CRAN 미러사이트 지정하라는 메시지가 뜨면 Korea(seoul1), Korea(seoul2), Korea(Ulsan) 중에서 가까운 지역 하나를 선택하여 설치하면 된다.
여러 개의 패키지를 한 번에 설치하고 싶으면
install.packages(c("패키지1", "패키지2")) 와 같이 할 수도 있다.
예시로 설치하는 ggploot2는 데이터 시각화에 많이 사용하는 패키지이다.
# ggplot2 packages
install.packages("ggplot2")
< 패키지 구동 >
한 번 설치한 패키지는 다시 설치하지 않아도 되지만,
R을 새로 시작할 때마다 패키지를 사용할 떄는 실행을 시켜줘야 쓸 수 있다.
library(패키지명) 또는 require(패키지명)을 사용하여 실행한다.
library(ggplot2)
< 설치된 패키지 목록 확인 >
설치된 패키지 목록은 installed.packages() 명령어로 확인할 수 있다.
R을 설치할 때 기본으로 설치된 내장 패키지들과 추가적으로 설치한 패키지들 목록을 한 번에 볼 수 있다.
installed.packages()
< 패키지 업데이트 및 삭제 코드 >
1) 패키지도 종종 추가 개발 되어 업데이트가 필요한 경우도 있는데 다음과 같은 코드를 사용하면 업데이트 할 수 있다.
- 설치된 모든 패키지를 한 번에 업데이트 할 때는 update.packages()
- 특정 패키지를 업데이트 할 때 update.packaged("패키지명")
2) 설치된 패키지를 삭제할 때는 remove.packages("패키지명")을 사용한다.
패키지 전체를 한 번에 업데이트를 하는 것은 개인적으로 비추한다.
※ 간혹 기존에 분석하던 코드가 업데이트로 인해 돌아가지 않는 경우가 생길 수 있으니 주의 할 것.
'R프로그래밍' 카테고리의 다른 글
[R프로그래밍] 팩터(Factor) 변수 (0) | 2020.03.13 |
---|---|
[R프로그래밍] 워킹디렉토리 설정, 데이터 불러오기(TXT, CSV file) (0) | 2020.03.12 |
[R프로그래밍] 데이터 프레임 필터링, 결측치(NA와 NULL) (0) | 2020.03.10 |
[R프로그래밍] 데이터 프레임 핸들링 (0) | 2020.03.09 |
[R프로그래밍] 데이터 구조(벡터, 행렬, 리스트, 데이터 프레임) (0) | 2020.03.06 |