본문 바로가기

전체 글

(34)
[R프로그래밍] 데이터 구조(벡터, 행렬, 리스트, 데이터 프레임) 데이터 값 하나하나는 정수형, 실수형, 문자형, 논리값 등의 타입(type)을 갖는다. 그리고 한개의 값만 가지는 변수의 데이터 구조를 스칼라(scala)라고 한다. 하지만 데이터 값이 하나인 변수만 있다면 데이터 분석을 할 필요가 없다. 즉, 데이터는 늘 여러개의 값이 모여 구조를 이루는데 R에서는 데이터의 구조가 대표적으로 4가지 있다. 벡터(vector)는 모든 원소가 같은 데이터 타입을 갖는 1차원 데이터 구조이다. 원칙상 변수는 한개의 스칼라 값만 가질 수 있는데, 스칼라를 제외한 나머지 데이터 구조처럼 여러개의 값을 입력할 때는 연결함수(combine) c( ) 를 사용해 묶어준다. # vector x
[R프로그래밍] 변수와 데이터 타입, 주석처리 변수(Variable)란, 데이터를 담을 수 있는 공간이다. 데이터(Data)는 수치형(정수형, 실수형), 문자형, 논리형(참 혹은 거짓) 등이 있는데 이런 데이터를 변수에 담는다고 생각하면 된다. 1) 정수(integer)는 -3, 0, 2, 9와 같은 값이고 2) 실수(real number)는 0.05, 1.39 등 소수점이 있는 임의의 수이다. 3) 문자열(characters)은 "starbucks", "정해인"과 같이 문자들로 구성된다. 4) 논리값(Boolean)은 논리적인 참이나 거짓을 말하는데 TRUE 또는 T 그리고 FALSE 또는 F로 표시된다. 그리고 모든 변수는 이름, 즉 변수명을 가진다. 변수명은 알파벳, 숫자, '_', '.' 등을 조합하여 만들..
R Studio 설치 및 개발환경 세팅 개인용 컴퓨터에 R이라는 언어는 기본으로 설치되어 있지 않으므로 R을 설치 해주어야 한다. R은 오픈소스이므로 상용 SW인 SPSS나 SAS같은 데이터분석 패키지와 달리 무료로 설치 할 수 있다. R을 설치 한뒤에 바로 R을 사용할 수 있지만, 좀 더 편리하게 사용하기 위해서 R Studio를 쓰는 것이 일반적이다. (R studio를 쓰기 위해서는 먼저 R을 설치 후 R studio를 설치해야한다.) R 설치를 위해 우선 공식 홈페이지(https://www.r-project.org/)에 입장한다. Download의 CRAN을 클릭하면 R Mirror 사이트 들을 볼 수 있다. 그 중에서 Korea 를 찾아서 한군데 선택한다. 그리고 본인 OS에 맞는 설치 파일을 다운로드 한다. 설치 파..
빅데이터와 프로그래밍 현대 사회를 살아가는 우리에게 무엇이 제일 중요할까? 아마도 돈과 시간으로부터의 자유일 것이다. 돈과 시간 중에 하나를 고르라면 단연 우리는 돈에 집중해야한다. 시간의 자유는 물질적 풍요로움에서 비롯되기 때문이다. 돈의 여유는 원하지 않는 일을 하지 않는 삶을 영위할 수 있다. 그동안 여러 자리에서 빅데이터를 소개할 때 여러 거창한 표현을 사용했지만 기업 그리고 사람들이 빅데이터를 주목하는 이유는 바로 '돈'이 되기 때문이라고 소개하고 싶다. 빅데이터를 통해 우리는 사람들이 원하는 게 무엇인지 알 수 있고(빅데이터 마케팅), 하기 싫은 일을 대신 시킬 수 있으며(인공지능), 미래를 예측해 돈을 벌어주기도 한다(주가예측, 상권분석 등). 그리고 ..