본문 바로가기

분류 전체보기

(34)
[R프로그래밍] 행렬 구조 Ⅱ(apply, 행추가, 열추가, 차원 확인 등) 데이터 구조(벡터, 행렬, 리스트, 데이터프레임) 특집 - 행렬 두번째 apply 함수는 평균이나 분산 등을 계산할 때 각 행이나 열에 일괄적으로 적용하는 함수이다. apply(행렬 또는 배열 이름, dimcode(margin), function(적용할 함수)) 의 형태로 사용한다. ① dimcode는 차원의 수를 말하며, 1 또는 2만 입력할 수 있다. ② dimcode가 1일 때는 행(row), 2일 때는 열(column)에 적용된다. ③ function은 적용할 계산을 넣으면 된다. mean(평균), sum(합계) 등이 해당된다. # apply 함수 m 행렬은 행이나 열을 추가 또는 삭제할 수 없다. 행렬도 벡터이므로 생성할 때부터 고정된 길이와 차원을 가지고 있기 때문이다...
[R프로그래밍] 행렬 구조 Ⅰ(matrix, 선형대수연산, 인덱싱, 필터링) 데이터 구조(벡터, 행렬, 리스트, 데이터프레임) 특집 - 행렬 첫번째 행렬은 모든 원소가 같은 데이터 형태를 갖는 2차원 데이터 구조이다. 즉 벡터(Vector)의 2차원 형태이다. 행렬은 행(row)과 열(column)이 존재하며, 열의 개수나 행의 개수를 지정하지 않으면 열을 우선으로 할당하도록 설정되어있다. ※ 행렬과 배열의 관계 1. 배열? 일정한 규칙에 따라 몇몇 요소가 나열되어 있는 데이터 집합이다. 배열은 차원을 가진다. 2. 행렬과 배열의 관계 ① 행렬은 행의 개수와 열의 개수라는 두 가지 속성을 추가로 갖는 벡터이다. ② 행렬은 '배열'의 한 종류이며, 배열의 특수한 형태라고 볼 수 있다. 정확히 말해 2차원 배열을 행렬이라고 한다. 배열은 2차원 이상의 속성을 가질 수 있..
[R프로그래밍] 벡터 구조 Ⅲ(필터링, subset, which, ifelse 삼항연산, names) 데이터 구조(벡터, 행렬, 리스트, 데이터프레임) 특집 - 벡터 세번째 필터링이란 특정한 '조건'을 만족하는 원소들을 추출하는 작업이다. 전처리에서 많이 사용하는데 보통 전처리에서는 패키지를 많이 사용하지만 R기본 내장함수들을 살펴보겠다. 크게 세 가지 방법이 있다. 1) 인덱싱 방법을 이용한 필터링 2) subset( ) 함수를 이용한 필터링 3) which( ) 함수를 이용한 필터링 첫 번째, ①인덱싱 [ ] 괄호를 통한 필터링 # 인덱싱 방법을 이용한 필터링 var 99] 인덱싱 방법을 이용한 필터링은 행렬(Matrix), 리스트(List), 데이터프레임(Data.frame)에도 똑같이 적용된다. 단, 인덱싱 방법을 이용한 필터링은 NA가 포함되어있다면 NA는 필터링하지 못하고 무조건..
[R프로그래밍] 벡터 구조 Ⅱ(seq, rep, all, any, NA, NULL) 데이터 구조(벡터, 행렬, 리스트, 데이터프레임) 특집 - 벡터 두번째 seq() 연산자는 콜론(:)을 일반화한 것이다. 산술연산을 통해 순서를 만드는 원리이다. # 벡터 seq() 연산 seq(from=12, to=30, by=3) # 12부터 30까지 간격3으로 데이터 생성 seq(12, 30, 3) # from, to, by 생략가능 seq(from=1, to=100, length=10) # 1부터 100까지 10개 데이터 생성 seq(1, 100, length=10) # length는 생략X - seq( )의 from에는 시작값, to에는 끝값을 입력한다. - by옵션에 3을 입력하면 시작값부터 끝값까지 간격3으로 생성된다. - length옵션에 10을 입력하면 시작값..
[R프로그래밍] 벡터 구조 Ⅰ(인덱싱, length, 재사용, 산술 및 콜론연산) 데이터 구조(벡터, 행렬, 리스트, 데이터프레임) 특집 - 벡터 첫번째 벡터는 모든 원소가 같은 데이터 속성을 갖는 1차원 데이터 구조이다. 행렬은 matrix, 리스트는 list, 데이터프레임은 data.frame으로 변수를 선언할 때 데이터 구조를 컴퓨터에게 알려주어야 하지만, 벡터는 별도로 알려주지 않아도 벡터로 인식한다. 벡터를 생성할 때는 값을 바로 넣어주면 되고, 여러 개의 값을 넣어줄 때는 c( ) 연결함수를 통해 생성할 수 있다. # 벡터 선언 x 벡터 안에 값이 여러 개 일때 특정 위치에 있는 값이 무엇인지 확인해야 할 경우에 사용한다. 연산자 [ ]를 이용한다. 다른 프로그래밍 언어는 순서를 셀 때 0부터 세지만 R은 1부터 순서를 매긴다. # 벡터 인덱싱 x 벡터의 크기는..
[ADsP 자격증] 1-11. 빅데이터 그리고 데이터사이언스의 미래 제 1과목 데이터 이해 / 3.가치 창조를 위한 데이터사이언스와 전략인사이트 / 3-3.빅데이터 그리고 데이터사이언스의 미래 - 2011년 기준 디지털 정보량 1.8 제타 바이트 2020년 40 제타바이트에 도달할 것으로 전망하고 있다. - 선거예측, 비용절감, 시간절약, 매출증대, 고객서비스 향상, 신규 비즈니스창출, 내부 의사결정 지원, 인공지능, 추천시스템 등 상당한 가치 발휘 1) 내외부 환경이 급변할 때일수록 변화의 물결을 잘 읽어야 하며 예측하지 못했던 전환이나 위기에 빨리 적응할 수 있는 능력이 필요하다. 2) 가치 패러다임 : 경제와 산업근저에는 가양한 가치 원천이 존재하며, 무작위로 작용하는 것이 아니라 특정기간 지..
[ADsP 자격증] 1-10. 전략인사이트 도출을 위한 필요역량(데이터과학) 제 1과목 데이터 이해 / 3.가치 창조를 위한 데이터사이언스와 전략인사이트 / 3-2.전략인사이트 도출을 위한 필요역량 의미 - 데이터 사이언스란 데이터로부터 의미 있는 정보를 추출해내는 학문이다. - 통계학이 정형화된 실험 데이터를 분석 대상으로 하는 것에 비해, 데이터 사이언스는 정형 또는 비정형을 막론하고 다양한 유형의 데이터를 대상으로 총체적 접근법을 사용한다. - 데이터마이닝은 주로 분석에 초점되나 데이터 사이언스는 분석뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지 모두 포괄하는 개념이다. - 데이터공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당 분야의 전문 지식을 종합한 학문으로 정의한다. 역할 - 전략적 통찰을 추구하고 비즈니..
[ADsP 자격증] 1-9. 빅데이터분석과 전략 인사이트 제 1과목 데이터 이해 / 3.가치 창조를 위한 데이터 사이언스와 전략 인사이트 / 3-1.빅데이터분석과 전략 인사이트 " 초기 빅데이터가 마치 흥행 보증수표처럼 떠오른 시기에는 보고서에 빅데이터라는 단어만 붙으면 내용이나 가치와는 상관없이 무사 통과되기까지 했다. 그러나 빅데이터 분석에 마법은 없다." (이지영, 2013) 빅데이터 회의론이 갖는 문제는 실제 빅데이터 분석에서 찾을 수 있는 수많은 가치들을 제대로 발굴해 보기도 전에 그 활용 자체를 사전에 차단해 버릴 수 있음 - 분석기반 경영이 도입되지 못하는 이유 1) 기존 관행을 그냥 따를 뿐 중요한 시도를 하지 않는다. 2) 경영진의 의사결정이 ..
[ADsP 자격증] 1-8. 미래의 빅데이터 제 1과목 데이터 이해 / 2.데이터의 가치와 미래 / 2-5.미래의 빅데이터 빅데이터 활용에 필요한 3요소 데이터 기술 인력 모든 것의 데이터화(Datafication) - 현재 사물인터넷(IOT, Internet of things) 시대로 진입 중에 있다. 스마트폰 도입 이후 스마트 태블릿 등 단말부분에서 계속되는 혁신은 웨어러블(Wearble) 단말 시장으로 확산 중이다. 이러한 단말들을 통해 대화 기록, 인터넷 방문 정보, 전자책 독서 패턴, 음악 청취 기록 등이 저장되고 있다. CCTV를 통해서는 훨씬 더 많은 정보가 담긴 영상이 기록되고 있으며 사물인터넷 시대가 되면 훨씬 더 많은 정보가 끊임없이 생산ㆍ공유 될 것이다. - IBM, 구글, 아마존, 페이스북, 애플 등의 기업이 각..
[ADsP 자격증] 1-7. 빅데이터 시대 위기요인과 통제방안 제 1과목 데이터 이해 / 2.데이터의 가치와 미래 / 2-4.위기요인과 통제방안 빅데이터 시대의 위기 요인 ① 사생활 침해 ② 책임 원칙 훼손 ③ 데이터 오용 - 구글은 이미 지난 2010년에 서비스 이용자가 1시간 뒤에 어떤 일을 할지 87% 정확도로 예측할 수 있는 데이터와 신뢰도를 확보 (일명 빅브라더 문제) 예) 여행 사실을 트윗한 사람의 집을 강도가 노리는 고전적 사례도 발생(익명화(anonymization) 기술 발전 필요) ※ 빅 브라더 ? 사회학적 통찰과 풍자로 유명한 영국의 소설가 조지 오웰(George Orwell, 1903∼1950)의 소설 《1984년》에서 비롯된 용어이다. 긍정적 의미로는 선의 목적으로 사회를 돌보는 보호적 감시, 부정적 의미로는 음모론에 입각한 ..