본문 바로가기

데이터분석준전문가(ADsP)

(12)
[ADsP 자격증] 1-11. 빅데이터 그리고 데이터사이언스의 미래 제 1과목 데이터 이해 / 3.가치 창조를 위한 데이터사이언스와 전략인사이트 / 3-3.빅데이터 그리고 데이터사이언스의 미래 - 2011년 기준 디지털 정보량 1.8 제타 바이트 2020년 40 제타바이트에 도달할 것으로 전망하고 있다. - 선거예측, 비용절감, 시간절약, 매출증대, 고객서비스 향상, 신규 비즈니스창출, 내부 의사결정 지원, 인공지능, 추천시스템 등 상당한 가치 발휘 1) 내외부 환경이 급변할 때일수록 변화의 물결을 잘 읽어야 하며 예측하지 못했던 전환이나 위기에 빨리 적응할 수 있는 능력이 필요하다. 2) 가치 패러다임 : 경제와 산업근저에는 가양한 가치 원천이 존재하며, 무작위로 작용하는 것이 아니라 특정기간 지..
[ADsP 자격증] 1-10. 전략인사이트 도출을 위한 필요역량(데이터과학) 제 1과목 데이터 이해 / 3.가치 창조를 위한 데이터사이언스와 전략인사이트 / 3-2.전략인사이트 도출을 위한 필요역량 의미 - 데이터 사이언스란 데이터로부터 의미 있는 정보를 추출해내는 학문이다. - 통계학이 정형화된 실험 데이터를 분석 대상으로 하는 것에 비해, 데이터 사이언스는 정형 또는 비정형을 막론하고 다양한 유형의 데이터를 대상으로 총체적 접근법을 사용한다. - 데이터마이닝은 주로 분석에 초점되나 데이터 사이언스는 분석뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지 모두 포괄하는 개념이다. - 데이터공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당 분야의 전문 지식을 종합한 학문으로 정의한다. 역할 - 전략적 통찰을 추구하고 비즈니..
[ADsP 자격증] 1-9. 빅데이터분석과 전략 인사이트 제 1과목 데이터 이해 / 3.가치 창조를 위한 데이터 사이언스와 전략 인사이트 / 3-1.빅데이터분석과 전략 인사이트 " 초기 빅데이터가 마치 흥행 보증수표처럼 떠오른 시기에는 보고서에 빅데이터라는 단어만 붙으면 내용이나 가치와는 상관없이 무사 통과되기까지 했다. 그러나 빅데이터 분석에 마법은 없다." (이지영, 2013) 빅데이터 회의론이 갖는 문제는 실제 빅데이터 분석에서 찾을 수 있는 수많은 가치들을 제대로 발굴해 보기도 전에 그 활용 자체를 사전에 차단해 버릴 수 있음 - 분석기반 경영이 도입되지 못하는 이유 1) 기존 관행을 그냥 따를 뿐 중요한 시도를 하지 않는다. 2) 경영진의 의사결정이 ..
[ADsP 자격증] 1-8. 미래의 빅데이터 제 1과목 데이터 이해 / 2.데이터의 가치와 미래 / 2-5.미래의 빅데이터 빅데이터 활용에 필요한 3요소 데이터 기술 인력 모든 것의 데이터화(Datafication) - 현재 사물인터넷(IOT, Internet of things) 시대로 진입 중에 있다. 스마트폰 도입 이후 스마트 태블릿 등 단말부분에서 계속되는 혁신은 웨어러블(Wearble) 단말 시장으로 확산 중이다. 이러한 단말들을 통해 대화 기록, 인터넷 방문 정보, 전자책 독서 패턴, 음악 청취 기록 등이 저장되고 있다. CCTV를 통해서는 훨씬 더 많은 정보가 담긴 영상이 기록되고 있으며 사물인터넷 시대가 되면 훨씬 더 많은 정보가 끊임없이 생산ㆍ공유 될 것이다. - IBM, 구글, 아마존, 페이스북, 애플 등의 기업이 각..
[ADsP 자격증] 1-7. 빅데이터 시대 위기요인과 통제방안 제 1과목 데이터 이해 / 2.데이터의 가치와 미래 / 2-4.위기요인과 통제방안 빅데이터 시대의 위기 요인 ① 사생활 침해 ② 책임 원칙 훼손 ③ 데이터 오용 - 구글은 이미 지난 2010년에 서비스 이용자가 1시간 뒤에 어떤 일을 할지 87% 정확도로 예측할 수 있는 데이터와 신뢰도를 확보 (일명 빅브라더 문제) 예) 여행 사실을 트윗한 사람의 집을 강도가 노리는 고전적 사례도 발생(익명화(anonymization) 기술 발전 필요) ※ 빅 브라더 ? 사회학적 통찰과 풍자로 유명한 영국의 소설가 조지 오웰(George Orwell, 1903∼1950)의 소설 《1984년》에서 비롯된 용어이다. 긍정적 의미로는 선의 목적으로 사회를 돌보는 보호적 감시, 부정적 의미로는 음모론에 입각한 ..
[ADsP 자격증] 1-6. 비즈니스 모델(빅데이터비즈니스사례, 기본테크닉) 제 1과목 데이터 이해 / 2.데이터의 가치와 미래 / 2-3.비즈니스 모델 1) 구글은 사용자의 로그 데이터를 활용하면서 검색 결과를 개선한다. 2) 또한 구글의 유튜브는 딥러닝을 활용한 동영상 추천시스템을 강화하고 있다. 3) 월마트는 고객의 구매 패턴을 분석해 상품 진열에 활용한다. 4) 정부는 실시간 교통정보 수집, 기후 정보, 각종 지질 활동, 소방 서비스를 위한 모니터링하여 국가안전 확보 활동에 활용. 이 밖에도 미래 의제인 의료와 교육 개선을 위해 빅데이터를 통해 해결책을 모색중이다. 5) 개인의 사례로 정치인은 선거 승리를 위해 사회관계망 분석을 통해 유세 지역을 선정하고 해당 지역의 유권자에게 영향을 줄 수 있는 내용을 선정해 효과적인 선거 활동을 펼친다. 6)..
[ADsP 자격증] 1-5. 빅데이터의 가치와 영향 제 1과목 데이터 이해 / 2. 데이터의 가치와 미래 / 2-2.빅데이터의 가치와 영향 빅데이터 시대에는 특정 데이터의 가치를 산정하는 것은 매우 어렵다. 빅데이터 가치 산정이 어려운 3가지 이유는 아래와 같다. 데이터 활용방식 데이터가 점점 다용도로 개발되고 있다. 데이터 수집의 1차 목적 외에 2, 3차적으로 데이터 재사용이 이루어지기 때문이다. → 데이터의 창의적 조합(데이터 재사용, 재조합(Mash-up), 다목적 개발) 새로운 가치창출 기존에 없던 가치를 창출하는 역할 때문에 가치 측정이 어렵다. e.g ) 전자책, 동영상 - 독서, 시청 패턴과 같은 이전에는 알지 못했던 정보를 얻을 수 있다. Facebook, Instagram - Social network graph(..
[ADsP 자격증] 1-4. 빅데이터의 이해 제 1과목 데이터 이해 / 2. 데이터의 가치와 미래 / 2-1.빅데이터의 이해 큰(big) 데이터, 하지만 단순히 용량만 방대한 것이 아니라 복잡성도 증가하여 기존 데이터 처리 애플리케이션이나 관리 툴(tool)로는 다루기 어려운 데이터세트 집합(collection of data sets). 빅데이터 현상은 다양한 영역에서 일어나고 있으며 정의 또한 다양하다. Mckinsey, 2011 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터(활용하는 데이터 규모에 중점을 둔 정의). IDC, 2011 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키..
[ADsP 자격증] 1-3. 데이터베이스 활용 제 1과목 데이터 이해 / 1. 데이터의 이해 / 1-3. 데이터베이스 활용 국내의 경우 정보통신망 구축이 가속화 되면서 90년대에는 기업 내부 데이터베이스가 기업 경영 전반에 관한 자료를 연계하여 경영활동의 기반이 되는 전사적 시스템으로 확대되었다. 정부측은 무역, 통관, 물류, 조세, 국세, 조달 등 사회간접자본(SOC) 차원의 투자와 EDI(전자문서교환) 활용이 본격화되었다. 구축된 데이터베이스는 공공DB로 활용될 뿐만 아니라 관련 산업에서 유용하게 활용되기 시작했고, 최근 정부에서는 정부3.0을 통해 범국가적인 공공데이터 개방(공공부문)과 이용 활성화(민간부문) 전반을 지원하고 있다. 정보통신망 구축이 가속화 되면서 90년대에는 기업내부 데이터베이스(인하우스 DB)는 ..
[ADsP 자격증] 1-2. 데이터베이스의 정의와 특징 제 1과목 데이터 이해 / 1. 데이터의 이해 / 1-2. 데이터베이스의 정의와 특징 연도 내용 1950년s 미국정부가 전 세계에 산재한 자국 군대의 군비상황을 집중적으로 관리하기 위해 컴퓨터 도서관을 설립하면서 데이터(data) + 기지(base)라는 뜻의 데이터베이스(DB) 용어가 탄생했다. 1963년 6월 미국 SDC가 개최한 심포지엄에서 '데이터베이스' 용어를 공식으로 사용. 초기 개념인 대량의 데이터를 축적하는 기지라는 의미로 사용했다. 1963년 GE의 C. 바크만이 최초의 현대적 의미의 데이터베이스관리시스템(DBMS)인 IDS(Integrated Data Store)를 개발했다. 이를 통해 새롭게 저장장치에 직접 접근하기 위한 데이터 모델이 제안되었고 이후 다양..