■ 2장. 데이터의 가치와 미래
[1] 빅데이터의 이해
1. 빅데이터의 정의
: 빅데이터는 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터이다. (MaKinsey, 2011)
: 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처다. (IDC, 2011)
: 빅데이터란 대용량 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일이다. 나아가 이를 활용해 시장, 기업 및 시민과 정부의 관계 등 많은 분야에 변화를 가져오는 일이다. (Mayer-Schonberger & Crukier, 2013)
* 빅데이터 4V - Volume, Variety, Velocity, Value (3V: 투자비용 요소, 4V: 비즈니스 효과)
2. 빅데이터 기능
1) 산업혁명의 석탄, 철
2) 원유
3) 렌즈
4) 플랫폼
3. 변화
1) 사전처리(pre-processing)에서 사후처리(post-processing)로
2) 표본조사에서 전수조사로
3) 질보다 양으로
4) 인과관계에서 상관관계로
[2] 빅데이터의 가치와 영향
1. 빅데이터의 가치
1) 빅데이터의 가치 산정이 어려운 이유 - 데이터의 활용 방식, 새로운 가치 창출, 분석 기술의 발달
2. 빅데이터의 영향
: 기업(혁신, 경쟁력 제고, 생산성 향상) - 정부(환경탐색, 상황분석, 미래대응) - 개인(목적에 따라 활용) → 생활 전반의 스마트화 진행됨.
[3] 비즈니스 모델 - 빅데이터 활용 테크닉
1) 연관규칙학습(Association rule learning) : 변수 간 주목할만한 상관관계가 있는지 찾아내는 방법
2) 유형분석(Classification tree analysis) : 어떤 유형에 속하는지 같은 문제를 해결할 때 사용하는 방법
3) 유전 알고리즘(Genetic algorithms) : 최적화 메커니즘을 찾아가는 방법
4) 기계학습(Machine learning) : 훈련 데이터로부터 학습한 특성을 활용해 예측하는 방법
5) 회귀분석(Regression Analysis) : A 변수가 B 변수에 어떤 영향을 미치는지 같은 문제를 해결할 때 사용하는 방법
6) 감정분석(Sentiment Analysis) : A 에 대한 유저의 평가는 어떤지 같은 문지를 해결할 때 사용하는 방법
7) 소셜 네트워크 분석(Social network analysis) : 사회관계망분석(SNA). 영향력 있는 사람을 통해 유저 간 소셜 관계를 파악하는 방법
[4] 위기 요인과 통제 방안
1) 사생활 침해 → 개인정보활용 제공자 동의에서 사용자 책임으로
2) 책임 원칙의 훼손 → 결과 기반, 기존의 책임 원칙 강화
3) 데이터의 오용 → 데이터 알고리즘에 대한 접근권 허용 및 객관적 인증 방안 도입 필요
[5] 미래의 빅데이터
* 빅데이터 활용 3요소 - 데이터, 기술, 인력
* 해당 포스팅은 상업적 목적을 가지지 않으며, 개인 학습기록이 목적임을 밝힙니다. 학습교재로는 아래의 교재들을 이용하였습니다.
여러분의 센스있는 공감 · 댓글 · 공유는 큰 힘이 됩니다. 고맙습니다.
'IT > Data Science' 카테고리의 다른 글
[ADsP] 과목1. 데이터의 이해 - 3장. 데이터 사이언스와 전략 인사이트 (0) | 2019.02.11 |
---|---|
[ADsP] 과목1. 데이터의 이해 - 1장. 데이터의 이해 (Day1) (0) | 2019.01.27 |
[ADsP 시험후기] 다시 봐야할 것 같은^^;; 데이터분석준전문가 자격증 시험 후기 (2) | 2018.11.24 |