본문 바로가기

IT/Data Science

[ADsP] 과목1. 데이터의 이해 - 2장. 데이터의 가치와 미래

■ 2장.  데이터의 가치와 미래


[1]  빅데이터의 이해


1.  빅데이터의 정의

:  빅데이터는 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터이다. (MaKinsey, 2011)

:  빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처다. (IDC, 2011)

:  빅데이터란 대용량 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일이다. 나아가 이를 활용해 시장, 기업 및 시민과 정부의 관계 등 많은 분야에 변화를 가져오는 일이다. (Mayer-Schonberger & Crukier, 2013)

*  빅데이터 4V -  Volume, Variety, Velocity, Value (3V: 투자비용 요소, 4V: 비즈니스 효과)


2.  빅데이터 기능

1)  산업혁명의 석탄, 철

2)  원유

3)  렌즈

4)  플랫폼


3.  변화

1)  사전처리(pre-processing)에서 사후처리(post-processing)로

2)  표본조사에서 전수조사로

3)  질보다 양으로

4)  인과관계에서 상관관계로




[2]  빅데이터의 가치와 영향


1.  빅데이터의 가치

1)  빅데이터의 가치 산정이 어려운 이유 -  데이터의 활용 방식, 새로운 가치 창출, 분석 기술의 발달


2.  빅데이터의 영향

:  기업(혁신, 경쟁력 제고, 생산성 향상) - 정부(환경탐색, 상황분석, 미래대응) - 개인(목적에 따라 활용) → 생활 전반의 스마트화 진행됨.




[3]  비즈니스 모델 - 빅데이터 활용 테크닉

1)  연관규칙학습(Association rule learning) :  변수 간 주목할만한 상관관계가 있는지 찾아내는 방법

2)  유형분석(Classification tree analysis) :  어떤 유형에 속하는지 같은 문제를 해결할 때 사용하는 방법

3)  유전 알고리즘(Genetic algorithms) :  최적화 메커니즘을 찾아가는 방법

4)  기계학습(Machine learning) :  훈련 데이터로부터 학습한 특성을 활용해 예측하는 방법

5)  회귀분석(Regression Analysis) :  A 변수가 B 변수에 어떤 영향을 미치는지 같은 문제를 해결할 때 사용하는 방법

6)  감정분석(Sentiment Analysis) :  A 에 대한 유저의 평가는 어떤지 같은 문지를 해결할 때 사용하는 방법

7)  소셜 네트워크 분석(Social network analysis) :  사회관계망분석(SNA). 영향력 있는 사람을 통해 유저 간 소셜 관계를 파악하는 방법




[4]  위기 요인과 통제 방안

1)  사생활 침해  → 개인정보활용 제공자 동의에서 사용자 책임으로

2)  책임 원칙의 훼손  → 결과 기반, 기존의 책임 원칙 강화

3)  데이터의 오용  → 데이터 알고리즘에 대한 접근권 허용 및 객관적 인증 방안 도입 필요




[5]  미래의 빅데이터

* 빅데이터 활용 3요소 - 데이터, 기술, 인력






*  해당 포스팅은 상업적 목적을 가지지 않으며, 개인 학습기록이 목적임을 밝힙니다. 학습교재로는 아래의 교재들을 이용하였습니다.


상세보기
상세보기
상세보기







여러분의 센스있는 공감 · 댓글 · 공유는 큰 힘이 됩니다. 고맙습니다.