본문 바로가기

IT/Data Science

[ADsP] 과목1. 데이터의 이해 - 1장. 데이터의 이해 (Day1)

오늘부터 ADsP(데이터분석준전문가) 자격증 공부 내용을 요약하여 포스팅할 예정입니다.

마지막 내용까지 모두 요약하는 그날까지! 열심히 공부하여 올려보겠습니다.

저에게는 공부 기록을 남기는 것에 의미가 있고, 이 글을 보는 분들께는 데이터 분석에 대한 작은 정보를 얻는 것에 의미가 있기를 바랍니다.

그럼, 요약 시작하겠습니다! 화이팅! :D



#ADsP (데이터분석준전문가)


■ 과목1.  데이터의 이해

■ 1장.  데이터의 이해


[1]  데이터와 정보


1.  데이터의 정의

:  데이터는 '객관적 사실(fact)'이라는 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실의 존재적 특성을 가진다.

:  동시에 '추론·예측·전망·추정을 위한 근거(basis)'로 다른 객체와의 상호 관계 속에서 가치를 갖는 당위적 특성을 가진다.


2.  데이터의 유형

1)  정성적 데이터 (qualitative data) :  성질, 특징을 자세히 풀어 쓰는 방식으로 설명하며, 숫자로 환산하기 어려운 데이터 

     (ex. 언어, 문자 - 회사 매출이 증가함)

2)  정량적 데이터 (quantitative data) :  수치화된 데이터 

     (ex. 수치 - 29(나이), 50kg(몸무게), 주가)


3.  암묵지와 형식지

:  Polany(1966)가 지식의 차원에 대해 두 가지로 구분함. - 암묵지, 형식지

1)  암묵지(tacit knowledge) :  학습과 체험을 통해 개인에게 습득되어 있지만 겉으로는 드러나지 않는 지식. 시행착오와 오랜 경험으로 개인에게 습득된 무형의 지식. 개인에게 체화되어 있고 외부에 표출되지 않아 공유되기 어려움. (ex. 김장김치 담그기, 자전거 타기) 

2)  형식지(explicit knowledge) :  형상화된 지식. 유형의 대상이 있기 때문에 지식의 전달과 공유가 용이함.  (ex. 교과서, 매뉴얼, 비디오, DB)

▷  내면화(Internalization) → 표출화(Externalization) → 연결화(Combination) → 공통화(Socialization)

       (#표출화 - 암묵지가 형식지로 변화되는 단계)

▷  내면화(Internalization) → 표출화(Externalization) → 내면화(Internalization) → 지식 증대

=>  지식경영(Knowlege Management)의 핵심 이슈인 암묵지와 형식지의 상호작용

       (*지식경영 :  암묵지와 형식지가 상호작용하며 진행되는 지식의 발전을 기반으로 한 기업의 경영)


4.  데이터와 정보의 관계

·  DIKW(Data, Information, Knowledge, Wisdom) 피라미드 :  데이터, 정보, 지식, 지혜 계층구조

1)  Data :  가공 이전의 순수한 수치나 기호  (ex. A 마트 100원, B 마트는 200원에 연필을 판매한다.)

2)  Information :  데이터 가공 및 관계 이해, 패턴 인식, 의미 부여  (ex.  A 마트의 연필이 더 저렴하다.)

3)  Knowledge :  정보 패턴을 이해하여 예측  (ex. 상대적으로 저렴한 A 마트에서 연필을 사야겠다.)

4)   Wisdom :  원리에 대한 깊은 이해를 바탕으로 아이디어 도출  (ex. A 마트의 다른 상품들도 B 마트보다 저렴할 것이다.)



[2]  데이터베이스 정의와 특징


1.  용어의 연혁

-  1950년대 :  미국 정부가 군비 상황 집중 관리를 위해 컴퓨터 기술로 구현한 도서관 설립에서 비롯됨. 이 때, 수집된 자료를 가리키는 '데이터(data)의 기지(base)' 라는 의미의 데이터베이스가 탄생함.

-  1960년대 :  미국 SDC 가 개최한 심포지엄에서 데이터베이스라는 용어가 공식적으로 사용됨. '데이터베이스 시스템' 이라는 용어가 등장함.

-  1970년대 :  유럽에서 데이터베이스라는 단어가 일반화됨. CAC 가 한국과학기술정보센터를 통해 서비스되며 우리나라에 데이터베이스 이용이 도입됨.

-  1980년대 :  'TECHNOLINE' 온라인 정보검색 서비스를 개시하여 본격적인 데이터베이스 서비스 시대를 맞이함. 국내 데이터베이스 연구 및 개발은 1980년대 중반부터 시작되어 계속되고 있음.


2.  데이터베이스 정의

:  데이터베이스는 데이터의 집합, 데이터베이스와 DBMS 를 함께 데이터베이스 시스템이라고 말한다.

:  데이터베이스(영어: database, DB)는 체계화된 데이터의 모임이다. 즉, 작성된 목록으로써 여러 응용 시스템들의 통합된 정보들을 저장하여 운영할 수 있는 공용 데이터들의 묶음이다.  (출처 - 위키백과)


3.  데이터베이스 특징

1)  통합된 데이터(integrated data) :  동일한 내용의 데이터가 중복되어 있지 않음.

2)  저장된 데이터(stored data) :  컴퓨터가 접근 가능한 저장매체가 저장됨.

3)  공용 데이터(shared data) :  여러 유저가 서로 다른 목적으로 DB 데이터를 공동 이용함.

4)  변화되는 데이터 :  추가, 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지함.


4.  데이터베이스 특성

1)  정보의 축적 및 전달 측면 -  대량의 기계가독성, 검색가능성, 원격조작성을 가짐

2)  정보이용 측면 -  요구에 따라 다양한 정보를 신속하게 획득, 경제적 획득함.

3)  정보관리 측면 -  방대한 양의 정보를 체계적으로 축적, 새 내용 추가 및 갱신이 용이함.

4)  정보기술발전 측면 -  네크워크 발전 기술을 견인할 수 있음.

5)  경제 및 산업적 측면 -  인프라로서의 DB 는 경제/산업/사회 활동의 효율성을 제고하고 국민 편의를 증진하는 수단으로 의미를 가짐.



[3]  데이터베이스 활용


1.  기업 내부 데이터베이스

1)  1980년대 -  OLTP(On-line Transaction Processing) 온라인 거래처리, OLAP(On-line Analytical Processing) 온라인 분석처리

2)  2000년대 -  CRM(Customer Relationship Management), SCM(Supply Chain Management)


2.  분야별 기업 내부 부문별 데이터베이스 관련 주요 솔루션

1)  제조부문 -  DW(Data warehouse), ERP(Enterprise Resource Planning), BI(Business Intelligence), CRM(Customer Relationship Management)

2)  금융부문 -  EAI, EDW, 블록체인(Blockchain), ERP, e-CRM

3)  유통부문 -  KMS, RFID, CRM, SCM


3.  사회 기반 구조로서의 데이터베이스

-  EDI(Electronic Data Interchange), VAN(Value Added Network), CALS(Commerce At Lighted Speed)


4.  분야별 사회기반 구조로서의 데이터베이스

1)  물류부문 -  종합물류정보망, 부가가치통신망(VAN)

2)  지리부문 -  국가지리정보체계(NGIS), RS, GPS

3)  교통부문 -  지능형교통시스템(ITS)

4)  의료부문 -  의료 EDI(전자문서교환)

5)  교육부문 -  교육행정정보시스템(NEIS)




*  해당 포스팅은 상업적 목적을 가지지 않으며, 개인 학습기록이 목적임을 밝힙니다. 학습교재로는 아래의 교재들을 이용하였습니다.


상세보기
상세보기
상세보기





여러분의 센스있는 공감 · 댓글 · 공유는 큰 힘이 됩니다. 고맙습니다.