반응형
( 01 ) 데이터베이스의 필요성
1 ) 데이터와 정보
데이터 : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값 → 자료라고도 부른다
정보 : 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리해 체계적으로 조직한 결과물
정보 처리 : 데이터를 상황에 맞게 분석하거나 해석하여 데이터 간의 의미 관계를 파악하며 정보를 추출하는 과정 또는 방법이다.
🤔 현재성과 정확성을 보장하는 가치 있는 정보를 얻기 위해서는?
👉 현재 상황을 정확히 관찰하고 측정하여 의미 있는 데이터를 많이 수집해야한다.
2 ) 정보 시스템과 데이터베이스
정보 시스템 : 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단
정보 시스템의 종류
- 경영 정보 시스템 : 기업의 경영 관리에 필요한 의사 결정용 정보 시스템
- 의사 결정 지원 시스템 : 복합적이고 광범위한 의사 결정을 위해 사용되는 정보 시스템
( 02 ) 데이터베이스의 정의와 특징
1 ) 데이터베이스의 정의
🤔 데이터베이스라는 용어가 처음으로 소개된곳은?
👉 1963년 '컴퓨터 중심의 데이터베이스 개발과 관리'심포지엄에서 공식적으로 처음 소개되었다.
데이터 베이스 : 특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한'운영'데이터의 집합
데이터베이스는 공유 데이터
- 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야한다.
- 사용 목적이 다른 사용자들을 고려해 구성해야한다.
데이터베이스는 통합 데이터
- 데이터 중복성을 허용하지 않는다.
- 효율성 때문에 중복을 의도적으로 허용하는 경우도 있다.
데이터베이스는 저장 데이터
- 데이터를 주로 컴퓨터가 처리한다.
- 컴퓨터가 접근할 수 있는 매체에 저장해야한다.
데이터베이스는 운영 데이터
- 조직을 운영하고 조직의 주요 기능을 수행한다
- 데이터를 지속적으로 유지해야한다.
2 ) 데이터베이스의 특징
실시간 접근이 가능하다
- 사용자의 데이터 요구에 실시간으로 응답할 수 있어야한다.
- 대개 몇 초를 넘지 않는 시간 내에 데이터를 제공해야 한다.
계속 변화한다
- 현실 세계의 상태를 정확히 반영해야 의미가 있다.
- 동적인 특징이 있다
- 계속 삽입, 삭제, 수정해서 현재의 정확한 데이터를 유지해야한다.
동시 공유가 가능하다
- 여러 사용자가 동시에 이용할 수 있는 동시 공유의 특징을 제공한다.
- 서로 다른 데이터를 동시에 사용하고 같은 데이터를 동시에 사용하는 것도 모두 지원해야한다.
내용으로 참조가 가능하다
- 저장된주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있다
- 조건만 제시하면 데이터가 다른 위치에 저장되어도 검색할 수 있다.
( 03 ) 데이터 과학 시대의 데이터
1 ) 형태에 따른 데이터 분류
정형 데이터
- 미리 정해진 구조에 따라 저장된 데이터다.(구조화된 데이터)
- 미리 정해진 데이터 구조를 스키마라고 한다.
반정형 데이터
- 구조에 따라 저장된 데이터이지만 정형 데이터와 달리 데이터 내용안에 구조에 대한 설명이 함께 존재한다.
- 구조를 파싱하는 과정이 필요하고 파일 형태로 저장한다.
- HTML, XML, JSON, 웹 로그, 센서 데이터 등이 반정형 데이터이다.
- 내용과 함께 설명된 데이터 구조를 스키마라고도 하지만 메타 데이터라고도 한다
비정형 데이터
- 정해진 구조가 없이 저장된 데이터다.
- 텍스트, 영상, 음성등 멀티미디어 데이터가 있다.
2 ) 특성에 따른 데이터 분류
범주형 데이터
- 종류를 나타내는 값을 가진 데이터이다.(범주로 구분할 수 있는 값)
- 대부분 문자 타입의 값이다, 산술적인 연산이 불가능해 질적 데이터라고 한다.
- 명목형 데이터 : 순서, 서열이 없는 값을 가지는 데이터
- 순서형 데이터 : 순서, 서열이 있는 값을 가지는 데이터
수치형 데이터
크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터(양적 데이터)
- 이산형 데이터 : 이어지지 않고 띄엄띄엄 단절된 숫자 값을 가지는 데이터
- 연속형 데이터 : 연속적으로 이어진 숫자 값을 가지는 데이터
반응형