데이터 베이스 기본개념
데이터: 관찰값
정보 : 가공한 데이터
정보처리: 데이터에서 정보를 추출하는 과정
데이터베이스 정의
- 통합데이터
- 최소, 통제가능한 수준의 중복만 허용하는 데이터 : 효율적으로 가자
- 저장데이터
- 컴퓨터가 접근할수 있는 매체에 저장된 데이터
- 공유데이터
- 여러 사용자가 함께 소유, 이용 가능한데이터
- 예시: 대학의 여러 부서에서 동일한데이터를 사용하지만 각기 다른 목적으로 접근할수 있도록
- 수강신청
- 등록
- 도서관
- 동일한 학생의 정보를 각 부서가 따로 저장하면서 일어나는 불일치성, 중복을 제거할수 있음
- 예시: 대학의 여러 부서에서 동일한데이터를 사용하지만 각기 다른 목적으로 접근할수 있도록
- 여러 사용자가 함께 소유, 이용 가능한데이터
- 운영데이터
- 조직의 주요기능을 수행하기 위해 지속적으로 필요한 데이터
- 단순한 데이터의 집합이 아니라 조직이 돌아가기위한 필수 데이터들의 집합이라는 것
- 반대 개념: 분석데이터
- 조직의 실시간 운영과 다르게 과거 데이터를 이용해 장기적, 전략수립을 위해 분석하는 것
데이터베이스 특징
- 실시간 접근성
- 사용자 데이터 요구에 실시간으로 응답가능해야함
- 계속 변화
- 계속적인 삽입, 삭제, 수정을 통해 정확한 데이터 유지
- 내용 기반 참조
- 데이터가 저장된 주소나 위치가 아닌 내용으로 참조
- : 무슨말이냐!!
- "제고량이 1000개 이상인 제품의 이름을 검색하시오"
- !데이터를 검색할땐 내용으로 검색한다!
- : 무슨말이냐!!
- 데이터가 저장된 주소나 위치가 아닌 내용으로 참조
- 동시 공유
- 서로 다른 데이터뿐 아니라 같은데이터도 동시사용지원(일관성이 무너질수도있기때문에 여러 방법들이 존재)
데이터의 종류
- 정형 : 당연히 알지? 표데이터 같은 형식이 정해진 데이터임
- csv,RDB(관계 데이터베이스)의 테이블
- 반정형: 기존의 정형 데이터에 비해 유연한 성질로 인해 정형과 차이가 남
- 무슨차이?
- 정형은 모든 데이터가 한집합내에 동일한 형식으로 정해져있음
- 반정형은 각 데이터마다 메타데이터가 존재하며 집합내에 존재하더라도 다른 구조가 있을수 있음
- 좀더 유연하기 때문에 파싱하는 과정이 필요하며 정형보다 비용이 크다고 볼수 있음
- 비정형데이터
- 정해진 구조없이 저장된 데이터
- 소셜데이터의 텍스트, 영상, 이미지, 워드..
- 무슨말이지?? 각각의 포멧에 따라 저장된 것 아닌가??
- 아니다! 데이터의 저장은 정해진 포멧에 따라 저장되지만, 해당 데이터의 값자체는 구조화되지 않았다.
- 해당 파일내부에 내용이 얼굴이 어딘지, 팔이 어딘지, 공이 어딘지 등에 대한 파일내부 내용에 대해서는 구조화 되지 않았다.
- 소셜데이터의 텍스트, 영상, 이미지, 워드..
- 정해진 구조없이 저장된 데이터
'CS > 데이터베이스' 카테고리의 다른 글
데이터베이스 관리시스템 (2) | 2024.09.24 |
---|