티스토리 뷰

반응형

 

정보처리 산업기사를 공부하며

DB 관련 신기술/용어에 대해

학습한 내용을 정리한다.

 

정보처리산업기사를 준비하는

사람이 아니더라도

도움될 내용이니 참고하자.

 

(이번 편은 1부와 2부로 나눠서 진행된다.

2부는 내일 업로드 하도록 하겠다.)


 

  • DB 관련 신기술 / 용어
    • DB 관련 신기술
      • 빅데이터(Big Data)
        • 막대한 양의 정형, 비정형 데이터 집합
      • 브로드데이터(Broad Data)
        • 다양한 채널에서 소비자와 상호 작용을 통해 생성된 것
        • 이전에 사용하지 않거나 알지 못했던 새로운 데이터나 기존 데이터에 새로운 가치가 더해진 데이터
      • 메타 데이터(Meta Data)
        • 일련의 데이터를 정의하고 설명해주는 데이터
        • 데이터 사전의 내용, 스키마 등 의미
        • HTML 문서에서 메타 태그 내용이 이에 해당
      • 디지털 아카이빙(Digital Archiving)
        • 디지털 정보 자원 장기적으로 보존하기 위한 작업
        • 아날로그 콘텐츠는 디지털로 변환 후 압축해 저장, 디지털 콘텐츠도 체계적으로 분류하고 메타 데이터를 만들어 DB화하는 작업
      • 하둡(Hadoop)
        • 오픈 소스 기반 분산 컴퓨팅 플랫폼
        • 일반 pc급 컴퓨터들로 가상화된 대형 스토리지 형성, 그 안에 보관된 거대한 데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트웨어 프레임워크
      • 맵리듀스(MapReduce)
        • 대용량 데이터 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델
        • 흩어진 데이터를 연관성 있는 데이터 분류로 묶는 Map 작업 수행 후 중복 데이터 제거하고 원하는 데이터 추출하는 Reduce 직업 수행
        • Google에 의해 고안, 대표적인 대용량 데이터 처리를 위한 병렬 처리 기법으로 많이 사용
      • 타조(Tajo)
        • 오픈 소스 기반 분산 컴퓨팅 플랫폼인 아파치 하둡 기반의 분산 데이터 웨어하우스 프로젝트
        🤔 데이터 웨어하우스란?(Data Warehouse)
        • 정보(Data)와 창고(Warehouse)의 합성어
        • 기업의 의사결정 과정에 효과적으로 사용될 수 있도록 여러 시스템에 분산되어 있는 데이터를 주제별로 통합 축적해 놓은 데이터베이스
      • 데이터 다이어트(Data Diet)
        • 데이터를 삭제하는 것이 아니라 압축하고 중복된 정보는 중복 배제하고, 새로운 기준에 다라 나누어 저장하는 작업
      • 데이터 마이닝(Data Mining)
        • 대량의 데이터를 분석하여 데이터에 내재된 변수 사이의 상호관계를 규명하여 일정한 패턴을 찾아내는 기법
      • OLAP(Online Analytical Processing)
        • 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정에 활용하는 방식
        • OLAP 연산 : Roll-up, Drill-down, Drill-through, Drill-across, Pivoting, Slicing, Dicing

 

다들 오늘도 즐겁게 공부하자. 😊

반응형