문제 풀이 오답
헷갈렸던 것들만 따로 정리해봅니다.
SQL의 대표적인 집계함수
AVG : 지정한 열의 평균값 반환 : 수치형
COUNT : 테이블의 특정 조건이 맞는 것의 개수를 반환 : 수치형, 문자형 -- 그래서 수치형, 문자형 다 사용가능한 함수는 COUNT
SUM : 지정한 열의 총합을 반환 : 수치형
STDDEV : 지정한 열의 분산을 반환 : 수치형
MIN : 지정한 열의 최솟값을 반환 : 수치형
MAX : 지정한 열의 최댓값을 반환 : 수치형
데이터 마스킹
데이터의 길이, 유형, 형식과 같은 속성을 유지한 채 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술
데이터 마이닝
대용량 데이터에서 의미 있는 정보를 추출하여 의사결정에 활용하는 기술
딥러닝
다층 구조 형태의 신경망을 바탕으로 하는 머신 러닝의 한 분야
객체지향 DBMS
사용자 정의 데이터 및 멀티미디어 데이터 등 복잡한 데이터 구조를 표현, 관리할 수 있는 데이터베이스 관리 시스템
데이터 웨어하우스
기업의 의사결정 과정을 지원하기 위한 주제 중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터의 집합
OLAP는 기존의 데이터 웨어하우스에서 주로 이용하는 분석법
시각화를 통해 대용량 데이터에서 통찰력을 획득하고자 하는 시도는 빅데이터의 고유한 특성
Scribe는 페이스북에서 개발된 데이터 수집 플랫폼으로 chukwa와 달리 중앙집중서버로 데이터를 전송함
Pig는 복잡한 MapReduce 프로그래밍을 대체할 Pig Latin을 제공함
EAI의 활용 효과
- 정보 시스템 개발 및 유지 보수비용 절감
- 기업 정보 시스템의 지속적 발전 기반 확보
- 협력사, 파트너, 고객과의 상호 협력 프로세스 연계
- 웹 서비스 등 인터넷 비즈니스를 위한 기본 토대 확립
- 지역적으로 분리되어 있는 정보 시스템들 간의 데이터 동기화, 그룹 및 지주 회사 계열사들 간 상호 관련 데이터 동기화 등을 위한 데이터 표준화 기반 제공
HDFS
네임 노드 : 마스터 역할 / 모든 메타데이터 관리 / 데이터노드들로부터 하트비트를 받아 상태 체크
보조 네임노드 : 상태 모니터링을 보조함
데이터 노드 : 슬레이브 역할 / 데이터 입출력 요청 / 데이터 유실방지를 위해 블록을 3중 복제
출처 : 데이터에듀 - 데이터 분석 전문가 필기