객관식(40문제) - 80점(각 2점)
1) 데이터의 이해(8문제)
예상 : 2,4,5,7,8 - 10점 이상
1. 엑사, 페타, 요타, 제타 ㅡ 크기순 나열
정답 : (나)-(가)-(라)-(다)
페타ㅡ엑사ㅡ제타ㅡ요타
(빠르게 읽으면 백조)
2. 상용화된 데이터가 아닌 것
ㅡ DB2, Tableau, SQL sever, Oracle
답 : 2번 Tableau
3. 빅데이터의 본질적인 변화
1) 사물인터넷으로
2
4. 빅데이터로 인한 피해 (가장 적절하지 않은 것..?)
1) 익명화
2) 사생활 침해
3) 데이터 오용
4) 책임원칙 훼손
답 : 익명화
5. 데이터 사이언티스트의 역량 중 다른 유형
ㅡ 타 부서와 협력
ㅡ 통찰력 있는 분석
ㅡ 이론적 지식
ㅡ 설득력 있는 커뮤니케이션
답 : 이론적 지식
6. 빅데이터 활용의 3요소에 관해
기본 3요소 : 데이터, 기술, 인력
1)
2)
3) 데이터 사이언티스트로 인한 피해 방지 -> 알고리즈미스트
7. 빅데이터의 구성 요소로 적절하게 나열
(A : 메타데이터 B : 인덱스)
8. 데이터베이스의 일반적인 특징 (으로 적절하지 않은 것)
1) 통합된 데이터로 동일한 내용이 중복되어 있다
2) 변화하는 데이터
3) 공용 데이터
4) 저장된 데이터
답 : 1번. 통합된 데이터란 동일한 내용의 데이터가 중복되어 있지 않다는 건을 의미
2) 데이터 분석 기획(8문제)
예상 : 1, 5,
- 비즈니스 캔버스 모델 (업무, 제품, 고객, 규제와 감사, 지원 인프라 / 문제에서는 1번 선택지가 '개혁'으로 적절하지 않은 것 ㅡ 정답)
- 데이터 분석과제 추진 시 고려해야 하는 우선순위 평가기준
- 분석 시나리오의 효과
- 분석 성숙도
- 분석 관점에서의 사분면 분석(정착형, 확산형, 도입형, 준비형) / 문제 : 준비도와 성숙도 모두 낮은 단계는? 답 : 준비형
- 분석 조직에 대한 설명으로 적절하지 않은 것
3) 데이터 분석 (24문제)
ㅡ24문제 순서 기억 못하므로 무작위로 생각나는 대로 기록
예상 :
- Sales와 TV광고 그래프
- 스피어만
- 가설검정(문제 : 뚜렷한 증거가 있을 때 ㅡ 답: 대립가설)
- 데이터분할
- 분류모형(이익도표)
- 백색잡음
- 앙상블(배깅, 부스팅, ㅡ 아다부스팅)
- (선택지 : 배깅, 부스팅, ㅡ, CART)
- 카이제곱분포,
- 그래프(이상값)
지니계수(계산문제)
향상도
신뢰도
단답형(10문제) - 20점(각 2점)
ㅡ 정답 맞춘 문항(빨강) : 총 6점 획득(예상)
ㅡ 문제 번호와 내용이 일치하지 않을 수 있음(기억에 의존한 내용)
ㅡ 답은 적었으나 틀린 문제, 실제 정답이 파랑글씨
- SCM
- DIKW 피라미드
- 디자인 사고(Disign Thinking) : 상향식 접근 방식의 발산 단계와 하향식 접근 방식의 수렴단계를 반복적으로 수행하는 식의 상호 보완적인 동적 환경을 통해 분석의 가치를 높일 수 있는 최적의 의사결정 방식
- 데이터 저장소 관리?
- 생물진화 .... 기억안남
- 정상성
- 계산문제(오분류표)
- 최장거리
- 계산문제(주성분분석)
- 층화추출법