본문 바로가기

Hadoop/빅데이터 파일럿 프로젝트

탐색 파일럿 실행 2단계 - 탐색 환경 구성

 


  • 빅데이터 탐색 개요
  • 빅데이터 탐색에 활용되는 기술
  • 탐색 파일럿 실행 1단계 - 탐색 아키텍처
  • 탐색 파일럿 실행 2단계 - 탐색 환경 구성
    • 저사양 파일럿 환경 서비스 중지
    • Hive 설치
    • Oozie 설치
    • Hue 설치
      • python 2.7 설치 : server02
      • psycopg2 설치
    • Oozie 설치 후 구성변경
    • Hue 설치 후 구성변경
    • Spark 설치
    • Spark 설치 후 YARN에서 작동하도록 구성
    • 탐색 환경의 구성 및 설치 완료
      • 클러스트 재시작
  • 탐색 파일럿 실행 3단계 - 탐색 기능 구현
  • 탐색 파일럿 실행 4단계 - 탐색 기능 테스트

실시간 탐색 파일럿 실행 2단계 - 탐색 환경 구성

저사양 파일럿 환경 서비스 중지

  • 클라우드 매니저(CM)에서 플럼, 카프카 서비스 중지
  • Service0
  • 스톰 정지: service storm-ui stop, service storm-supervisor stop, service storm-numbus stop
  • 레디스 정지: service redis_6379 stop
  • 수집, 적재 시뮬레이터 등도 정지

 


Hive 설치

 

  • CM > 클러스트1 > 서비스 추가 > Hive 선택 > 계속
  • 종속성 집합 > HBase 선택 > G, HMS, HS2 Server02 선택 > 계속
  • 하이브 MetaStore DB 설정(기본) > 테스트연결 > 계속
  • 변경 내용 검토(기본) > 계속

서버 1이 하는 일이 많아서, 서버 2로 수정



Oozie 설치

 

01. CM 홈에서 [서비스 추가] 화면으로 이동 -> 추가할 서비스 유형 중 '우지(Oozie)'를 선택 후 우측 하단의 [계속]버튼을 누른다

CM을 이용한 우지설치 - 01 우지 컴포넌트 설치

02. 우지 작동에 필요한 의존성을 선택

- HBase가 포함된 항목을 선택한 후 [계속]버튼을 누른다

CM을 이용한 우지설치 - 02 우지 의존성 선택

03. 우지서버를 설치할 서버 선택

- Server02로 변경하고 [계속] 버튼을 누른다

CM을 이용한 우지설치 - 03-1 우지 서비스의 설치 위치 지정

 

CM을 이용한 우지설치 - 03-2 우지 서비스의 설치 위치 지정

04. 데이터베이스 설정. 

- 기본값을 유지하고 테스트 연결만 확인한 후, [계속] 버튼을 누른다

CM을 이용한 우지설치 - 04 데이터베이스 설정

05. 우지의 ShareLib 루트 디렉터리와 우지 서버의 데이터 디렉터리 설정 정보를 입력하는 단계

- 기본값을 유지한 상태에서 [계속] 버튼을 누른다

CM을 이용한 우지설치 - 05 변경 내용 검토

06. 우지 컴포넌트의 설치 및 구성이 시작된다.

- 설치가 완료되면 [계속] 버튼을 누른다

CM을 이용한 우지설치 - 06 설치 및 구성

07. 마지막으로 우지 설치 완료화면. 

- [완료] 버튼을 눌러 설치를 종료한다

CM을 이용한 우지설치 - 07 설치 및 구성 완료

08. 우지가 실행하는 잡들의 기본 메모리 값을 파일럿 환경에 맞게 조정한다

- CM 홈에서 [Oozie] -> [구성]을 선택하고 검색에서 "Launcher Memory"로 조회한다. 

- 기본 메모리 값을 2GB 에서 1GB로 수정하고 [변경 내용 저장] 버튼을 누른다

- 변경이 완료되면 우지 서비스를 재시작한다

08 우지 기본 메모리 값 수정



Hue 설치

Hue 설치 : server02

  • server02에 python 2.7 필요

 

01. 모바텀에서 파이썬의 버전을 확인한다

02. python 2.7 설치 : server02

참고 : /etc/yum.repos.d/Centos-Base.repo 없으면 아래 값 추가

[centos-sclo-rh]
name=CentOS-6.10 - SCLo rh
baseurl=http://vault.centos.org/centos/6.10/sclo/$basearch/rh/
gpgcheck=1
enabled=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-SIG-SCLo

[centos-sclo-sclo]
name=CentOS-6.10 - SCLo sclo
baseurl=http://vault.centos.org/centos/6.10/sclo/$basearch/sclo/
gpgcheck=1
enabled=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-SIG-SCLo
# python --version
# yum install centos-release-scl
# yum install scl-utils
# yum install -y python27
# source /opt/rh/python27/enable
# python --version

psycopg2 설치

yum install python-pip 오류 시 아래 명령어 먼저 실행

 

# yum --enablerepo=extras install epel-release
# yum install python-pip
# pip --version
# yum install -y postgresql-devel
# pip install psycopg2==2.6.2 --ignore-installed

Oozie 설치 후 구성 변경

  • CM > Oozie > 구성 > 검색 > > oozie-site.xml > 

  • 위 더하기 버튼을 누르면 (왼쪽이미지), 오른쪽이미지와 같은 화면을 볼 수 있다.
  • 이름: oozie.processing.timezone , 값: GMT+0900 > 변경 내용 저장

  • Oozie 이전 서비스 재시작

 

교재 설치 방법

# yum install python-pip
# yum install -y postgresql-devel
# bash -c "source /opt/rh/python27/enable;pip install psycopg2==2.6.2 --ignore-installed"

pip install --upgrade pip 로 pip 오류 시

  • pip 새로 download 해서 설치
# wget https://bootstrap.pypa.io/pip/2.7/get-pip.py
# python get-pip.py
# pip --version
# yum install -y postgresql-devel
# pip install psycopg2==2.7.7 --ignore-installed
  • CM > 클러스트1 > 서비스 추가 > Hue 선택 >
  • Select Dependencies: HBase HDFS Hive Oozie YARN (MR2 Included) ZooKeeper
  • HS Server02 선택 > 계속
  • 변경 내용 검토(기본) > 계속


Spark 설치

  • CM > 클러스트1 > 서비스 추가 > Spark 선택 > 계속
  • HS, G Server02 선택 > 계속


Spark 설치 후 YARN에서 작동 하도록 구성

  • CM > YARN > 재시작
  • CM > Spark > 클라이언트 구성 배포
  • CM > 스파크 > History Server 웹 UI

탐색 환경의 구성 및 설치 완료

  • 클러스트 재시작

휴 설치 후 시작  -> http://server02.hadoop.com:8888/ 접속 ->  클라우드매니저와 동일한 계정으로 로그인