두루 잘하는 전문가
아파치 Impala(임팔라)란 무엇인가? 본문
Apache Hadoop에서 실행되는 쿼리 엔진
HDFS에 저장돼 있는 데이터를 SQL을 이용해 실시간으로 분석할 수 있는 시스템
MapReduce 프레임워크를 이용하지 않고 분산 질의 엔진을 이용해 분석하기 때문에 빠른 결과 제공
Impala SQL Statements
https://www.cloudera.com/documentation/enterprise/5-8-x/topics/impala_langref_sql.html
Select Statement
https://www.cloudera.com/documentation/enterprise/5-8-x/topics/impala_select.html
임팔라는 거대한 데이터 집합들에서도 빠른 응답 시간을 갖는 데에 초첨이 맞춰져 있습니다.
설치
아래와 같은 소프트웨어가 필수적으로 설치돼 있어야 합니다.
- Red Hat Enterprise Linux(RHEL)/CentOS 6.2(64bit) 이상
- Hadoop 2.0
- Hive
- MySQL
클라우데라 라이브 데모 사용
- 설치 없이 실행하는 가장 쉬운 방법
- Hue 웹 인터페이스를 통한 임팔라 질의 편집기를 사용
클라우데라 퀵스타트 브이엠
- DB 다룰 줄 아는 하둡 중급자라면... 입팔라 주요 기능에 익숙해지는 용도로 적합
- 퀵스타트 가상머신을 VMWare, KVM, VirtualBox에 실행하고 Cloudera Manager 웹 인터페이스를 통해 임팔라 서비스를 실행하면 impala-shell 인터프리터나 ODBC, JDBC 인터페이스를 통해 상호작용 가능
소스 빌딩하기
깊이 있게 이해하기 원한다면 GitHub에서 소스코드를 얻어 직접 빌드
참고 -
1. Getting Started with Impala(O’REILLY) 번역서 ( http://preview.hanbit.co.kr/2726/sample_ebook.pdf )
2. 클라우데라 ( https://www.cloudera.com )
3. 클라우데라 블로그 ( http://blog.cloudera.com )
4. 네이버 D2 ( http://d2.naver.com/helloworld/246342
http://d2.naver.com/helloworld/246342#chak-b-794664ba )
'IT > 빅데이터' 카테고리의 다른 글
(Copy 자료) Bash shell(배시 셸, 유닉스 쉘) ??? (0) | 2018.01.29 |
---|