1탄. SPARK를 설치해보자~

해당 포스팅은 총 3부로 구성될 예정 입니다.

1탄. 단일모드

2탄. 클러스터 모드

3탄. 기타 유용 셋팅(스파크 관련)

1탄. SPARK를 설치해보자~

Apache Spark 설치!

버전은 1.6.1 / hadoop 2.6으로 해서 다운받아보겠습니다. (현업에서 사용중인게 요거라서 요걸로!)

Step 1. 아래의 링크를 통해 스파크를 다운 받아보자!

Step 2. down을 받아서 원하는 서버에서 압축을 풀어줍니다.

압축을 해제하고 내용을 보면 아래와 같습니다.

Step 3. Spark는 대화형 쉘들을 제공 합니다.

파이썬과 스칼라가 있는데요

즉석 데이터를 분석하기에 좋습니다.

실행은?

1) 파이썬 쉘

ㄴ bin directory에 가서 ./pyspark 를 실행시키면 아래와 같이 수행되어집니다.

2) 스칼라 쉘

ㄴ bin/spark-shell 를 수행!

간단히 테스트를 해보자.

내용은 스파크 퀵 스타트를 통해 해보자!

Step 4. Log 설정을 해보자.

Spark에서의 로그는 아래와 같이 설정할 수가 있다.

아래의 템플릿 중에 log4j.properties.template를 복사해서 log4j.properties를 만들면 된다.

많이 사용되어지는 친구이기 때문에 잘 아실거라 믿는다.

내용은!? 아래처럼 INFO로 설정이 되어있어서 spark-shell를 수행시키면 많은 정보들이 나오게 된다.
INFO->WARN으로 변경을 한다면 적은 내용의 정보가 보인다.

- 1탄 끝~ -

저작자표시 비영리 변경금지 (새창열림)

spark-submit deploy-mode option (0)	2016.11.02
2탄. SPARK를 설치해보자~(클러스터) (0)	2016.10.19
spark log4j 사용해보기! (0)	2016.07.04
spark logback 설정? (0)	2016.06.29
spark-submit 옵션 관련 (0)	2016.05.16

Developer 태하팍