웹 기반 노트북을 사용한 데이터 시각화 tool
- spark, sparkSQL의 결과를 바로 차트로 그릴 수 있음
- 물론 다른 언어와의 호환성이 매우 뛰어남
기존의 workflow
- 다양한 제품을 조합하여 데이터 분석을 하는 것이 일반적
- 많은 엔지니어링 필요
- 다방면에 경험 많은 능력자의 전유물
- 파이프라인이 복잡하기 때문에 고장나기 쉽고 유지보수가 어려움
Zeppelin!
spark를 통해 데이터 정제, 처리, 요약 데이터 시각화, 고급 분석까지 전부 spark와 zeppelin으로 해결 가능!
Notebook
- 소스코드 작성, 수정, 자동 저장, 실행
- scala(spark), spark SQL, markdown 등 지원
Visualization
- spark SQL 수행 결과를 table, line chart, pie chart 등 다양한 형태로 시각화
- spark의 좋은 성능 덕분에 대부분 코드가 즉시 실행되므로 interactive하게 데이터를 다룰 수 있음
- HTML을 표현 가능하므로 테이블에 이미지를 표시하거나 link를 넣거나 하는 등의 동작 가능
'잡다한 기술' 카테고리의 다른 글
[zookeeper] Apache Zookeeper? (0) | 2021.12.31 |
---|---|
[zookeeper] zookeeper에서 semaphore 사용하기 (0) | 2021.12.31 |
[django] Serializer에 분명히 해당 필드가 있는데 없다고 하는 경우 (0) | 2021.12.31 |
[git] ! [rejected] master -> master (non-fast-forward) 해결방법 (0) | 2020.02.02 |
구글 API 사용하기[Google Cloud Platform 사용하기] (9) | 2017.01.30 |