데이터 시각화란?
말 그대로 데이터를 시각적인 형태로 표현하는 것.
데이터를 그래프, 차트, 지도 등 시각적인 도구를 사용해 표현함으로써 패턴, 추세, 상관관계 등을 좀 더 쉽게 파악할 수 있도록 해준다.
python에서 자주 사용되는 라이브러리는 Matplotlib, Seaborn, Plotly가 있다.
Matplotlib
Matplotlib documentation — Matplotlib 3.8.2 documentation
Matplotlib 3.8.2 documentation Matplotlib is a comprehensive library for creating static, animated, and interactive visualizations. Install For more detailed instructions, see the installation guide. Learn What's new Contribute About us
matplotlib.org
Matplotlib은 가장 기본적이고 범용적으로 사용되는 시각화 라이브러리.
장점
- 다양한 그래픽 유형을 지원
- 문서화가 잘 되어있음
- 다양한 커스터마이징이 가능
단점
- 간단하게 사용하는 것은 쉽지만 좀 더 깊게 사용하기 위해선 러닝 커브가 높을 수 있음
Seaborn
seaborn: statistical data visualization — seaborn 0.13.1 documentation
seaborn: statistical data visualization
seaborn.pydata.org
Matplotlib을 기반으로 한 고수준 인터페이스를 제공하는 라이브러리.
장점
- 더 예쁜 디자인
- 간단한 사용법
단점
- 상대적으로 부족한 커스터마이징
Plotly
Plotly
Plotly's
plotly.com
웹 기반의 시각화를 위한 라이브러리.
장점
- 웹에서 동적인 시각화를 구현할 수 있음
- 다양한 차트 유형과 3D 차트를 지원
단점
- 비교적 복잡한 코드
결론
간단하고 이쁘게 차트를 생성하려면 Seaborn을 사용.
취향에 맞게 커스터마이징을 해야한다면 Matplotlib 사용.
웹에서 데이터 시각화가 필요하다면 Plotly 사용.
'프로그래밍' 카테고리의 다른 글
[linux] 기본적인 명령어 정리 (0) | 2024.01.19 |
---|---|
[Node.js] npm init & package.json (0) | 2024.01.18 |
[linux] debian 12에서 wkhtmltopdf를 이용해 cli 환경에서 html을 pdf로 변환하기 (한글 깨짐 수정) (1) | 2024.01.12 |
[python] Failed building wheel for pillow Error (0) | 2024.01.10 |
[Network] TLS Handshake에 대한 정리 (2) | 2024.01.09 |