본문 바로가기
Python/matplotlib

파이썬 matplotlib.pyplot.scatter 함수 활용하기

by PySun 2024. 10. 26.
반응형

matplotlib.pyplot.scatter 함수: 멋진 산점도로 데이터 시각화하기

데이터를 시각적으로 표현하는 것은 우리의 통찰력을 자극하는 중요한 요소입니다. 이때 matplotlib 라이브러리의 pyplot.scatter 함수가 등장합니다. 이 포스팅에서는 pyplot.scatter 함수의 매력과 사용법을 소개합니다.

pyplot.scatter 함수 소개

pyplot.scatter 함수는 2차원 데이터 포인트를 산점도로 시각화할 수 있게 해주는 함수입니다. 이 함수는 각 포인트의 위치뿐만 아니라 크기, 색상, 투명도를 조절하여 더욱 풍부한 정보를 전달할 수 있도록 도와줍니다.

함수 시그니처

matplotlib.pyplot.scatter(x, y, s=None, c=None, alpha=None, figsize=None)

매개변수:

  • x: x축 데이터 값의 배열입니다.
  • y: y축 데이터 값의 배열입니다.
  • s: 각 포인트의 크기를 나타내는 배열입니다. (선택적)
  • c: 각 포인트의 색상을 지정하는 배열입니다. (선택적)
  • alpha: 투명도를 설정하는 값입니다. (0은 완전 투명, 1은 불투명) (선택적)
  • figsize: 그림의 크기를 설정하는 튜플입니다. (선택적)

반환 값:

  • 산점도를 그린 후 PathCollection 객체를 반환합니다.

사용 예제

기본 예제

다음은 pyplot.scatter 함수를 사용하여 기본적인 산점도를 그리는 예제입니다.

import matplotlib.pyplot as plt
import numpy as np

# 데이터 생성
np.random.seed(0)
x = np.random.rand(50)
y = np.random.rand(50)

# 산점도 그리기
plt.scatter(x, y)
plt.title("기본 산점도")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
plt.show()

색상과 크기 조절 예제

이번에는 각 포인트의 색상과 크기를 조절하여 더욱 멋진 시각화를 만들어 볼까요?

import matplotlib.pyplot as plt
import numpy as np

# 데이터 생성
np.random.seed(0)
x = np.random.rand(100)
y = np.random.rand(100)
colors = np.random.rand(100)  # 0부터 1사이의 랜덤 색상
sizes = 1000 * np.random.rand(100)  # 랜덤 크기

# 산점도 그리기
plt.scatter(x, y, c=colors, s=sizes, alpha=0.5, cmap='viridis')
plt.title("색상과 크기 조절된 산점도")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
plt.colorbar(label='Color Scale')
plt.show()

결론

pyplot.scatter 함수는 데이터 분석에서 매우 유용한 도구입니다. 산점도를 통해 데이터의 관계를 시각적으로 파악할 수 있으며, 다양한 속성과 스타일을 통해 정보를 효과적으로 전달할 수 있습니다. 이제 여러분도 손쉽게 산점도를 활용하여 데이터의 매력을 발견해 보세요!

  • 산점도로 데이터의 숨겨진 패턴을 찾아보세요!
  • 작품처럼 데이터를 시각화하여 더 많은 이야기를 전달해보세요!
반응형