1. Pengenalan Visualisasi Data
- Tujuan:
- Memahami pola dan tren data.
- Mengidentifikasi outlier.
- Menyajikan informasi secara jelas.
- Tools:
- Matplotlib → fleksibel, kontrol detail grafik.
- Seaborn → berbasis Matplotlib, gaya lebih estetik dan sintaks ringkas.
2. Instalasi & Import Library
pip install matplotlib seaborn
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
3. Visualisasi dengan Matplotlib
- Grafik Garis (Line Plot)
plt.plot(df["tanggal"], df["penjualan"]) plt.title("Tren Penjualan") plt.xlabel("Tanggal") plt.ylabel("Penjualan") plt.show()
- Grafik Batang (Bar Chart)
plt.bar(df["produk"], df["penjualan"]) plt.title("Penjualan per Produk") plt.show()
- Histogram
plt.hist(df["usia"], bins=10, color="skyblue") plt.title("Distribusi Usia") plt.show()
4. Visualisasi dengan Seaborn
- Scatter Plot
sns.scatterplot(data=df, x="pendapatan", y="pengeluaran") plt.title("Pendapatan vs Pengeluaran") plt.show()
- Boxplot
sns.boxplot(data=df, x="kota", y="pendapatan") plt.title("Pendapatan per Kota") plt.show()
- Histogram & KDE
sns.histplot(df["usia"], kde=True) plt.title("Distribusi Usia") plt.show()
- Heatmap (Korelasi)
corr = df.corr() sns.heatmap(corr, annot=True, cmap="coolwarm") plt.title("Matriks Korelasi") plt.show()
5. Tips Membuat Grafik Informatif
- Gunakan judul yang jelas dan label sumbu.
- Pilih jenis grafik sesuai data:
- Tren → Line Plot
- Perbandingan kategori → Bar Plot
- Distribusi → Histogram / KDE
- Hubungan antar variabel → Scatter Plot
- Gunakan warna & style konsisten.
- Hindari informasi berlebihan.