Background Image

Postingan

Visualisasi Data Awal dengan Matplotlib dan Seaborn: Membuat Grafik yang Informatif

proses menyajikan data mentah dalam bentuk grafik atau diagram di tahap awal analisis, dengan tujuan: Memahami struktur data.

Gambar  Visualisasi Data Awal dengan Matplotlib dan Seaborn: Membuat Grafik yang Informatif

1. Pengenalan Visualisasi Data

  • Tujuan:
    • Memahami pola dan tren data.
    • Mengidentifikasi outlier.
    • Menyajikan informasi secara jelas.
  • Tools:
    • Matplotlib → fleksibel, kontrol detail grafik.
    • Seaborn → berbasis Matplotlib, gaya lebih estetik dan sintaks ringkas.

2. Instalasi & Import Library

pip install matplotlib seaborn


import matplotlib.pyplot as plt import seaborn as sns import pandas as pd

3. Visualisasi dengan Matplotlib

  • Grafik Garis (Line Plot)
  • plt.plot(df["tanggal"], df["penjualan"])
    
    plt.title("Tren Penjualan")
    
    plt.xlabel("Tanggal")
    
    plt.ylabel("Penjualan")
    
    plt.show()
    
    
  • Grafik Batang (Bar Chart)
  • plt.bar(df["produk"], df["penjualan"])
    
    plt.title("Penjualan per Produk")
    
    plt.show()
    
    
  • Histogram
  • plt.hist(df["usia"], bins=10, color="skyblue")
    
    plt.title("Distribusi Usia")
    
    plt.show()
    
    

4. Visualisasi dengan Seaborn

  • Scatter Plot
  • sns.scatterplot(data=df, x="pendapatan", y="pengeluaran")
    
    plt.title("Pendapatan vs Pengeluaran")
    
    plt.show()
    
    
  • Boxplot
  • sns.boxplot(data=df, x="kota", y="pendapatan")
    
    plt.title("Pendapatan per Kota")
    
    plt.show()
    
    
  • Histogram & KDE
  • sns.histplot(df["usia"], kde=True)
    
    plt.title("Distribusi Usia")
    
    plt.show()
    
    
  • Heatmap (Korelasi)
  • corr = df.corr()
    
    sns.heatmap(corr, annot=True, cmap="coolwarm")
    
    plt.title("Matriks Korelasi")
    
    plt.show()
    
    

5. Tips Membuat Grafik Informatif

  • Gunakan judul yang jelas dan label sumbu.
  • Pilih jenis grafik sesuai data:
    • Tren → Line Plot
    • Perbandingan kategori → Bar Plot
    • Distribusi → Histogram / KDE
    • Hubungan antar variabel → Scatter Plot
  • Gunakan warna & style konsisten.
  • Hindari informasi berlebihan.

Postingan Terkait