Pengertian Umum
Eksplorasi Data Lanjutan (Advanced Data Exploration) adalah proses menganalisis data secara lebih mendalam menggunakan teknik statistik untuk menemukan pola, tren, anomali, atau hubungan yang tidak terlihat pada analisis awal.
Tujuan utamanya:
- Mengidentifikasi hubungan antar variabel.
- Menemukan pola tersembunyi dalam data.
- Menjadi dasar untuk pemodelan prediktif atau machine learning.
Langkah-Langkah Eksplorasi Data Lanjutan
- Statistik Deskriptif Lanjutan
- Mean, Median, Modus
- Variansi, Standar Deviasi
- Skewness (kemiringan distribusi) & Kurtosis (puncak distribusi)
- Analisis Korelasi
- Korelasi Pearson (hubungan linear)
- Korelasi Spearman/Kendall (hubungan non-linear/ordinal)
- Heatmap korelasi untuk visualisasi hubungan variabel
- Analisis Outlier
- Boxplot, Z-score, IQR (Interquartile Range)
- Mengidentifikasi nilai ekstrim yang mempengaruhi model
- Uji Hipotesis
- Uji t-test, ANOVA (perbedaan rata-rata)
- Uji Chi-Square (hubungan antar kategori)
- Menentukan apakah pola signifikan secara statistik
- Reduksi Dimensi
- PCA (Principal Component Analysis) untuk menemukan pola tersembunyi
- Clustering (K-Means, DBSCAN) untuk segmentasi data
Tujuan Akhir
- Menemukan insight yang tidak langsung terlihat pada analisis awal.
- Mempersiapkan data untuk pemodelan lanjutan.
- Membantu pengambilan keputusan berbasis data.