Setelah proses pewarnaan melalui Coloration Supervisor, information dilanjutkan ke node Scatter Plot sebagai langkah inti dalam visualisasi information. Scatter Plot digunakan untuk menggambarkan hubungan antara PCA dimension 0 dengan masing-masing variabel asli, yaitu Pengeluaran, Penghasilan, dan Umur. Node ini memungkinkan pembuatan grafik dua dimensi yang menggabungkan informasi hasil PCA dengan label klaster dalam satu tampilan yang mudah dibaca.
Penggunaan Scatter Plot bertujuan untuk mengidentifikasi pola distribusi antar klaster berdasarkan variabel-variabel utama. Dengan visualisasi ini, perbedaan antar kelompok dapat diamati secara eksplisit melalui posisi titik-titik information dan warna yang merepresentasikan klaster. Hal ini tidak hanya mempermudah proses interpretasi hasil segmentasi, tetapi juga membantu dalam memahami kontribusi masing-masing variabel terhadap struktur klaster yang terbentuk.
a) Interpretasi Scatter Plot
- Scatter Plot 1: PCA dimension 0 dan Pengeluaran
Scatter plot pertama menampilkan hubungan antara PCA dimension 0 pada sumbu horizontal dan Pengeluaran pada sumbu vertikal. Titik-titik pada grafik diberi warna sesuai dengan hasil klasterisasi, yang telah ditentukan sebelumnya oleh node Coloration Supervisor. Visualisasi ini bertujuan untuk melihat sejauh mana dimensi utama dari PCA berkorelasi dengan variabel pengeluaran.
Berdasarkan pola yang terlihat, cluster_1 (warna merah muda) cenderung menempati sisi kanan atas grafik, mengindikasikan bahwa kelompok ini memiliki nilai PCA tinggi dan pengeluaran yang relatif besar. Sebaliknya, cluster_2 (warna kuning) lebih dominan di sisi kiri bawah grafik, yang berarti anggotanya memiliki dimensi PCA rendah serta pengeluaran yang kecil. Adapun cluster_0 (warna hijau) tersebar di tengah-tengah rentang nilai, menunjukkan variasi pengeluaran yang menengah dengan dimensi PCA yang moderat. Dengan demikian, dapat disimpulkan bahwa PCA dimension 0 secara efektif mencerminkan variasi dalam perilaku pengeluaran individu, dan mampu membedakan kelompok dengan karakteristik konsumsi yang berbeda.
- Scatter Plot 2: PCA dimension 0 dan Penghasilan
Scatter plot kedua menghubungkan PCA dimension 0 dengan variabel Penghasilan. Seperti sebelumnya, setiap titik berwarna sesuai label klaster, untuk mengamati distribusi masing-masing kelompok dalam konteks tingkat penghasilan. Visualisasi ini memungkinkan identifikasi kontribusi variabel ekonomi terhadap dimensi utama hasil PCA.
Pada grafik ini, terlihat bahwa cluster_1 (merah muda) mendominasi sisi kanan atas, yang menunjukkan bahwa anggota klaster ini memiliki penghasilan tinggi serta nilai PCA dimension 0 yang besar. Hal ini mengindikasikan bahwa variabel penghasilan berperan signifikan dalam membentuk dimensi utama information. Sebaliknya, cluster_2 (kuning) terkonsentrasi di bagian kiri bawah, yang berarti kelompok ini cenderung memiliki penghasilan rendah serta nilai dimensi utama yang juga rendah. Cluster_0 (hijau) terlihat tersebar di antara keduanya, menunjukkan kelompok dengan penghasilan menengah. Dengan demikian, penghasilan menjadi salah satu penentu utama dalam pemisahan klaster yang tercermin dari distribusi information pada scatter plot ini.
- Scatter Plot 3: PCA dimension 0 dan Umur
Scatter plot ketiga menggambarkan hubungan antara PCA dimension 0 dan variabel Umur. Visualisasi ini digunakan untuk mengevaluasi kontribusi faktor demografis terhadap hasil reduksi dimensi dan pembentukan klaster. Warna pada titik-titik information tetap mengikuti label klaster untuk memudahkan identifikasi pola antar kelompok.
Berdasarkan hasil scatter plot, cluster_2 (kuning) tampak cenderung menempati space sisi kiri atas grafik, yang menandakan bahwa kelompok ini umumnya terdiri dari individu dengan umur yang lebih tua dan nilai PCA dimension 0 yang rendah. Di sisi lain, cluster_1 (merah muda) terkonsentrasi di bagian kanan bawah, menunjukkan bahwa individu dalam kelompok ini cenderung lebih muda. Cluster_0 (hijau) tersebar di antara dua space tersebut, dengan rentang usia yang lebih bervariasi namun tetap berada dalam nilai dimensi utama yang sedang. Meskipun umur tidak memiliki kontribusi sebesar penghasilan atau pengeluaran dalam membentuk dimensi utama, informasi ini tetap relevan dalam memperkuat karakterisasi klaster berdasarkan faktor usia.
b) Rangkuman Visualisasi Scatter Plot
Dari ketiga scatter plot yang telah divisualisasikan, dapat disimpulkan bahwa proses segmentasi berbasis PCA dan Ok-Means mampu membedakan karakteristik utama individu dalam dataset. Scatter plot antara PCA dimension 0 dan variabel Pengeluaran menunjukkan pemisahan antar klaster yang paling tegas. Titik-titik information dari setiap klaster tampak membentuk space yang relatif terpisah, mengindikasikan bahwa variabel ini memiliki peran yang dominan dalam membedakan pola konsumsi antar individu.
Visualisasi antara PCA dimension 0 dan Penghasilan juga menunjukkan pemisahan klaster yang cukup jelas, meskipun tidak setegas variabel pengeluaran. Distribusi information mengindikasikan bahwa kelompok-kelompok dengan tingkat penghasilan berbeda cenderung membentuk pola tertentu dalam dimensi utama. Hal ini menunjukkan bahwa variabel penghasilan berkontribusi besar terhadap struktur klaster yang terbentuk, khususnya dalam menyoroti kapasitas ekonomi individu.
Sementara itu, scatter plot antara PCA dimension 0 dan Umur memperlihatkan distribusi klaster yang lebih menyebar dan tidak membentuk pola pemisahan yang tajam. Meskipun demikian, terdapat indikasi bahwa kelompok usia tertentu tetap memiliki kecenderungan untuk berkumpul dalam rentang dimensi tertentu. Ini menunjukkan bahwa variabel umur tetap berperan dalam proses segmentasi, meskipun kontribusinya tidak sekuat pengeluaran dan penghasilan.