PERFORMANCE ANALYSIS OF CLUSTERING MODELS BASED ON MACHINE LEARNING IN STUNTING DATA MAPPING

Masitah Handayani; Mustika Fitri Larasati Sibuea

doi:10.33330/jurteksi.v9i4.2770

Masitah Handayani Sekolah Tinggi Manajemen Informatika dan Komputer Royal
Mustika Fitri Larasati Sibuea Sekolah Tinggi Manajemen Informatika dan Komputer Royal

DOI: https://doi.org/10.33330/jurteksi.v9i4.2770

Abstract

Abstract: Stunting is one of the nutritional problems that the world pays the most attention to and a major nutritional problem in Indonesia. Stunting is a problem in toddler growth which is characterized by a toddler's height that is too short compared to toddlers of his age. In the research location, namely Asahan Regency, the mapping of areas prone to increased stunting rates has not been carried out optimally. The process of exploring the stunting data warehouse is useful for adding information that can assist the government in making policies. Therefore, the aim of this research is to map stunting-prone areas in Asahan district based on the number of stunting cases in Asahan district using the machine learning-based K-Means clustering model. Based on previous research reviews, the k-means clustering method used has not used the normalization process. In addition, distance measurement only uses Euclidean Distance. Meanwhile, in this research, clustering performance analysis was carried out using a more in-depth process, namely by applying data normalization at the beginning, using the elbow method to determine the best number of clusters (K), measuring distance using Euclidean Distance, Manhattan Distance and Minkowski Distance to obtain comparison results. better clusters. The analysis results show that the best number of clusters is cluster 2 which shows the mapping results into 2 groups with a DBI of 0.51290 and a silhouette_score of 0.71432.

Keywords: stunting; k-means clustering; machine learning

Abstrak: Stunting menjadi salah satu permasalahan gizi yang paling diperhatikan dunia dan permasalahan gizi yang utama di Indonesia. Stunting merupakan masalah pada pertumbuhan balita yang ditandai dengan tinggi badan balita yang terlalu pendek dibanding balita seusianya. Pada lokasi penelitian yaitu Kabupaten Asahan, pemetaan daerah rawan peningkatan angka stunting belum dilakukan dengan optimal. Proses eksplorasi gudang data stunting ini berguna untuk menambah informasi yang dapat membantu pemerintah dalam mengambil kebijakan. Maka dari itu, tujuan dari penelitian ini adalah pemetaan daerah rawan stunting di kabupaten Asahan berdasarkan jumlah kasus stunting di Kabupaten Asahan menggunakan model clustering metode K-Means berbasis machine learning. Berdasarkan tinjauan penelitian terdahulu, metode k-means clustering yang digunakan belum menggunakan proses normalisasi. Selain itu, pengukuran jarak hanya menggunakan Euclidean Distance. Sedangkan dalam penelitian ini, analisis kinerja clustering yang dilakukan dengan proses yang lebih mendalam yaitu dengan penerapan normalisasi data di awal, penggunaan elbow method untuk penentuan jumlah cluster (K) terbaik, pengukuran jarak dengan Euclidean Distance, Manhattan Distance dan Minkowski Distance untuk mendapatkan hasil perbandingan cluster yang lebih baik. Hasil analisis menunjukkan bahwa jumlah cluster terbaik yaitu cluster 2 yang menunjukkan hasil pemetaan menjadi 2 kelompok dengan DBI 0.51290 dan silhouette_score sebesar 0.71432.

Kata kunci: stunting; k-means clustering; machine learning

References

A. Fadilah, M. N. Pangestu, S. Lumbanbatu, and S. Defiyanti, â€œPengelompokan Kabupaten/Kota Di Indonesia Berdasarkan Faktor Penyebab Stunting Pada Balita Menggunakan Algoritma K-Means,â€ JIKO (Jurnal Inform. dan Komputer), vol. 6, no. 2, p. 223, 2022, doi: 10.26798/jiko.v6i2.581.

A. N. H. Yuni Nurâ€™afiah, â€œProgr-am â€˜ Gebrak Stunting â€™ sebagai Upaya Pencegahan Stunting di Desa Sukasenang Kecamatan Sindangkasih,â€ J. Kependudukan, Keluarga, dan Sumber Daya Mns., vol. 3, no. 1, pp. 1â€“13, 2022, doi: 10.37269/pancanaka.v3i1.106.

E. Retnoningsih and R. Pramudita, â€œMengenal Machine Learning Dengan Teknik Supervised Dan Unsupervised Learning Menggu-nakan Python,â€ Bina Insa. Ict J., vol. 7, no. 2, p. 156, 2020, doi: 10.51211/biict.v7i2.1422.

S. Sharma and P. Chaudhary, â€œMachine learning and deep learning,â€ Quantum Comput. Artif. Intell. Train. Mach. Deep Learn. Algorithms Quantum Comput., pp. 71â€“84, 2023, doi: 10.1515/9783-110791402-004.

J. Wei et al., â€œMachine learning in materials science,â€ InfoMat, vol. 1, no. 3, pp. 338â€“358, 2019, doi: 10.1002/inf2.12028.

Mahesh Batta, â€œMachine Learning Algorithms - A Review,â€ Int. J. Sci. Res., no. October, 2020, doi: 10.21275/ART20203995.

R. Muliono and Z. Sembiring, â€œData Mining Clustering Menggu-nakan Algoritma K-Means Untuk Klasterisasi Tingkat Tridarma Pengajaran Dosen,â€ CESS (Jour-nal Comput. Eng. Syst. Sci., vol. 4, no. 2, pp. 2502â€“714, 2019, doi: https://doi.org/10.24114/cess.v4i2.13620.

R. R. Syoer and Y. Wahyudin, â€œAnalisis Kelompok Dengan Algoritma Fuzzy Clustering (Studi Kasus Pengelompokkan Desa Di Provinsi Kalimantan Timur),â€ BESTARI Bul. Statisitika dan Apl. Terkini, vol. 1, pp. 1â€“11, 2021, [Online]. Available: https://besta-ri.bpskaltim.com/index.php/bestari-bpskaltim/article/view/1

H. Humaira and R. Rasyidah, â€œDetermining The Appropiate Cluster Number Using Elbow Method for K-Means Algorithm,â€ 2020, doi: 10.4108/eai.24-1-2018.2292388.

M. Cui, â€œIntroduction to the K-Means Clustering Algorithm Bas-ed on the Elbow Method,â€ Clausius Sci. Press, vol. 1, no. 1, pp. 5â€“8, 2020, doi: 10.23977-/accaf.2020.010102.

E. Schubert, â€œStop using the elbow criterion for k-means and how to choose the number of clusters instead,â€ ACM SIGKDD Explor. Newsl., vol. 25, no. 1, pp. 36â€“42, 2023, doi: 10.1145/360627-4.3606278.

S. K. Dirjen et al., â€œTerakreditasi SINTA Peringkat 2 Analisis Pengaruh Data Scaling Terhadap Performa Algoritme Machine Learning untuk Identifikasi Tanaman,â€ Masa Berlaku Mulai, vol. 1, no. 3, pp. 117â€“122, 2017.

S. Z. H. Rukmana, A. Aziz, and W. Harianto, â€œOptimasi Algoritma K-Nearest Neighbor (Knn) Deng-an Normalisasi Dan Seleksi Fitur Untuk Klasifikasi Penyakit Liver,â€ JATI (Jurnal Mhs. Tek. Inform., vol. 6, no. 2, pp. 439â€“445, 2022, doi:https://doi.org/10.36040/jati.v6i2.4722.

F. Sutomo et al., â€œOptimization Of The K-Nearest Neighbors Algorit-hm Using The Elbow Method On Stroke Prediction,â€ J. Tek. Inform., vol. 4, no. 1, pp. 125â€“130, 2023, doi:https://doi.org/10.20884/1.jutif.2023.4.1.839.

A. Winarta and W. J. Kurniawan, â€œOptimasi Cluster K-Means Me-nggunakan Metode Elbow pada Data Pengguna Narkoba dengan Pemrograman Python,â€ J. Tek. Inform. Kaputama, vol. 5, no. 1, pp. 113â€“119, 2021, [Online]. Available:http://jurnal.kaputama.ac.id/index.php/JTIK/article/view/466

A. Sulistiyawati and E. Supri-yanto, â€œImplementasi Algoritma K-means Clustring dalam Pene-tuan Siswa Kelas Unggulan,â€ J. Tekno Kompak, vol. 15, no. 2, p. 25, 2021, doi: 10.33365/jtk-.v15i2.1162.

S. Handoko, F. Fauziah, and E. T. E. Handayani, â€œImplementasi Data Mining Untuk Menentukan Tingkat Penjualan Paket Data Telkomsel Menggunakan Metode K-Means Clustering,â€ J. Ilm. Teknol. dan Rekayasa, vol. 25, no. 1, pp. 76â€“88, 2020, doi: 10.35760/tr.2020.v25i1.2677.