PERFORMANCE ANALYSIS OF CLUSTERING MODELS BASED ON MACHINE LEARNING IN STUNTING DATA MAPPING

Masitah Handayani, Mustika Fitri Larasati Sibuea

Abstract


Abstract: Stunting is one of the nutritional problems that the world pays the most attention to and a major nutritional problem in Indonesia. Stunting is a problem in toddler growth which is characterized by a toddler's height that is too short compared to toddlers of his age. In the research location, namely Asahan Regency, the mapping of areas prone to increased stunting rates has not been carried out optimally. The process of exploring the stunting data warehouse is useful for adding information that can assist the government in making policies. Therefore, the aim of this research is to map stunting-prone areas in Asahan district based on the number of stunting cases in Asahan district using the machine learning-based K-Means clustering model. Based on previous research reviews, the k-means clustering method used has not used the normalization process. In addition, distance measurement only uses Euclidean Distance. Meanwhile, in this research, clustering performance analysis was carried out using a more in-depth process, namely by applying data normalization at the beginning, using the elbow method to determine the best number of clusters (K), measuring distance using Euclidean Distance, Manhattan Distance and Minkowski Distance to obtain comparison results. better clusters. The analysis results show that the best number of clusters is cluster 2 which shows the mapping results into 2 groups with a DBI of 0.51290 and a silhouette_score of 0.71432.

 

Keywords: stunting; k-means clustering; machine learning

 

Abstrak: Stunting menjadi salah satu permasalahan gizi yang paling diperhatikan dunia dan permasalahan gizi yang utama di Indonesia. Stunting merupakan masalah pada pertumbuhan balita yang ditandai dengan tinggi badan balita yang terlalu pendek dibanding balita seusianya. Pada lokasi penelitian yaitu Kabupaten Asahan, pemetaan daerah rawan peningkatan angka stunting belum dilakukan dengan optimal. Proses eksplorasi gudang data stunting ini berguna untuk menambah informasi yang dapat membantu pemerintah dalam mengambil kebijakan. Maka dari itu, tujuan dari penelitian ini adalah pemetaan daerah rawan stunting di kabupaten Asahan berdasarkan jumlah kasus stunting di Kabupaten Asahan menggunakan model clustering metode K-Means berbasis machine learning. Berdasarkan tinjauan penelitian terdahulu, metode k-means clustering yang digunakan belum menggunakan proses normalisasi. Selain itu, pengukuran jarak hanya menggunakan Euclidean Distance. Sedangkan dalam penelitian ini, analisis kinerja clustering yang dilakukan dengan proses yang lebih mendalam yaitu dengan penerapan normalisasi data di awal, penggunaan elbow method untuk penentuan jumlah cluster (K) terbaik, pengukuran jarak dengan Euclidean Distance, Manhattan Distance dan Minkowski Distance untuk mendapatkan hasil perbandingan cluster yang lebih baik. Hasil analisis menunjukkan bahwa jumlah cluster terbaik yaitu  cluster 2 yang menunjukkan hasil pemetaan menjadi 2 kelompok dengan DBI 0.51290 dan silhouette_score sebesar 0.71432.

 

Kata kunci: stunting; k-means clustering; machine learning


Full Text:

PDF

References


A. Fadilah, M. N. Pangestu, S. Lumbanbatu, and S. Defiyanti, “Pengelompokan Kabupaten/Kota Di Indonesia Berdasarkan Faktor Penyebab Stunting Pada Balita Menggunakan Algoritma K-Means,” JIKO (Jurnal Inform. dan Komputer), vol. 6, no. 2, p. 223, 2022, doi: 10.26798/jiko.v6i2.581.

A. N. H. Yuni Nur’afiah, “Progr-am ‘ Gebrak Stunting ’ sebagai Upaya Pencegahan Stunting di Desa Sukasenang Kecamatan Sindangkasih,” J. Kependudukan, Keluarga, dan Sumber Daya Mns., vol. 3, no. 1, pp. 1–13, 2022, doi: 10.37269/pancanaka.v3i1.106.

E. Retnoningsih and R. Pramudita, “Mengenal Machine Learning Dengan Teknik Supervised Dan Unsupervised Learning Menggu-nakan Python,” Bina Insa. Ict J., vol. 7, no. 2, p. 156, 2020, doi: 10.51211/biict.v7i2.1422.

S. Sharma and P. Chaudhary, “Machine learning and deep learning,” Quantum Comput. Artif. Intell. Train. Mach. Deep Learn. Algorithms Quantum Comput., pp. 71–84, 2023, doi: 10.1515/9783-110791402-004.

J. Wei et al., “Machine learning in materials science,” InfoMat, vol. 1, no. 3, pp. 338–358, 2019, doi: 10.1002/inf2.12028.

Mahesh Batta, “Machine Learning Algorithms - A Review,” Int. J. Sci. Res., no. October, 2020, doi: 10.21275/ART20203995.

R. Muliono and Z. Sembiring, “Data Mining Clustering Menggu-nakan Algoritma K-Means Untuk Klasterisasi Tingkat Tridarma Pengajaran Dosen,” CESS (Jour-nal Comput. Eng. Syst. Sci., vol. 4, no. 2, pp. 2502–714, 2019, doi: https://doi.org/10.24114/cess.v4i2.13620.

R. R. Syoer and Y. Wahyudin, “Analisis Kelompok Dengan Algoritma Fuzzy Clustering (Studi Kasus Pengelompokkan Desa Di Provinsi Kalimantan Timur),” BESTARI Bul. Statisitika dan Apl. Terkini, vol. 1, pp. 1–11, 2021, [Online]. Available: https://besta-ri.bpskaltim.com/index.php/bestari-bpskaltim/article/view/1

H. Humaira and R. Rasyidah, “Determining The Appropiate Cluster Number Using Elbow Method for K-Means Algorithm,” 2020, doi: 10.4108/eai.24-1-2018.2292388.

M. Cui, “Introduction to the K-Means Clustering Algorithm Bas-ed on the Elbow Method,” Clausius Sci. Press, vol. 1, no. 1, pp. 5–8, 2020, doi: 10.23977-/accaf.2020.010102.

E. Schubert, “Stop using the elbow criterion for k-means and how to choose the number of clusters instead,” ACM SIGKDD Explor. Newsl., vol. 25, no. 1, pp. 36–42, 2023, doi: 10.1145/360627-4.3606278.

S. K. Dirjen et al., “Terakreditasi SINTA Peringkat 2 Analisis Pengaruh Data Scaling Terhadap Performa Algoritme Machine Learning untuk Identifikasi Tanaman,” Masa Berlaku Mulai, vol. 1, no. 3, pp. 117–122, 2017.

S. Z. H. Rukmana, A. Aziz, and W. Harianto, “Optimasi Algoritma K-Nearest Neighbor (Knn) Deng-an Normalisasi Dan Seleksi Fitur Untuk Klasifikasi Penyakit Liver,” JATI (Jurnal Mhs. Tek. Inform., vol. 6, no. 2, pp. 439–445, 2022, doi:https://doi.org/10.36040/jati.v6i2.4722.

F. Sutomo et al., “Optimization Of The K-Nearest Neighbors Algorit-hm Using The Elbow Method On Stroke Prediction,” J. Tek. Inform., vol. 4, no. 1, pp. 125–130, 2023, doi:https://doi.org/10.20884/1.jutif.2023.4.1.839.

A. Winarta and W. J. Kurniawan, “Optimasi Cluster K-Means Me-nggunakan Metode Elbow pada Data Pengguna Narkoba dengan Pemrograman Python,” J. Tek. Inform. Kaputama, vol. 5, no. 1, pp. 113–119, 2021, [Online]. Available:http://jurnal.kaputama.ac.id/index.php/JTIK/article/view/466

A. Sulistiyawati and E. Supri-yanto, “Implementasi Algoritma K-means Clustring dalam Pene-tuan Siswa Kelas Unggulan,” J. Tekno Kompak, vol. 15, no. 2, p. 25, 2021, doi: 10.33365/jtk-.v15i2.1162.

S. Handoko, F. Fauziah, and E. T. E. Handayani, “Implementasi Data Mining Untuk Menentukan Tingkat Penjualan Paket Data Telkomsel Menggunakan Metode K-Means Clustering,” J. Ilm. Teknol. dan Rekayasa, vol. 25, no. 1, pp. 76–88, 2020, doi: 10.35760/tr.2020.v25i1.2677.




DOI: https://doi.org/10.33330/jurteksi.v9i4.2770

Article Metrics

Abstract view : 411 times
PDF - 290 times

Refbacks

  • There are currently no refbacks.


Lembaga Penelitian dan Pengabdian Kepada Masyarakat (LPPM) STMIK ROYAL 

Copyright © LPPM STMIK ROYAL

 

Lisensi Creative Commons
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi-BerbagiSerupa 4.0 Internasional.