Algoritma Decision Tree Dan Smote Untuk Klasifikasi Serangan Jantung Miokarditis Yang Imbalance

Authors

  • Novanto Yudistira Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya
  • Aldi Fianda Putra Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya

DOI:

https://doi.org/10.51402/jle.v2i2.48

Keywords:

algorithm, classification, dataset, evaluation , myocardial infarction

Abstract

Serangan jantung atau dalam medis bernama Myocardial Infarction atau infark miokard adalah gangguan jantung yang sangat serius. Dalam pendeteksian ini menggunakan komplikasi-komplikasi yang diderita oleh pasien. Algoritma yang akan dievaluasi yaitu Naive Bayes, Decision Tree, dan Support Vector Machine. Namun tidak serta merta dapat dilakukan evaluasi. Sebelum mengevaluasi ketiga algoritma ini dilakukan perbaikan dataset, karena pada dataset ini sendiri terdapat data yang kosong. Perbaikan dilakukan dengan cara mengimputasikan data dimana nilai diperkirakan berdasarkan rata-rata dari anggota klaster pada kelas yang sama. Setelah melakukan imputasi data, maka dapat dilakukan normalisasi dengan metode MinMax dengan tujuan agar rentang fitur terutama data numerik kontinu tidak terlalu besar. Setelah pemrosesan data awal dilakukan maka barulah kita dapat melakukan evaluasi dengan menggunakan metode K-fold Cross Validation. Namun lagi-lagi ditemukan kesalahan yakni data latih yang digunakan ternyata tidak seimbang. Oleh sebab itu dilakukan oversampling pada data agar data menjadi seimbang. Setelah seimbang maka kita dapat melakukan evaluasi kembali dan diperolehlah algoritma yang cocok untuk mengklasifikasikan data seperti dataset Myocardial Infarction Complications adalah algoritma Decision Tree dengan akurasi 98%, diikuti algoritma Support Vector Machine dengan akurasi 91% dan Naïve Bayes dengan akurasi paling rendah yakni 49%.

References

GOLOVENKIN, S.E., GORBAN, A.N., MIRKES, E.M., 2020. Myocardial infarction complications Data Set. [online] Available at: <https://archive.ics.uci.edu/ml/datasets/Myocardial+infarction+complications> [Accessed 6 May 2021].

DARAEI, A., HAMIDI, H., 2017. An Efficient Predictive Model for Myocardial Infarction Using Cost-sensitive J48 Model. [online] Available at: <https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5442282/> [Accessed 7 May 2021].

KINYANJUI, Y., 2018. LEARNING THE EKG. [online] Available at: <https://slideplayer.com/slide/12255891/> [Accessed 7 May 2021].

LARKIN, J., 2021. QRS Interval. [online] Available at: <https://litfl.com/qrs-interval-ecg-library/> [Accessed 7 May 2021].

ZAFARI, A.M., 2019. Myocardial Infarction. [online] Available at: <https://emedicine.medscape.com/article/155919-overview> [Accessed 7 May 2021].

GOLOVENKIN, S.E., GORBAN, A., MIRKES, E., SHULMAN, V.A., ROSSIEV, D.A., SHESTERNYA, P.A., NIKULINA, S.YU., ORLOVA, YU.V., DORRER, M.G., 2020. Myocardial infarction complications Database. [online] Available at: <https://leicester.figshare.com/articles/dataset/Myocardial_infarction_complications_Database/12045261/3> [Accessed 7 May 2021].

BURNS, E., BUTTNER, R., 2021. LEFT BUNDLE BRANCH BLOCK(LBBB). [online] Available at:<https://litfl.com/left-bundle-branch-block-lbbb-ecg-library/> [Accessed 7 May 2021].

WORLD HEALTH ORGANIZATION. (2021). Cardiovascular diseases (CVDs), World Health Organization (WHO).

EVRIYANTO, Y., 2004. Thesis projects: PERBANDINGAN METODE IMPUTASI UNTUK MENGESTIMASI DATA HILANG PADA DATA KESEHATAN IBU DAN ANAK DI JAWA TIMUR. Surabaya: Perpustakaan Universitas Airlangga.

RUMAGIT, R.Y., 2019. Imbalanced Dataset. [online] Available at: <https://socs.binus.ac.id/2019/12/26/imbalanced-dataset/> [Accessed 7 May 2021].

SARTONO, B., 2018. Oversampling dan Undersampling. [online] Available at: <http://bagusco.staff.ipb.ac.id/2018/01/08/kelas-tidak-seimbang-part2/> [Accessed 7 May 2021].

ARTHANA, R., 2019. Mengenal Accuracy, Precision, Recall dan Specificity serta yang diprioritaskan dalam Machine Learning. [online] Available at: <https://rey1024.medium.com/mengenal-accuracy-precission-recall-dan-specificity-serta-yang-diprioritaskan-b79ff4d77de8> [Accessed 7 May 2021].

NORAZIAN, M.N., SHUKRI, Y.A., AZAM, R.N., AL BAKRI,A.M.M., 2008. Estimation of missing values in air pollution data using single imputation techniques. [e-journal] 34(2). p.343. Available at: <http://103.86.130.60/handle/123456789/6612> [Accessed 7 May 2021].

BROWNLEE, J., 2019. SMOTE for Imbalanced Classification with Python. [online] Available at: <https://machinelearningmastery.com/smote-oversampling-for-imbalanced-classification/> [Accessed 7 May 2021].

FADLI, R., 2021. Serangan Jantung. [online] Available at: < https://www.halodoc.com/kesehatan/serangan-jantung> [Accessed 7 May 2021].

PANE, M.D.C., 2020. Syok Kardiogenik. [online] Available at: < https://www.alodokter.com/syok-kardiogenik> [Accessed 7 May 2021].

Downloads

Published

2021-12-31

How to Cite

Yudistira, N. ., & Putra, A. F. . (2021). Algoritma Decision Tree Dan Smote Untuk Klasifikasi Serangan Jantung Miokarditis Yang Imbalance. Jurnal Litbang Edusaintech, 2(2), 112-122. https://doi.org/10.51402/jle.v2i2.48

Most read articles by the same author(s)