ANALISIS KLASIFIKASI KANKER PAYUDARA MENGGUNAKAN ALGORITMA RANDOM FOREST

Penulis

  • Henny Wahyu Sulistyo Universitas Muhammadiyah Jember
  • Hardian Oktavianto Universitas Muhammadiyah Jember

Kata Kunci:

klasifikasi, kanker payudara, naive bayes

Abstrak

Kanker payudara dianggap sebagai penyakit paling umum di antara wanita di seluruh dunia. Kanker terdiri dari sel-sel abnormal dalam tubuh manusia yang berpotensi menyebar ke bagian tubuh lain daripada bagian yang terkena. Machine Learning menghadirkan keunggulan signifikan dibandingkan ahli patologi, Random Forest merupakan salah satu metode pada machine learning yang digunakan untuk menyelesaikan permasalahan klasifikasi. Metode ini merupakan metode pohon gabungan yang berasal dari metode classification and regression tree dan didasarkan pada teknik pohon keputusan, sehingga mampu mengatasi masalah non-linier. Pada penelitian ini akan melakukan analisis penerapan algoritma random forest pada klasifikasi penyakit kanker payudara. Nilai akurasi menggunakan k-fold cross validation mempunyai nilai terendah 95% dan nilai tertinggi 96%, sedangkan nilai akurasi menggunakan percentage split mempunyai nilai terendah 94% dan nilai tertinggi 97%. Nilai presisi menggunakan k-fold cross validation mempunyai nilai terendah 96% dan nilai tertinggi 97%, sedangkan nilai presisi menggunakan percentage split mempunyai nilai terendah 94% dan nilai tertinggi 98%. Nilai recall menggunakan k-fold cross validation mempunyai nilai terendah 96% dan nilai tertinggi 97%, sedangkan nilai presisi menggunakan percentage split mempunyai nilai terendah 94% dan nilai tertinggi 98%. Secara nilai rata - rata, maka nilai akurasi dan presisi ketika menggunakan percentage split lebih tinggi, sedangkan nilai recall lebih tinggi ketika menggunakan k-fold cross validation. Skenario pembagian data baik menggunakan k-fold cross validation dengan percentage split menghasilkan nilai akurasi, presisi, dan recall yang relatif sama sehingga bisa dikatakan tidak ada perbedaan yang signifikan apabila menerapkan pembagian data latih dan data uji menggunakan k-fold cross validation maupun percentage split.

Diterbitkan

2020-02-17

Terbitan

Bagian

Articles