Contoh Aplikasi Algoritma Unsupervised Learning dalam Dunia Kesehatan

Belajar Data Science di Rumah 03-Januari-2021

https://dqlab.id/files/dqlab/cache/12cd2f329e7e342d7e260dc4a53cad91_x_Thumbnail800.jpg

Di era modern, teknik machine learning dapat diterapkan di hampir semua bidang, termasuk di bidang kesehatan. Contoh aplikasi machine learning dalam dunia kesehatan untuk mendiagnosis suatu penyakit. Peningkatan penggunaan machine learning di dunia kesehatan disebabkan oleh semakin banyaknya dataset yang tersedia dan kemajuan IT. Pada dasarnya, algoritma machine learning dibagi menjadi dua, yaitu supervised dan unsupervised learning. Supervised learning adalah proses pembelajaran fungsi pemetaan untuk memetakan variable input ke variabel target. Istilah supervised dalam bahasa indonesia diartikan sebagai "diawasi". Istilah diawasi ini mengacu pada proses pelatihan algoritma yang diawasi karena kita sudah mengetahui hasil targetnya. Sedangkan jika kita hanya memiliki satu variabel dan tidak ada data yang diberi label, maka proses ini disebut dengan unsupervised learning.

Salah satu contoh algoritma unsupervised learning yang paling banyak digunakan adalah clustering. Clustering adalah proses pemisahan dan pengelompokan data menurut kesamaannya. Data yang berada di satu kelompok memiliki kesamaan sedangkan kelompok satu dengan yang lain sangat berbeda. Beberapa contoh penelitian medis yang menggunakan teknik clustering dalam unsupervised learning adalah diagnosis kanker payudara yang dilakukan oleh Chen pada tahun 2014, penelitian untuk mendiagnosis penyakit parkinson yang dilakukan oleh Polat pada tahun 2012 dan Nilashi pada tahun 2016, penelitian penyakit jantung dan diabetes oleh Yilmaz dan kawan-kawan pada tahun 2014, serta gangguan kesehatan mental dan kejiwaan yang dilakukan oleh Trevithick pada tahun 2016. Pada artikel kali ini DQLab telah merangkum algoritma-algoritma unsupervised learning yang bisa diaplikasikan di dunia kesehatan khusus untukmu. Jadi tunggu apa lagi? Yuk simak artikel ini sampai selesai!

1. Algoritma K-Means Clustering

Algoritma K-Means Clustering adalah metode unsupervised learning klasik. Output algoritma ini adalah memecah data observasi menjadi beberapa cluster sehingga setiap data masuk ke dalam cluster berdasarkan mean (rata-rata) terdekat. Contoh penerapan algoritma K-Means Clustering dilakukan oleh Escudero dan kawan-kawan pada tahun 2011 untuk mendiagnosis Alzheimer Disease dengan lima variabel, yaitu jumlah alel ApoE s4, ADAS-Cog (Alzheimer's Disease Assessment Scale-Cog), skor Mini-Mental State Examination (MMSE), MRI (magnetic resonance imaging), data CSF (cairan serebrospinal) dari kognitif normal (CN), dan MCI.

Pada tahun 2015, Prince dan kawan-kawan juga melakukan studi Alzheimer Disease menggunakan algoritma K-Means Clustering. Hasil studi ini menghasilkan tiga kelompok dengan karakteristik fenotipe domain-tunggal amnestik, domain tunggal diseksekutif, dan multi-domain. Pasien di cluster multi-domain memiliki gangguan bahasa yang lebih parah jika dibandingkan dengan pasien di cluster lain namun pasien di cluster multi-domain dan domain tungga diseksekutif sama-sama memiliki gangguan memori yang lebih buruk bila dibandingkan dengan pasien di cluster amnestik.

Studi terbaru dilakukan oleh Tosto dan kawan-kawan pada tahun 2016 dengan menerapkan algoritma K-Means Clustering pada 2502 pasien Alzheimer Disease dengan menggunakan variabel gangguan gerakan seperti ketidakstabilan postural, tremor dan kekakuan, kegelisahan tubuh, dan gaya berjalan abnormal, korelasi klinis dan neuropatologis. Studi ini menghasilkan tiga cluster yang diberi label beban ekstrapiramidal rendah, beban ekstrapiramidal sedang, dan beban ekstrapiramidal tinggi. Pasien dengan beban ekstrapiramidal tinggi memiliki gangguan kognitif dan neuropsikiatri yang lebih besar terutama halusinasi jika dibandingkan dengan pasien pada cluster lainnya.

2. Algoritma K-Means-Mode

Algoritma K-Means-Mode adalah algoritma unsupervised learning yang dapat menangani data numerik (kontinu) dan data kategorik. Setiap pusat cluster merupakan array means dan modus untuk data kontinu dan kategorik. Studi yang menggunakan teknik K-Means-Mode dilakukan oleh Paul dan Hoque pada tahun 2010 untuk memprediksi kemungkinan adanya penyakit pada sekelompok orang menggunakan dataset Zoo dari University of California at Irvine (UCI) Machine Learning Repository dan dataset diabetes. Hasil studi tersebut menunjukkan bahwa algoritma K-Means-Mode menghasilkan tingkat akurasi sebesar 95% sedangkan akurasi pada algoritma K-Means dan K-Mode hanya sebesar 65%. Oleh karena itu dapat disimpulkan bahwa algoritma K-Means-Mode lebih baik jika dibandingkan dengan algoritma K-Means dan K-Mode untuk proses clustering pada dataset Zoo dari University of California at Irvine (UCI) Machine Learning Repository dan dataset diabetes.

3. Hierarchical Agglomerative Clustering

Hierarchical Agglomerative Clustering adalah algoritma clustering dari bawah ke atas sehingga tiap titik data dibagi menjadi beberapa cluster lalu beberapa cluster tersebut digabung sehingga pada langkah terakhir hanya terdapat satu cluster saja. Algoritma ini diaplikasikan oleh Noh dan kawan-kawan untuk mengukur ketebalan kortikal pada 152 pasien yang memiliki Alzheimer Disease level awal menggunakan data MRI volumetrik T1-weighted resolusi tinggi. Studi yang dilakukan pada tahun 2014 ini menghasilkan tiga cluster. Cluster pertama yang diberi label A memiliki karakteristik atrofi bilateral medial temporal-dominan yang sebagian besar melibatkan korteks cingulate anterior dan posterior, cluster kedua (cluster B) memiliki ciri-ciri atrofi parietal-dominan yang melibatkan area parietal bilateral, precuneus, dan area frontal dorsolateral bilateral, dan cluster ketiga (cluster C) memiliki ciri-ciri atrofi difus, dimana hampir semua korteks asosiasi menunjukkan atrofi (kecuali untuk area orbitofrontal dan oksipital). Pasien dalam cluster B lebih muda dan memiliki level pendidikan yang lebih tinggi. Pasien pada cluster C memiliki rata-rata ketebalan kortikal terendah dan pasien pada cluster A memiliki skor tes kognitif paling rendah jika dibandingkan dengan pasien di cluster lain.

Seorang data scientist tidak hanya bekerja menggunakan ilmu data science tetapi juga menggunakan teknik machine learning. Data scientist sering menggunakan pendekatan hybrid untuk machine learning. Data science merupakan penggabungan dari ilmu statistika, matematika, dan ilmu komputer. Sama halnya dengan machine learning, data science juga dapat diaplikasikan di segala sektor. Uniknya ilmu ini dapat dipelajari oleh siapapun dengan background pendidikan apapun.

4. Yuk, Mulai Belajar Data Science bersama DQLab secara GRATIS!

Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi! Sign up sekarang untuk #MulaiBelajarData di DQLab!

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

Buat Akun Gratis dengan Signup di DQLab.id/signup
Akses module Introduction to Data Science
Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
Subscribe DQLab.id untuk Akses Semua Module Premium!

Penulis: Galuh Nurvinda Kurniawati

Editor: Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Contoh Aplikasi Algoritma Unsupervised Learning dalam Dunia Kesehatan

1. Algoritma K-Means Clustering

2. Algoritma K-Means-Mode

3. Hierarchical Agglomerative Clustering

4. Yuk, Mulai Belajar Data Science bersama DQLab secara GRATIS!

Tags

Mulai Kariersebagai PraktisiData BersamaDQLab

Daftar Gratis & Mulai Belajar

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab