PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

0 Hari 1 Jam 48 Menit 10 Detik

Jenis Algoritma Machine Learning untuk Text Mining

Belajar Data Science di Rumah 19-Juli-2022
https://dqlab.id/files/dqlab/cache/f98ffd5af6a859e2690e54e17ac7e6b9_x_Thumbnail800.jpg

Tujuan dari ilmu data science adalah untuk memecahkan pola serta kesimpulan dibalik sekumpulan dataset yang tersedia agar bisa lebih bermanfaat untuk kebutuhan bisnis. Dalam mencapai tujuan tersebut dalam ilmu data science kamu juga akan mempelajari tentang jenis algoritma machine learning


Dengan machine learning kamu akan belajar tentang bagaimana cara mesin dapat belajar dengan sendirinya sehingga dapat melakukan tertentu tanpa terprogram secara eksplisit. Algoritma machine learning juga sering digunakan untuk kasus seperti text mining. Text mining sendiri adalah suatu proses pengolahan data yang berbentuk teks dan termasuk dalam jenis unstructured data.


Oleh karena itu, data tidak terstruktur tersebut perlu diolah agar bisa dilakukan pengkategorian.  Text mining merupakan tahap penting untuk menemukan pola atau pengetahuan dari keseluruhan teks. Terdapat beberapa tahapan proses dalam text mining, yaitu text, text preprocessing / text transformation, feature generation, feature selection, dan pattern discovery sebelum akhirnya data tersebut melalui tahap pemodelan dengan menggunakan algoritma machine learning. 


Nah, penasaran kira-kira jenis algoritma machine learning apa saja yang bisa kamu coba untuk proyek text mining kamu? Yuk, simak artikel dibawah ini.


1. Support Vector Machine (SVM)

machine learning

Dikembangkan oleh Boser, Guyin dan Vapnik, SVM (Suppoert Vector Machine) pertamakali di presentasikan di tahun 1992. Dimana konsep dasarnya merupakan kombinasi dari berbagai teori komputasi contohnya seperti hyperplane, kernel, dan masih banyak lagi yang memang telah dikenal sejak puluhan tahun yang lalu. SVM termasuk kedalam jenis algoritma supervised learning karena untuk dapat melihat pola suatu data harus diberikan di training terlebih dahulu. 


Karena dengan model SVM kita dapat melakukan plotting pada setiap item data sebagai titik dalam ruang n-dimensi (dimana n adalah jumlah fitur yang kita miliki) dengan nilai di setiap fitur tersebut menjadi nilai koordinat tertentu.


SVM memang cenderung tidak cocok digunakan untuk jumlah sampel berskala besar, serta SVM baru bisa dikembangkan untuk pengklasifikasian dua class atau lebih saja sedangkan untuk kasus multiclass problem masih dalam tahap penelitian.


Baca juga : Yuk Kenali Macam-Macam Algoritma Machine Learning!


2. Naive Bayes Classifier

Sesuai dengan namanya, Naive bayes ditemukan oleh ilmuwan Inggris bernama Thomas Bayes. Dimana algoritma ini termasuk dalam metode klasifikasi yang memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. 


Ciri utama medoe ini adalah asumsi yang sangat kuat (naif) akan independensi dari masing-masing kondisi/kejadian. Naive bayes juga cocok untuk klasifikasi biner hingga multiclass, termasuk dalam supervised learning bekerja untuk mengklasifikasikan objek di masa depan dengan menerapkan label kelas ke instance menggunakan probabilitas bersyarat, yakni suatu ukuran peluang suatu peristiwa berdasarkan peristiwa lain yang telah terjadi. 


Tak heran banyak peneliti yang menggunakan metode naive bayes classifier untuk menulis jurnal tentang text mining.

machine learning


3. KNN

machine learning

Algoritma KNN atau sering disebut K-Nearest Neighbor merupakan algoritma yang melakukan klasifikasi berdasarkan kedekatan jarak suatu data dengan data yang lain. Dekat atau jauh suatu jarak dihitung berdasarkan jarak Euclidean. KNN merupakan salah satu algoritma non parametrik yang digunakan dalam pengklasifikasian. Selain naive bayes, algoritma KNN juga menjadi algoritma pengklasifikasian yang terkenal dengan tingkat keakuratan yang baik. 


Keuntungan dari algoritma KNN adalah sangat nonlinear, lebih mudah dipahami dan diimplementasikan karena kita cukup mendefinisikan fungsi untuk menghitung jarak antar-instance, menghitung jarak x dengan semua instance lainnya berdasarkan fungsi tersebut dan menentukan kelas x sebagai kelas yang paling banyak muncul di k-instance.


Baca juga : Kenali Algoritma Klasifikasi Machine Learning Terpopuler di Tahun 2021


4. Decision Tree

Algoritma Decision Tree merupakan salah satu algoritma Supervised Learning paling populer yang digunakan saat ini. Tidak seperti algoritma Supervised Learning lainnya, algoritma Decision Tree dapat digunakan untuk memecahkan masalah regresi dan klasifikasi juga. 


Tujuan algoritma Decision Tree untuk membuat model pelatihan yang dapat digunakan untuk memprediksi kelas atau nilai variabel target dengan mempelajari aturan keputusan sederhana yang disimpulkan dari data training (data pelatihan). Dengan Decision Tree untuk memprediksi label kelas untuk catatan kita mulai dari root node, kemudian node tersebut bercabang untuk menyatakan pilihan-pilihan yang ada.  


Algoritma Decision Tree memiliki tiga elemen yaitu, root node yang merupakan goals dari pengambilan keputusan, branches yang merupakan berbagai pilihan tindakan, serta leaf node kemungkinan dari masing-masing tindakan. Adapun jenis Decision Tree berdasarkan variabel target yang dimiliki dibagi atas dua jenis antara lain: Categorical Variable, dan Continuous Variable. 

machine learning

machine learning


Gimana sahabat DQ? Ngga perlu khawatir jika kamu belum memiliki pengalaman tentang machine learning sebelumnya, kamu tetap bisa mengasah pemahaman mendasar kamu tentang machine learning, kamu bisa bergabung dalam modul DQLab yang berjudul œBasic Feature Discovering for Machine Learning Caranya gimana? Mudah banget kok cukup signup sekarang ke
DQLab.id lalu pilih menu learn.


Setelah itu kamu sudah bisa menikmati pembelajaran yang praktis dan aplikatif dan jago machine learning bersama DQLab! Tunggu apa lagi? Yuk, signup sekarang dan mulai belajar Module Premium di DQLab!

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login