PAYDAY SALE! DISKON 95%
Belajar Data Bersertifikat 12 Bulan hanya 180K!
0 Hari 2 Jam 37 Menit 42 Detik

Naive Bayes Bentuk dari Machine Learning Model

Belajar Data Science di Rumah 08-Desember-2023
https://dqlab.id/files/dqlab/cache/kv-2-banner-longtail-selasa-07-2023-12-08-112134_x_Thumbnail800.jpg

Machine Learning model bisa dikatakan sebagai representasi matematis dari suatu masalah atau situasi yang bisa dipecahkan oleh algoritma Machine Learning. Model yang ada harus mampu memahami pola, hubungan, dan karakteristik dari data yang ada sehingga bisa digunakan untuk melakukan prediksi atau pengambilan keputusan berdasarkan data baru. Oleh karena itu, dalam hal penentuan model, kita perlu melakukan training terhadap data yang ada. 


Naive Bayes adalah salah satu algoritma klasifikasi yang populer dalam Machine Learning. Meskipun terlihat lebih sederhana dibandingkan algoritma lainnya, model ini sering kali digunakan karena memiliki kinerja yang baik terutama pada tugas klasifikasi teks dan kategorisasi dokumen.


Dalam artikel ini, kita akan membahas hal-hal yang berkaitan dengan Naive Bayes. Yuk, simak pembahasannya!


1. Dasar Probabilitas dan Teorema Bayes

Machine Learning

Algoritma Naive Bayes berasal pada Teorema Bayes, yang merupakan dasar probabilitas. Teorema Bayes akan menampilkan cara menghitung probabilitas suatu peristiwa A akan terjadi jika kita tahu bahwa peristiwa B telah terjadi. Dengan menggunakan notasi matematika, Teorema Bayes dapat dituliskan sebagai berikut:

Machine Learning


Dalam konteks Naive Bayes, khususnya pada klasifikasi, di mana kita ingin menentukan probabilitas kelas tertentu (misalnya, C1) berdasarkan fitur-fitur tertentu (X1, X2, ..., Xn). Model yang dihasilkan mengasumsikan bahwa fitur-fitur tersebut saling independen, meskipun mungkin tidak selalu benar dalam dunia nyata. Karena asumsi inilah kemudian algoritma ini disebut "naive", meskipun keberhasilannya memang bisa dibuktikan dalam banyak kasus.


Baca juga : Yuk Kenali Macam-Macam Algoritma Machine Learning!


2. Klasifikasi dengan Naive Bayes

Machine Learning

Pict by Pemrograman Matlab


Naive Bayes adalah algoritma Machine Learning yang digunakan untuk klasifikasi, dimana tujuannya adalah untuk menentukan kelas dari suatu sampel berdasarkan nilai fitur yang diberikan. Algoritma ini memanfaatkan probabilitas untuk menghitung kemungkinan apakah setiap sampel masuk ke kelas yang ada.


Dalam konteks klasifikasi biner, Naive Bayes menghitung probabilitas bahwa sampel termasuk dalam kelas positif (P(C1 | X)) dan kelas negatif (P(C2 | X)). Sampel kemudian diklasifikasikan ke dalam kelas dengan probabilitas tertinggi.


3. Jenis Naive Bayes

Machine Learning


Terdapat beberapa jenis Naive Bayes, yang paling umum adalah:

  • Multinomial Naive Bayes: Digunakan untuk variabel diskrit. Naive Bayes jenis ini sering digunakan dalam klasifikasi teks, di mana setiap kata dapat dianggap sebagai fitur.

  • Gaussian Naive Bayes: Digunakan untuk variabel kontinu, dimana nilai fitur diasumsikan mengikuti distribusi Gaussian (normal).

  • Bernoulli Naive Bayes: Digunakan untuk variabel biner. Cocok untuk tugas klasifikasi biner dengan fitur yang diukur secara biner (misalnya, keberadaan atau ketiadaan suatu fitur).


4. Kelebihan dan Keterbatasan

Machine Learning

Kelebihan

  • Sederhana dan Cepat. Naive Bayes dapat dengan mudah diimplementasikan dan diterapkan pada dataset besar dengan kinerja yang baik.

  • Efisien untuk Dimensi Tinggi. Meskipun asumsi independensi seringkali tidak benar, Naive Bayes seringkali memberikan hasil yang baik pada data dengan dimensi tinggi seperti klasifikasi teks.

Kelemahan

  • Asumsi Independensi. Asumsi bahwa setiap fitur adalah independen dapat menjadi keterbatasan di dunia nyata, tetapi dalam banyak kasus, model ini masih memberikan hasil yang baik.

  • Sensitif terhadap Fitur Irrelevant. Jika fitur-fitur yang tidak relevan atau tidak signifikan ada dalam data, Naive Bayes dapat memberikan estimasi probabilitas yang tidak akurat.


Baca juga : Bootcamp Machine Learning and AI for Beginner


Machine Learning model adalah inti dari teknologi Machine Learning untuk menciptakan aplikasi dan sistem yang cerdas. Dengan perkembangan yang terus berlanjut, model-model ini akan terus meningkatkan kemampuan kita dalam menganalisis data, mengambil keputusan, dan mencapai tujuan-tujuan baru yang belum pernah terpikirkan sebelumnya.


Untuk bisa menguasai Machine Learning, kita bisa memulainya dengan  mempelajari Machine Learning di DQLab. Selain modul pembelajaran, kita juga bisa mengikuti Bootcamp Machine Learning & AI for Beginner yang diadakan oleh DQLab.


DQLab merupakan platform belajar online yang berfokus pada pengenalan Data Science & Artificial Intelligence (AI) dengan menggunakan bahasa pemrograman populer, serta platform edukasi pertama yang mengintegrasi fitur Chat GPT.  Selain itu DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. 


Untuk mendapatkan pengalaman belajar menarik, buruan sign up di DQLab. Daftar sekarang dan kejar impianmu untuk menjadi Data Analyst!


Penulis : Gifa Delyani Nursyafitri

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login