Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Belajar Algotirma Naive Bayes

Belajar Data Science di Rumah 26-Juni-2021
https://dqlab.id/files/dqlab/cache/02a216d92fcfb647bc7fb73db386ec48_x_Thumbnail800.jpeg

Naive Bayes adalah algoritma machine learning untuk masalah klasifikasi. Ini didasarkan pada teorema probabilitas Bayes. Hal ini digunakan untuk klasifikasi teks yang melibatkan set data pelatihan dimensi tinggi. Beberapa contohnya adalah penyaringan spam, analisis sentimental, dan klasifikasi artikel berita.


Tidak hanya dikenal karena kesederhanaannya, tetapi juga karena keefektifannya. Sangat cepat untuk membangun model dan membuat prediksi dengan algoritma Naive Bayes. Naive Bayes adalah algoritma pertama yang harus dipertimbangkan untuk memecahkan masalah klasifikasi teks. Oleh karena itu, Anda harus mempelajari algoritma ini secara menyeluruh.


Algoritma Naive Bayes adalah teknik klasifikasi berdasarkan penerapan teorema Bayes

dengan asumsi kuat bahwa semua prediktor independen satu sama lain. Secara sederhana dengan kata lain, asumsinya adalah bahwa kehadiran fitur di kelas tidak tergantung pada kehadiran fitur lain di kelas yang sama. Misalnya, telepon dapat dipertimbangkan secerdas layar sentuh, fasilitas internet, kamera bagus dll. Padahal semua ini fitur bergantung satu sama lain, mereka berkontribusi secara independen terhadap kemungkinan bahwa ponsel tersebut adalah ponsel pintar.


Yuk belajar bersama DQLab tentang Algoritma Machine Learning ini 


1. Naive Bayes? Algoritma Apa itu

Algoritma Naive Bayes adalah algoritma yang mempelajari probabilitas suatu objek dengan ciri-ciri tertentu yang termasuk dalam kelompok/kelas tertentu. Singkatnya, ini adalah pengklasifikasi probabilistik. Sahabat data pasti bertanya-tanya mengapa disebut demikian?


Algoritma Naive Bayes disebut "naif" karena membuat asumsi bahwa kemunculan fitur tertentu tidak tergantung pada kemunculan fitur lainnya.


Misalnya, jika kalian mencoba mengidentifikasi buah berdasarkan warna, bentuk, dan rasanya, maka buah berwarna oranye, bulat, dan tajam kemungkinan besar adalah jeruk. Bahkan jika ciri-ciri ini bergantung satu sama lain atau pada keberadaan ciri-ciri lain, semua sifat ini secara individual berkontribusi pada kemungkinan bahwa buah ini adalah jeruk dan itulah sebabnya buah ini dikenal sebagai "naif."


Adapun bagian "Bayes", mengacu pada ahli statistik dan filsuf, Thomas Bayes dan teorema yang dinamai menurut namanya, teorema Bayes, yang merupakan dasar untuk Algoritma Naive Bayes.


Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan


2. Pemodelan dengan Naive Bayes

Library Python, Scikit learn adalah library paling berguna yang membantu kami membangun Naive Bayes model dengan Python. Kami memiliki tiga jenis model Naive Bayes berikut di bawah Scikit pelajari library Python:


Gaussian Naive Bayes

Ini adalah pengklasifikasi Naive Bayes paling sederhana yang memiliki asumsi bahwa data dari masing-masing label diambil dari distribusi Gaussian sederhana.


Multinomial Naive Bayes

Pengklasifikasi Naive Bayes lain yang berguna adalah Multinomial Naive Bayes di mana fitur-fiturnya adalah diasumsikan diambil dari distribusi Multinomial sederhana. Naive Bayes semacam itu adalah paling sesuai untuk fitur yang mewakili jumlah diskrit.


Bernoulli Naive Bayes

Model penting lainnya adalah Bernoulli Naive Bayes di mana fitur diasumsikan biner (0s dan 1s). Klasifikasi teks dengan model 'bag of words' dapat menjadi aplikasi dari Bernoulli Naive Bayes.


3. Kelebihan dan Kekurangan 

Berikut ini adalah beberapa kelebihan menggunakan pengklasifikasi Naive Bayes:

  • Klasifikasi Naive Bayes mudah diimplementasikan dan cepat.

  • Ini akan menyatu lebih cepat daripada model diskriminatif seperti regresi logistik.

  • Membutuhkan lebih sedikit data pelatihan.

  • Sifatnya sangat skalabel, atau skalanya linier dengan jumlah prediktor dan titik data.

  • Dapat membuat prediksi probabilistik dan dapat menangani kontinu beserta diskrit data.

  • Algoritma klasifikasi Naive Bayes dapat digunakan untuk biner maupun multi-kelas masalah klasifikasi keduanya.


Kelemahan 

Berikut ini adalah beberapa kekurangan dari penggunaan pengklasifikasi Naive Bayes:

  • Salah satu Kelemahan terpenting dari klasifikasi Naive Bayes adalah fiturnya yang kuat kemandirian karena dalam kehidupan nyata hampir tidak mungkin untuk memiliki seperangkat fitur yang benar-benar independen satu sama lain. 

  • Masalah lain dengan klasifikasi Naive Bayes adalah 'frekuensi nol' yang berarti bahwa jika variabel kategori memiliki kategori tetapi tidak diamati dalam data pelatihan set, maka model Naive Bayes akan menetapkan probabilitas nol untuk itu dan itu tidak akan dapat untuk membuat prediksi


4. Aplikasi Naive Bayes

Berikut ini adalah beberapa aplikasi umum dari klasifikasi Naive Bayes:

  • Prediksi real-time: Karena kemudahan implementasi dan komputasi yang cepat, ini dapat menjadi digunakan untuk melakukan prediksi secara real-time.

  • Prediksi multi-kelas: Algoritma klasifikasi Naive Bayes dapat digunakan untuk memprediksi probabilitas posterior dari beberapa kelas variabel target.

  • Klasifikasi teks: Karena fitur prediksi multi-kelas, Naive Bayes algoritma klasifikasi sangat cocok untuk klasifikasi teks. Itu sebabnya itu juga digunakan untuk memecahkan masalah seperti penyaringan spam dan analisis sentimen.

  • Sistem rekomendasi: Seiring dengan algoritma seperti pemfilteran kolaboratif, Naive

  • Bayes membuat sistem Rekomendasi yang dapat digunakan untuk menyaring informasi yang tidak terlihat dan untuk memprediksi cuaca pengguna akan menyukai sumber daya yang diberikan atau tidak.

Baca juga : Belajar Data Science: Pahami Penggunaan Machine Learning pada Python


5. Mau Tahu Kelanjutannya?

Sign up dan lakukan pembelajaran anti ribet dengan live code editor. Nikmati belajar mandiri setiap hari tanpa harus install aplikasi sana sini. Dimana lagi kalau bukan di DQLab. Yuk mulai akses free modulnya Introduction to Data Science, gratis!

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login