Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Macam Machine Learning Python pada 4 Algoritma Supervised Learning

Belajar Data Science di Rumah 20-Juli-2022
https://dqlab.id/files/dqlab/cache/53425815a38b59634404a8960a1b213d_x_Thumbnail800.jpg


Memahami Machine Learning Python adalah langkah terbaik untuk kamu lakukan untuk mengidentifikasi bagaimana komputer dapat belajar atau meningkatkan kinerja mereka base-on data. Secara umum Machine Learning terbagi atas tiga yaitu, Supervised Learning, Unsupervised Learning, dan Reinforcement Learning.


Machine Learning Python dapat diakses dengan memanggil library Python antara lain, Scikit-Learn, Tensorflow, PyTorch, Keras, dan Theano. Dengan memahami pemahaman dasar tentang berbagai algoritma Machine Learning dapat membantu kamu memilih algoritma untuk proyek data kamu.


Jika kebetulan kamu ingin membuat proyek menggunakan algoritma Supervised Learning artikel ini cocok untuk kamu. Kami akan membahas tiga algoritma Supervised Learning yang bisa kamu coba terapkan untuk proyek data kamu.


Supervised Learning digunakan pada dataset yang sudah memiliki label tertentu mencakup input dan output yang diinginkan. Sederhananya jenis algoritma Supervised Learning harus diberi contoh terlebih dahulu untuk mempelajari data. Untuk lebih lanjut, simak artikel ini, yuk!


1. Logistic Regression

Algoritma Logistic Regression adalah pemodelan klasifikasi untuk menentukan hasil biner berdasarkan rangkaian variabel independen. Logistic Regression terdiri dari tiga tipe yaitu, tipe bener yang artinya, hasil salah satu dari dua skenario yang mungkin terjadi adalah 1 dan yang tidak terjadi adalah 0. Variabel independen sendiri merupakan variabel atau faktor yang dapat mempengaruhi hasil biner tersebut. 


Jadi, jika kamu ingin bekerja dengan data biner yang hanya memiliki dua kemungkinan yaitu œya atau œtidak, œlulus atau œgagal, œpositif atau œnegatif, dan sebagainya maka Logistic Regression cocok digunakan. Tipe multinomial, yang artinya memiliki output lebih dari dua skenario kemungkinan. Contohnya jika kamu melakukan analisis sentimen yang memiliki tiga kemungkinan yaitu, œpositif, œnetral, œnegatif.


machine learning


Logistic Regression jauh lebih mudah diimplementasikan daripada algoritma Machine Learning lain, dan dapat bekerja dengan powerful untuk kasus-kasus dimana dataset dapat dipisahkan secara linear (memisahkan dua kelas). Dalam Python, Logistic Regression termasuk dalam library Scikit-Learn. Sehingga untuk mengaksesnya dengan menuilskan from sklearn.linear_model import LogisticRegression.


Baca juga : Yuk Kenali Macam-Macam Algoritma Machine Learning!


2. Support Vector Machine

machine learning

Algoritma Support Vector Machine atau sering disingkat SVM merupakan algoritma Supervised Learning yang digunakan untuk kasus non-linear yaitu dengan memasukan konsep kernel ke dalam ruang dimensi tinggi. Dengan tujuan untuk mencari hyperplane atau pemisah terbaik yang dapat memaksimalkan margin antar kelas data. Adapun kernel yang terdapat dalam SVM antara lain, Kernel Linear, Polynomial, Sigmoid, dan RBF (Radial Basis Function). 


SVM bekerja lebih efektif pada kasus yang memiliki jumlah dimensi lebih besar dari jumlah sampel. Sama seperti dua algoritma sebelumnya yang telah dibahas, SVM juga termasuk dalam library Scikit-Learn sehingga untuk membuat pemodelan SVM dengan menulis from sklearn import svm.


3. Random Forest

machine learning

Random forest merupakan salah satu algoritma yang digunakan untuk pengklasifikasian dataset dalam jumlah besar. Klasifikasi random forest dilakukan melalui penggabungan tree dengan melakukan training dataset yang kamu miliki. Selain itu, algoritma random forest menggunakan algoritma decision tree untuk melakukan proses seleksi. Dimana tree atau pohon yang dibangun dibagi secara rekursif dari data pada kelas yang sama. 


Proses klasifikasi pada random forest berawal dari memecah data sampel yang ada dalam decision tree secara acak. Setelah pohon terbentuk,maka akan dilakukan voting pada setiap kelas dari data sampel. Kemudian, mengkombinasikan vote dari setiap kelas kemudian diambil vote yang paling banyak.


Dengan menggunakan random forest pada klasifikasi data maka, akan menghasilkan vote yang paling baik. Pada saat proses klasifikasi selesai dilakukan, inisialisasi dilakukan dengan sebanyak data berdasarkan nilai akurasinya.


Keuntungan penggunaan random forest yaitu mampu mengklasifikasi data yang memiliki atribut yang tidak lengkap,dapat digunakan untuk klasifikasi dan regresi akan tetapi tidak terlalu bagus untuk regresi, lebih cocok untuk pengklasifikasian data serta dapat digunakan untuk menangani data sampel yang banyak.


Baca juga : Kenali Algoritma Klasifikasi Machine Learning Terpopuler di Tahun 2021


4. KNN

machine learning

Algoritma KNN atau sering disebut K-Nearest Neighbor merupakan algoritma yang melakukan klasifikasi berdasarkan kedekatan jarak suatu data dengan data yang lain. Dekat atau jauh suatu jarak dihitung berdasarkan jarak Euclidean. KNN merupakan salah satu algoritma non parametrik yang digunakan dalam pengklasifikasian. 


Selain naive bayes, algoritma KNN juga menjadi algoritma pengklasifikasian yang terkenal dengan tingkat keakuratan yang baik.


Keuntungan dari algoritma KNN adalah sangat nonlinear, lebih mudah dipahami dan diimplementasikan karena kita cukup mendefinisikan fungsi untuk menghitung jarak antar-instance, menghitung jarak x dengan semua instance lainnya berdasarkan fungsi tersebut dan menentukan kelas x sebagai kelas yang paling banyak muncul di k-instance.


machine learning

Gimana sahabat DQ? Ngga perlu khawatir jika kamu belum memiliki pengalaman tentang machine learning sebelumnya, kamu tetap bisa mengasah pemahaman mendasar kamu tentang machine learning, kamu bisa bergabung dalam modul DQLab yang berjudul œBasic Feature Discovering for Machine Learning Caranya gimana? Mudah banget kok cukup signup sekarang ke DQLab.id lalu pilih menu learn.


Setelah itu kamu sudah bisa menikmati pembelajaran yang praktis dan aplikatif dan jago machine learning bersama DQLab! Tunggu apa lagi? Yuk, signup sekarang dan mulai belajar Module Premium di DQLab!


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login