✨PROMO SPESIAL 11.11!
Belajar Data Bersertifikat 12 Bulan hanya 170K!
0 Hari 1 Jam 51 Menit 35 Detik

Supervised Learning, Tipe Machine Learning Populer

Belajar Data Science di Rumah 05-Januari-2023
https://dqlab.id/files/dqlab/cache/7c2b3eb1e6cfd92ba62c0de65f845df9_x_Thumbnail800.jpeg

Machine learning menjadi salah satu aspek penting yang perlu dipahami oleh seorang data scientist. Beragam algoritma yang akan digunakan harus disesuaikan dengan tipe machine learningnya. Oleh karena  itu, penting bagi kalian yang ingin menekuni profesi di bidang data memahami masing-masing tipe machine learning. Jika konsepnya saja salah, bisa jadi algoritma yang kalian terapkan kurang tepat dan berakhir pada pengolahan data yang salah pula.


Salah satu tipe machine learning yang sangat populer dan hampir digunakan di berbagai industri adalah supervised learning. Algoritma-algoritma pada supervised learning juga sangat beragam sehingga data scientist dapat dengan mudah membandingkan metode mana yang paling sesuai untuk digunakan di kasus tertentu. Apa sebenarnya supervised learning? Berikut akan diulas lebih lanjut cara kerja supervised learning, algoritma yang ada, dan bahkan penerapannya. 


1. Apa Itu Supervised Learning?

Machine Learning

Supervised learning adalah subkategori atau tipe dari machine learning yang menggunakan data-data yang berlabel sebagai inputnya. Data-data tersebut diharapkan dapat ‘supervise’ atau melatih algoritma sehingga nantinya dapat digunakan untuk proses klasifikasi atau prediksi suatu data baru secara akurat. Supervised learning sering digunakan untuk dua kasus utama yaitu classification dan regression. 


Classification menggunakan sebuah algoritma untuk secara akurat dapat mengelompokkan data ke sejumlah kategori yang spesifik. Melalui data training, algoritma dapat mengenali sejumlah kelompok tertentu. Sehingga kemudian ketika dataset baru dijadikan output, algoritma dapat menarik kesimpulan label dari masing-masing data yang sesuai. Beberapa algoritma yang umum digunakan pada kasus classification adalah algoritma decision tree, k-nearest neighbor, random forest, dan support vector machine (SVM).


Regression secara umum digunakan untuk memahami hubungan antara variabel terikat dan variabel bebas. Misalnya, untuk memahami bisnis dalam perusahaan akan dilakukan tes apakah promo di tanggal kembar meningkatkan pendapatan perusahaan. Beberapa algoritma populer yang digunakan pada kasus regression adalah linear regression, logistical regression, dan polynomial regression.  


Baca juga : Yuk Kenali Macam-Macam Algoritma Machine Learning!


2. Algoritma Pada Supervised Learning

Machine Learning

Ada berbagai macam algoritma sekaligus teknik komputasi yang digunakan dalam proses supervised learning. Berikut adalah beberapa jenis metode algoritma yang paling sering digunakan beserta penjelasan singkatnya.


Regresi Linear

Metode algoritma supervised learning yang satu ini biasanya digunakan dalam identifikasi hubungan antara variabel dependen dengan satu (atau lebih) variabel independen. Identifikasi tersebut kemudian digunakan untuk memprediksi hasil di masa depan. Jika hanya ada satu variabel dependen dan satu variabel independen, maka disebut dengan simple regresi linear. Namun, jika terdapat banyak variabel sekaligus, disebut dengan istilah multiple regresi linear. 


K-Nearest Neighbor

Algoritma K-nearest neighbour mengasumsikan bahwa titik data yang serupa akan selalu bisa ditemukan di sekitar data lainnya. Konsekuensinya, algoritma ini pun selalu berupaya untuk menghitung jarak antar titik data (biasanya dengan jarak Euclidean) dan kemudian menentukan kategori berdasarkan jenis yang paling sering muncul. 


Algoritma supervised learning K-nearest neighbor ini disukai banyak data scientists. Penggunaannya relatif mudah dan waktu perhitungannya pun cukup rendah. Namun, saat dataset uji terus tumbuh, otomatis waktu pemrosesan pun menjadi semakin lama. Akibatnya, KNN menjadi kurang menarik. Oleh karenanya, KNN lebih sering dimanfaatkan untuk mesin rekomendasi dan pengenalan gambar.


Support Vector Machine (SVM)

Support vector machine merupakan metode algoritma supervised learning yang dikembangkan oleh Vladimir Vapnik. Metode ini biasanya digunakan dalam data classification dan juga regression. Metode support vector machine sering dimanfaatkan dalam masalah klasifikasi serta pembangunan hyperplane atau batas keputusan yang memisahkan kelas-kelas titik data.


Random Forest

Random forest merupakan algoritma supervised learning yang fleksibel karena dapat digunakan untuk data classification maupun regression. “Forest” di sini menggambarkan kumpulan “pohon” keputusan yang tidak saling berkorelasi, yang kemudian digabungkan menjadi satu guna mengurangi perbedaan dan menghasilkan prediksi data yang jauh lebih akurat.


3. Penerapan Supervised Learning

Machine Learning

Ada beberapa contoh penerapan teknologi berbasis kecerdasan buatan satu ini, yaitu:

  • Analisis prediktif: Pembuatan sistem analisis prediktif merupakan bentuk pengaplikasian supervised learning. Pada hal ini, pembelajaran bertujuan untuk memberikan wawasan mendalam mengenai data bisnis yang mana akan memungkinkan perusahaan dalam melakukan tindakan antisipasi hasil tertentu.

  • Deteksi spam: Deteksi spam juga termasuk ke dalam contoh penerapan pembelajaran satu ini. Perusahaan dapat melatih basis data guna melakukan pengenalan pada pola atau anomali dalam data baru untuk mengatur korespondensi terkait spam dan non-spam.

  • Pengenalan gambar dan objek: Algoritma pembelajaran satu ini pada kenyatannya juga dapat berguna untuk melakukan penemuan, pengisolasian, serta pengkategorian objek dari video maupun gambar sehingga berguna saat penerapannya pada berbagai teknik.


Baca juga : Kenali Algoritma Klasifikasi Machine Learning Terpopuler di Tahun 2021


4. Supervised Learning vs Unsupervised Learning

Machine Learning

Perbedaan yang paling mendasar terletak pada bagaimana algoritma bekerja dalam masing-masing pendekatan. Pada supervised learning, algoritma dilatih terlebih dulu baru bisa bekerja. Sedangkan algoritma unsupervised learning telah dirancang untuk bisa langsung bekerja walaupun tanpa dilatih terlebih dulu. Lebih detailnya, berikut beberapa poin atau aspek pembeda keduanya.


Berdasarkan kegunaannya

Supervised learning membantu untuk mengumpulkan atau memproduksi output data dari pengalaman yang sudah pernah terjadi. Hal ini mirip dengan memori manusia. Kalian baru bisa mengingat nama seseorang ketika sudah pernah berkenalan atau bertemu. Sementara itu, unsupervised learning lebih sering digunakan untuk menemukan seluruh pola yang tidak dikenal dalam data. Contoh penerapan yang sudah sering digunakan dalam kehidupan sehari-hari adalah prediksi waktu pada peta digital. Saat menggunakan peta digital untuk mencari rute menuju lokasi tertentu, sistem akan mencantumkan prediksi waktu tempuh. Padahal, kalian belum pernah berkendara ke lokasi tersebut.


Berdasarkan proses kerja

Pada model supervised learning, kalian akan mendapatkan variabel data input dan output. Namun, hal ini tidak terjadi pada unsupervised learning. Pada pendekatan tersebut, Sahabat DQ hanya akan mendapatkan data input. Ini karena supervised learning memungkinkan kalian untuk mengumpulkan atau memproduksi output data yang didapat dari pengalaman sebelumnya. Sementara itu, unsupervised learning tidak dirancang untuk “belajar” dari pengalaman sebelumnya sehingga tidak menghasilkan output data.


Berdasarkan proses belajar

Pada supervised learning, algoritma komputer melakukan pembelajaran secara offline sebelum menghadapi data. Artinya, komputer “dibekali” sejumlah materi tertentu agar nanti dapat mengenali data dengan mudah. Hal ini tidak terjadi pada unsupervised learning. Pada pendekatan ini, algoritma komputer mempelajari data secara real-time. Itu artinya, ketika komputer berhadapan dengan data, pada saat itu juga, komputer belajar mengenali data.


Machine learning tidak hanya terbagi menjadi supervised learning. Masih banyak tipe yang belum dibahas oleh penjelasan di atas. Sedangkan untuk menjadi praktisi data yang profesional, kalian perlu tahu masing-masing tipenya. Bahkan penerapannya di industri atau perusahaan sehingga tahu cara membedakannya di setiap kasus. Nah, pembahasan lebih detail ini dapat Sahabat DQ temukan di modul pembelajaran DQLab. Di sini kalian akan belajar mulai dari dasar hingga penerapan machine learning di beragam kasus. Sangat cocok bagi kalian yang pemula atau memiliki latar belakang Non IT. Selain modul pembelajaran di desain khusus, setiap praktik yang ada juga sudah secara mudah dilengkapi dengan Live Code Editor sehingga kalian tidak perlu install aplikasi tambahan. Yuk, segera Sign Up dan nikmati metode pembelajarannya!


Penulis : Dita Feby 

Editor : Annissa Widya  

 

 




Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login