Kenali 3 Algoritma Machine Learning yang Populer di Dunia Data Science

Belajar Data Science di Rumah 01-Desember-2020

https://dqlab.id/files/dqlab/cache/d627d3fc1dea9f8b503ea0f417fc0a1b_x_Thumbnail800.jpg

Algoritma Machine Learning apapun pada hakikatnya adalah kumpulan hipotesis yang diambil sebelum mempertimbangkan data pelatihan dan yang digunakan untuk menemukan model yang optimal. Algoritma Machine Learning secara umum terbagi ke dalam 3 kategori besar :

Supervised Learning - fitur input dan label output sudah ditentukan.
Unsupervised Learning - kumpulan data tidak berlabel dan tujuannya adalah untuk menemukan hubungan atau pola tersembunyi.
Reinforcement Learning - beberapa bentuk umpan balik dan ada kebutuhan untuk mengoptimalkan beberapa parameter.

Dalam artikel ini, DQLab akan berbagi beberapa algoritma Machine Learning yang umum dan populer di kalangan Data Scientist. Memiliki pemahaman yang kuat dan mendalam mengenai 3 algoritma Machine Learning berikut merupakan hal yang krusial apabila kamu ingin menjadi seorang Data Scientist. Apa saja ke-3 algoritma tersebut? Simak penjelasan berikut ya!

1. Ordinary Least Squares Linear Regression

Dengan regresi linier, tujuannya adalah untuk menyesuaikan garis melalui distribusi yang paling dekat dengan sebagian besar titik dalam set pelatihan. Dalam regresi linier sederhana, garis regresi meminimalkan jumlah jarak dari titik individu, yaitu jumlah "Kuadrat Sisa". Oleh karena itu, metode ini juga disebut dengan "Ordinary Least Square".

Regresi linier juga dapat dicapai dalam kasus data multidimensi yaitu kumpulan data yang memiliki banyak fitur. Dalam kasus ini, 'garis' hanyalah bidang dimensi yang lebih tinggi dengan dimensi 'N-1', N adalah dimensi kumpulan data.

2. Decision Trees

Decision Tree adalah pengklasifikasi yang berupa struktur pohon. Decision Tree mengklasifikasikan instance atau contoh dengan memulai dari akar pohon dan bergerak melewatinya hingga simpul daun yang merupakan nilai target. Menghasilkan Decision Tree berguna karena mereka meniru pemahaman manusia dan dengan demikian, modelnya mudah dipahami. Pohon kecil lebih baik karena semakin besar pohonnya, semakin sedikit keakuratannya.

3. K-means clustering

Mencoba membagi data menjadi grup K yang paling dekat dengan sentroid K.
Hal ini dapat dianggap menciptakan stereotip di antara sekelompok orang.
Algoritma untuk mengimplementasikan K means clustering cukup sederhana.
Anda secara acak memilih K centroid
Tetapkan setiap titik data ke pusat yang paling dekat dengannya.
Hitung ulang sentroid berdasarkan posisi rata-rata dari setiap titik sentroid
Ulangi sampai poin berhenti mengubah tugas ke sentroid.
Untuk memprediksi Anda cukup menemukan centroid yang paling dekat dengan mereka.

4. Yuk Mulai Belajar Data Science Sekarang!

Tidak memiliki background IT? Jangan khawatir, kamu tetap

bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi data yang sebenarnya! Sign up sekarang untuk #MulaiBelajarData di DQLab!

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

Buat Akun Gratis dengan Signup di DQLab.id/signup
Akses module Introduction to Data Science
Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
Subscribe DQLab.id untuk Akses Semua Module Premium!

Penulis : Jihar Gifari

Editor : Annissa Widya

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Kenali 3 Algoritma Machine Learning yang Populer di Dunia Data Science

1. Ordinary Least Squares Linear Regression

2. Decision Trees

3. K-means clustering

4. Yuk Mulai Belajar Data Science Sekarang!

Tags

Mulai Kariersebagai PraktisiData BersamaDQLab

Daftar Gratis & Mulai Belajar

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab