Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Kenali 3 Algoritma Machine Learning yang Populer di Dunia Data Science

Belajar Data Science di Rumah 01-Desember-2020
https://dqlab.id/files/dqlab/cache/d627d3fc1dea9f8b503ea0f417fc0a1b_x_Thumbnail800.jpg

Algoritma Machine Learning apapun pada hakikatnya adalah kumpulan hipotesis yang diambil sebelum mempertimbangkan data pelatihan dan yang digunakan untuk menemukan model yang optimal. Algoritma Machine Learning secara umum terbagi ke dalam 3 kategori besar :

  • Supervised Learning - fitur input dan label output sudah ditentukan.

  • Unsupervised Learning - kumpulan data tidak berlabel dan tujuannya adalah untuk menemukan hubungan atau pola tersembunyi.

  • Reinforcement Learning - beberapa bentuk umpan balik dan ada kebutuhan untuk mengoptimalkan beberapa parameter.

Dalam artikel ini, DQLab akan berbagi  beberapa algoritma Machine Learning yang umum dan populer di kalangan Data Scientist. Memiliki pemahaman yang kuat dan mendalam mengenai 3 algoritma Machine Learning berikut merupakan hal yang krusial apabila kamu ingin menjadi seorang Data Scientist. Apa saja ke-3 algoritma tersebut? Simak penjelasan berikut ya!

1. Ordinary Least Squares Linear Regression

Dengan regresi linier, tujuannya adalah untuk menyesuaikan garis melalui distribusi yang paling dekat dengan sebagian besar titik dalam set pelatihan. Dalam regresi linier sederhana, garis regresi meminimalkan jumlah jarak dari titik individu, yaitu jumlah "Kuadrat Sisa". Oleh karena itu, metode ini juga disebut dengan "Ordinary Least Square".

Regresi linier juga dapat dicapai dalam kasus data multidimensi yaitu kumpulan data yang memiliki banyak fitur. Dalam kasus ini, 'garis' hanyalah bidang dimensi yang lebih tinggi dengan dimensi 'N-1', N adalah dimensi kumpulan data.

Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan

2. Decision Trees

Decision Tree adalah pengklasifikasi yang berupa struktur pohon. Decision Tree mengklasifikasikan instance atau contoh dengan memulai dari akar pohon dan bergerak melewatinya hingga simpul daun yang merupakan nilai target. Menghasilkan Decision Tree berguna karena mereka meniru pemahaman manusia dan dengan demikian, modelnya mudah dipahami. Pohon kecil lebih baik karena semakin besar pohonnya, semakin sedikit keakuratannya.

3. K-means clustering

  • Mencoba membagi data menjadi grup K yang paling dekat dengan sentroid K.

  • Hal ini dapat dianggap menciptakan stereotip di antara sekelompok orang.

  • Algoritma untuk mengimplementasikan K means clustering cukup sederhana.

  • Anda secara acak memilih K centroid

  • Tetapkan setiap titik data ke pusat yang paling dekat dengannya.

  • Hitung ulang sentroid berdasarkan posisi rata-rata dari setiap titik sentroid

  • Ulangi sampai poin berhenti mengubah tugas ke sentroid.

  • Untuk memprediksi Anda cukup menemukan centroid yang paling dekat dengan mereka.


Baca juga : Belajar Data Science: Pahami Penggunaan Machine Learning pada Python


4. Yuk Mulai Belajar Data Science Sekarang!

Tidak memiliki background IT? Jangan khawatir, kamu tetap 

bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi data yang sebenarnya! Sign up sekarang untuk #MulaiBelajarData di DQLab!

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

  4. Subscribe DQLab.id untuk Akses Semua Module Premium!

    Penulis : Jihar Gifari

    Editor : Annissa Widya

    Mulai Karier
    sebagai Praktisi
    Data Bersama
    DQLab

    Daftar sekarang dan ambil langkah
    pertamamu untuk mengenal
    Data Science.

    Buat Akun


    Atau

    Sudah punya akun? Login