Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Model Overfitting & Underfitting di Machine Learning

Belajar Data Science di Rumah 22-Februari-2023
https://dqlab.id/files/dqlab/cache/ffbfff4967967b552134a416b07a7a5e_x_Thumbnail800.jpeg

Machine Learning merupakan sebuah teknologi yang memungkinkan mesin dapat bekerja secara otomatis setelah melalui proses pembelajaran yang dikenal dengan istilah training. Pada dasarnya, Machine Learning ini merupakan bagian dari Artificial Intelligence atau kecerdasan buatan. Itulah mengapa, untuk bisa membuat keputusan sendiri, mesin akan dibuat agar bisa berpikir dengan mengikuti pola pikir manusia. 


Machine Learning akan sering digunakan oleh Data Scientist dalam proses pengolahan data. Meskipun Machine Learning  sudah terbilang canggih, namun hal tersebut tidak menutup kemungkinan terjadinya berbagai permasalahan. Misalnya saja model yang overfitting dan underfitting yang bisa saja terjadi kapan pun. Padahal model yang kita butuhkan adalah model yang benar-benar bisa menggeneralisir data yang ada. Tapi apa sih model overfitting dan underfitting tersebut? Yuk, cari di artikel di bawah ini!


1.Mengenal Model Machine Learning

Machine Learning

Model Machine Learning adalah serangkaian program yang digunakan untuk melakukan prediksi. Untuk bisa sampai ke tahapan pembuatan prediksi, program ini akan dilatih melalui proses training sehingga bisa menemukan pola yang tersimpan di dalam data. Dalam proses awal pembuatan model, kita akan membagi data yang ada menjadi data training dan data testing.  Suatu model bisa dikatakan bagus, jika memiliki nilai akurasi yang cukup tinggi baik untuk data training maupun data testing.


Sayangnya, dalam praktek nya ternyata tidak semudah itu. Kita akan menemukan permasalahan yang berkaitan dengan akurasi ini, yang nantinya akan dikenal dengan istilah overfitting dan underfitting. Untuk penjelasan detailnya akan dibahas di poin selanjutnya.


Baca juga : Yuk Kenali Macam-Macam Algoritma Machine Learning!


2. Tahapan dalam Mengaplikasikan Machine Learning

Machine Learning

Sebelum masuk ke pembahasan mengenai overfitting dan underfitting, kita harus mengetahui tahapan dalam mengaplikasikan Machine Learning. Berikut adalah tahapan yang umum digunakan:

  • Tentukan masalah utama dengan melihat hal apa yang akan diamati serta hasil yang ingin diprediksi.

  • Kumpulkan, bersihkan, dan siapkan data agar modelnya bisa di training dengan menggunakan algoritma Machine Learning. Lakukan visualisasi dan analisis sederhana untuk memvalidasi data serta agar lebih memahami data yang ada.

  • Dalam beberapa keadaan, data mentah (variabel input) dan jawaban (target) tidak bisa direpresentasikan dengan cara yang dapat digunakan untuk melatih model yang sangat prediktif. Oleh karena itu, kita harus mencoba untuk membuat representasi atau fitur input yang lebih prediktif dari variabel mentah.

  • Gunakan fitur yang dihasilkan ke algoritma ML untuk membangun model dan mengevaluasi kualitas model pada data yang diadakan di luar pembuatan model (data testing).

  • Gunakan model untuk menghasilkan prediksi jawaban target untuk data baru.


3. Model Machine Learning Overfitting

Machine Learning

Model yang overfitting adalah keadaan dimana model Machine Learning mempelajari data dengan terlalu detail, sehingga yang ditangkap bukan hanya datanya saja namun noise yang ada juga direkam. Tujuan dari pembuatan model adalah agar kita bisa menggeneralisasi data yang ada, namun jika semua detail ikut dimasukkan maka generalisasi tersebut tidak akan bisa didapatkan. Model yang overfitting akan menghasilkan nilai akurasi yang sangat tinggi saat proses training, namun memiliki akurasi yang rendah ketika testing. Hal ini bisa diibaratkan dengan para pelajar yang menghafal contoh soal dibandingkan memahami konsepnya, sehingga ketika mendapatkan soal yang berbeda maka tidak bisa dijawab.


Overfitting bisa terjadi karena data yang ada kurang variatif atau model yang dipilih terlalu kompleks. Sehingga untuk menghindari hal tersebut, kita bisa menambahkan variasi data dan mengurangi kerumitan dari model.


4. Model Machine Learning Underfitting

Machine Learning

Model underfitting merupakan kebalikan dari overfitting. Dalam keadaan ini, Machine Learning tidak bisa mempelajari data dengan baik. Hal ini menyebabkan model tidak bisa melihat hubungan dari setiap variabel dan tidak bisa melakukan prediksi dan klasifikasi. Di model underfitting, akurasi rendah tidak hanya akan ditemukan saat testing saja, namun pada saat training pun sudah menghasilkan akurasi yang rendah. Model gagal menangkap trend data yang seharusnya. Model yang underfitting ini bisa terjadi karena model yang terlalu sederhana sehingga model tidak lagi bergantung pada data dan cenderung melakukan asumsi terhadap data.


Baca juga : Kenali Algoritma Klasifikasi Machine Learning Terpopuler di Tahun 2021


Pemanfaatan Machine Learning dalam kehidupan sehari-hari bukanlah hal yang bisa kita pungkiri. Adanya Machine Learning tidak hanya memberikan manfaat bagi para pemilik bisnis, namun juga bisa meringankan pekerjaan kita sebagai masyarakat biasa.


Agar tidak tertinggal dan bisa mengikuti perkembangan zaman, kita juga harus terus mengupgrade diri. Salah satunya adalah dengan mempelajari Machine Learning. Tenang, kamu tidak perlu pusing-pusing lagi mencari tempat belajar karena DQLab juga menyediakan modul yang membahas tentang Machine Learning, yaitu modul “Machine Learning with Python for Beginning”. 


Yuk, tunggu apa lagi? Sign up, dan belajar Machine Learning sekarang juga!


Penulis : Gifa Delyani Nursyafitri


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login