PAYDAY SALE! DISKON 95%
Belajar Data Bersertifikat 12 Bulan hanya 180K!
1 Hari 15 Jam 14 Menit 3 Detik

Belajar Python dengan Kenali Sedikit Mengenai Regresi Linier

Belajar Data Science di Rumah 06-September-2021
https://dqlab.id/files/dqlab/cache/2137eb5b95ba003ac6057eb60ef5d853_x_Thumbnail800.jpg

Regresi adalah alat statistik dan machine learning yang penting dan banyak digunakan. Tujuan utama dari task berbasis regresi adalah untuk memprediksi label keluaran atau tanggapan yang adalah nilai numerik berkelanjutan, untuk data input yang diberikan. Outputnya akan didasarkan pada apa model telah dipelajari dalam fase pelatihan.


Pada dasarnya, model regresi menggunakan data input fitur (variabel independen) dan output numerik kontinu yang sesuai nilai (variabel dependen atau hasil) untuk mempelajari hubungan spesifik antara input dan output yang sesuai. 


Regresi linier sederhana berguna untuk menemukan hubungan antara dua variabel kontinu. Salah satunya adalah prediktor atau variabel independen dan lainnya adalah respon atau variabel dependen. Ini mencari hubungan statistik tetapi bukan hubungan deterministik. 


Hubungan antara dua variabel dikatakan deterministik jika satu variabel dapat dinyatakan dengan tepat oleh variabel lainnya. Misalnya, dengan menggunakan suhu dalam derajat Celcius, dimungkinkan untuk memprediksi Fahrenheit secara akurat. Hubungan statistik tidak akurat dalam menentukan hubungan antara dua variabel. Misalnya hubungan antara tinggi badan dan berat badan.


DQLab kini menyediakan modul Model Regresi Linear pada Python untuk kamu yang ingin mempelajari variabel bebas & variabel independet, ingin tahu modul ini membahas apa saja? Yuk simak artikel ini sampai habis!

1.  Apa itu Regresi Linear?

python

Sebelum mengetahui apa itu regresi linier, mari kita membiasakan diri dengan regresi. Regresi adalah metode pemodelan nilai target berdasarkan prediktor independen. Metode ini banyak digunakan untuk peramalan dan mencari tahu hubungan sebab akibat antar variabel. Teknik regresi sebagian besar berbeda berdasarkan jumlah variabel independen dan jenis hubungan antara variabel independen dan dependen. 


Hubungan variabel bergantung (disimbolkan dengan y) ini dengan variabel bebas (disimbolkan dengan x) yang secara matematis dinyatakan oleh

y = f (x)

Untuk lebih memahami apa itu regresi linear yuk simak video dibawah ini!



Regresi linier sederhana adalah jenis analisis regresi dimana jumlah variabel bebas adalah satu dan terdapat hubungan linier antara variabel bebas( x) dan terikat(y). Garis merah pada grafik di atas disebut sebagai garis lurus yang paling sesuai. Berdasarkan titik data yang diberikan, kami mencoba memplot garis yang memodelkan titik-titik tersebut dengan paling baik.


Baca juga : Belajar Statistika : Kenali Lebih Jauh Penerapannya dalam Data Science


2. Kuadrat Terkecil Biasa

python

Source: Google

Ketika kita memiliki lebih dari satu input, kita dapat menggunakan Kuadrat Terkecil Biasa untuk memperkirakan nilai koefisien. Prosedur Kuadrat Terkecil Biasa berusaha meminimalkan jumlah residu kuadrat. Ini berarti bahwa dengan memberikan garis regresi melalui data, kami menghitung jarak dari setiap titik data ke garis regresi, dikuadratkan, dan jumlahkan semua kesalahan kuadrat bersama-sama. Ini adalah kuantitas yang ingin diminimalkan oleh kuadrat terkecil biasa. 


Pendekatan ini memperlakukan data sebagai matriks dan menggunakan operasi aljabar linier untuk memperkirakan nilai optimal untuk koefisien. Ini berarti bahwa semua data harus tersedia dan sahabat data harus memiliki memori yang cukup untuk memuat data dan melakukan operasi matriks. Hal yang tidak biasa untuk menerapkan sendiri prosedur Kuadrat Terkecil Biasa kecuali sebagai latihan dalam aljabar linier. Kemungkinan besar sahabat data akan memanggil prosedur dalam pustaka aljabar linier. Prosedur ini sangat cepat untuk dihitung.


Di dalam regresi, biasanya kita juga akan memanfaatkan koefisien korelasi Pearson untuk mengukur linieritas dua variabel. Koefisien korelasi Pearson ini dilambangkan dengan r memiliki nilai -1≤r≤1 atau bisa dikatakan r hanya boleh bernilai dalam rentang -1 sampai dengan 1. Jika nilai r=1 menunjukkan linieritas sempurna untuk kemiringan (slope) positif.


Sedangkan nilai r=-1 menunjukkan linieritas yang sempurna juga tetapi untuk kemiringan (slope) negatif. Sementara itu, r=0 justru tidak menunjukkan hubungan sama sekali. Lima buah contoh berikut mengilustrasikan bagaimana koefisien korelasi Pearson ini bernilai untuk dua variabel, x dan y.


python


3. Sekilas Tentang Module Baru Regresi Linear Menggunakan Python

DQLab baru saja meluncurkan modul terbarunya, salah satu materinya adalah pembelajaran mengenai œRegresi Linear Menggunakan Python. Di dalam modul tersebut kamu bisa mempelajari regresi linear dari awal hingga akhir, seperti memahami konsep regresi dan least square fit dalam regresi, kemudian juga memahami penggunaan regresi dengan Python, hingga mencoba untuk melakukan prediksi dari model regresi yang sudah di buat.


Menariknya lagi nih, Sahabat DQ akan menguasai beberapa skill dengan mencoba modul ini, diantaranya adalah : 

  • Mengerti apa dan kenapa regresi dan regresi linear

  • Mengenal konsep least squares fit dan pemanfaatannya dalam regresi linear

  • Mampu mengerti dataset penjualan permen, sereal, dan pisang serta tingkat kerusakan gigi

  • Mampu membaca dan menggabungkan dua file tsv yang digunakan sebagai dataset

  • Mampu melakukan proses regresi linear pada python dengan metode fit dari LinearRegression object pada scikit learn dan membuat data model tingkat kerusakan gigi dan hubungannya dengan penjualan permen, dan bukannya penjualan item lain

  • Mampu menggunakan metode predict untuk melakukan prediksi nilai data dari model yang dihasilkan (tingkat kunjungan dokter gigi dengan input jumlah penjualan permen)

Baca juga : Empat Jenis Data Statistik Hasil Pengukuran


4.Tertarik untuk Belajar Regresi? Yuk Belajar dari Modul DQLab!

Dalam modul Mengenal Regresi Linear pada Python ini, studi kasus yang ingin diangkat adalah pengaruh antara makanan-makanan manis dengan kerusakan gigi. Hal ini menjadi suatu hal yang menarik karena tingginya kunjungan yang terjadi di poli di poliklinik DQ Health. Studi kasus yang digunakan hampir mirip dengan kasus yang biasa ditemui di lapangan, lho. Jadi buat kamu yang tertarik dengan regresi, modul ini oke banget deh buat dicoba.


Seperti modul DQLab lainnya, modul ini juga dilengkapi dengan quiz serta mini project yang dapat kamu gunakan untuk menguji pemahamanmu terhadap modul ini. Berikut contoh quiz yang akan kamu temukan dalam modul baru ini:


Penentuan hubungan antara variabel bergantung dan variabel bebas jika kedua variabel tersebut memiliki jenis data kontinu disebut dengan 

  1. klasifikasi

  2. regresi

  3. distribusi

  4. asosiasi

Nah, mana nih jawaban yang benar menurutmu?


Jawaban yang tepat adalah regresi, berdasarkan penjelasan sebelumnya bahwa hubungan antara variabel bergantung dan bebas dinamakan regresi ketika memiliki jenis data kontinu pada masing-masing variabel.


Nah, gimana? Dari gambaran modul yang ada, modul ini sangat menarik kan? Untuk mendapatkan akses lebih lengkap, kamu bisa mencoba modul Mengenal Regresi Linear pada Python secara langsung di DQLab Academy. 


Tunggu apa lagi? Yuk, buruan sign up di DQLab atau bisa signup melalui form dibawah ini ya.


Enrich artikel by : Gifa Delyani Nursyafitri

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login