Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Praktis! Begini Tutorial Grafik Data Bivariat di Excel

Belajar Data Science di Rumah 05-April-2024
https://dqlab.id/files/dqlab/cache/1-longtail-rabu-08-2024-04-06-205905_x_Thumbnail800.jpg

Excel merupakan salah satu tools yang paling digunakan oleh praktisi data. Tools ini merupakan tools sederhana namun sudah mampu membantu praktisi data dalam melakukan beberapa kebutuhan analisa data. Salah satu data yang sering digunakan oleh data analyst yaitu data bivariat, yaitu data dari dua variabel yang digunakan untuk mengetahui hubungan kedua variabel tersebut. Bagaimana cara membuatnya? Nah, sebelum itu juga akan dibahas apa itu data bivariat dan detail scatter plot serta linear regression. Yuk simak pembahasan di bawah ini!


1. Apa itu Data Bivariat?

Data bivariat adalah data yang dikumpulkan dalam dua variabel dan setiap titik data pada satu variabel memiliki hubungan dengan satu titik data pada variabel lainnya. Biasanya data bivariat dikumpulkan untuk mengetahui hubungan antara dua variabel dan menggunakan informasi hubungan tersebut untuk mengambil keputusan bisnis di masa mendatang. Data bivariat biasanya direpresentasikan dengan scatter plot dan linear regression. Scatter plot untuk mengetahui titik data setiap variabel dan linear regression untuk mengetahui hubungan kedua variabel. 


Sebagai contoh, sebuah perusahaan es krim mengumpulkan data untuk mengetahui jumlah penjualan es krim berdasarkan temperatur suatu wilayah. Jika terdapat hubungan positif yaitu jika temperatur meningkat kemudian penjualan juga ikut meningkat, maka penjual perlu meningkatkan stok ketika musim panas. 

Excel

Misalkan kita akan menganalisis hubungan kedua variabel tadi. Berdasarkan diagram di atas diperoleh hasil bahwa terdapat hubungan positif antara temperatur dan penjualan es krim. Dengan demikian, penjualan es krim dapat ditingkatkan ketika musim panas. 


Baca juga: Bootcamp Data Analyst with Excel


2. Mengenal Scatter Plot 

Telah disinggung sebelumnya bahwa data bivariat sering direpresentasikan dengan scatter plot. Apa sebenarnya scatter plot? Scatter plot adalah diagram atau grafik yang merepresentasikan relasi atau hubungan antara dua variabel. Jika dalam sebuah bidang dua dimensi, maka secara sederhana kita melakukan ploting suatu titik terhadap sumbu X dan sumbu Y.


Untuk variabel yang merupakan variabel bebas sebagai sumbu X. Sedangkan untuk variabel yang merupakan variabel terikat sebagai sumbu Y. Berikut contohnya, terdapat dua variabel yaitu waktu lama belajar (study hour) dan nilai yang diperoleh (mark).


Excel


Di sini ingin diketahui apakah lama waktu belajar mempengaruhi nilai yang diperoleh. Sehingga yang merupakan variabel bebas adalah lama waktu belajar (study hour) sedangkan variabel terikat adalah nilai (mark). Membuat scatter plot berarti membuat plot setiap titik yang bersesuaian dengan dua variabel tersebut. Contohnya, seseorang yang memiliki waktu belajar selama 4 jam mendapatkan nilai 30. Maka titik berada di koordinat (4, 30). Begitu seterusnya sampai seluruh data berhasil diplotkan.


3. Mengenal Linear Regression

Lantas apa itu linear regression? Linear regression atau regresi linear adalah model machine learning yang digunakan untuk memprediksi nilai masa depan dari suatu variabel terikat berdasarkan best fit line. Best fit line adalah garis yang melewati titik-titik data dimana titik-titik tersebut memiliki jumlah minimum untuk jarak kesalahan (distance error). Garis ini juga dikenal dengan istilah trend line. Perhatikan contoh berikut.


Excel


Ketika kita membuat garis pada linear regression akan terdapat persamaan garis (equation of line) dan juga trend line. Persamaan ini menandakan seberapa berpengaruh variabel bebas terhadap variabel terikat. Trend line memberikan gambaran hubungan kedua variabel.


Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja


4. Membuat Grafik Untuk Data Bivariat

Supaya lebih paham dengan cara membuat grafik berkaitan dengan data bivariat, berikut langkah-langkah yang bisa kalian coba praktikkan.

Excel


Misalkan kita ingin membuat scatter plot dan linear regression dari data di atas. 

Langkah 1. Klik Insert Tab kemudian pilih scatter plot.

Excel


Langkah 2. Selanjutnya akan muncul scatter plot yang sesuai dengan data. Ubah judul menjadi Time (hours) VS Distance (km).

Excel


Langkah 3. Tambahkan nama untuk sumbu X dan sumbu Y dengan cara klik tanda + dan centang axis title.

Excel


Langkah 4. Ubah nama sumbu X menjadi time (hours) dan sumbu Y distance (km).

Excel


Langkah 5. Menambahkan trend line dengan cara klik datapoint pada scatter plot. Kemudian klik add trendline.

Excel


Langkah 6. Pada bagian format trendline, klik bagian Display equation on chart. 

Excel


Sehingga diperoleh hasil seperti berikut.


Excel


Contoh di atas adalah salah satu kelebihan dari Excel. Penasaran seperti apa cara membuat grafik lainnya? Kalian bisa pelajari di DQLab. Modul ajarnya lengkap dan bervariasi. Semua skill yang dibutuhkan akan diajarkan. Dilengkapi studi kasus yang membantu kalian belajar memecahkan masalah dari berbagai industri.


Bahkan diintegrasikan dengan ChatGPT. Manfaatnya apa?

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun


Selain itu, DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Tunggu apa lagi, segera Sign Up dan persiapkan diri untuk menguasai Excel dari level apapun dengan ikuti Bootcamp Data Analyst with Excel


Penulis : Dita Feby 

Editor : Annissa Widya


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login