Cara Membuat Visualisasi Data untuk Pemula dan Kenali Fungsi-Fungsinya
Membuat visualisasi data merupakan hal yang agak tricky karena butuh keahlian dalam menyajikan data dengan baik. Data mentah atau raw data adalah data yang belum terorganisasi biasanya berupa tabel. Seringkali kumpulan data tersebut masih ada missing value, tipe data yang tidak seragam, penamaan data yang kurang jelas, dan lain sebagainya. Sebelum dilakukan visualisasi data, data mentah perlu diolah terlebih dahulu agar lebih rapi dan memudahkan proses komputasi. Jika data belum siap, data yang divisualisasikan tidak bisa menunjukkan informasi yang diharapkan dan akan mempengaruhi pengambilan keputusan yang kurang tepat. Sehingga wajib bagi orang yang mengolah data untuk memahami datanya sebelum sampai ke proses visualisasi data.
Python adalah bahasa pemrograman populer yang dapat digunakan untuk memvisualisasikan data. Seiring meningkatnya kepopuleran data science, Python sering digunakan para praktisi data untuk mengolah data science yang mana berupa big data. Selain itu Python bersifat open source artinya gratis untuk siapa saja untuk membangun program. Beberapa library yang dimiliki Python dan banyak dibahas adalah Pandas, Numpy, dan Matplotlib. Pandas untuk mengakses sumber data, Numpy untuk komputasi matematika, dan Matplotlib untuk membuat visualisasi data. Lalu bagaimana caranya membuat visualisasi data khususnya di Python? Penasaran, kan? Yuk, simak bersama pembahasannya dibawah ini!
1. Import Library Matplotlib
Seperti yang sudah disebutkan diatas, Matplotlib adalah library Python yang digunakan untuk membuat visualisasi data yang umumnya dibuat dalam bentuk grafik atau plot. Dengan matplotlib kita bisa membuat grafik 2D atau 3D. Dalam Anaconda atau Jupyter Notebook, library Matplotlib sudah termasuk di dalamnya. Namun untuk python script kita harus menginstall library terlebih dahulu melalui command prompt dengan menuliskan perintah sebagai berikut:
pip install matplotlib
atau
conda install matplotlib
Untuk menggunakan library Matplotlib kita perlu memanggil librarynya terlebih dahulu dengan menuliskan perintah berikut di Python.
import matplotlib.pyplot as plt
matplotlib.pyplot adalah yang paling sering dipakai ketika membuat grafik atau plot.
Baca juga : https://www.dqlab.id/belajar-python-untuk-hasilkan-visualisasi-data
2. Fungsi-Fungsi untuk Membuat Grafik atau Plot
Dalam membuat grafik dengan Python kita harus menggunakan fungsi-fungsi untuk menuliskan perintah. Misalnya dalam membuat bar plot tentu berbeda penggunaan fungsinya untuk pie plot begitu juga dengan grafik atau plot lainnya. Beberapa fungsi yang ada pada Python untuk membuat grafik yaitu sebagai berikut:
bar untuk membuat bar plot
bar_labels untuk menuliskan nama label pada bar plot
axis untuk mengatur sumbu pada plot
barh untuk membuat bar plot dalam posisi horizontal
axes untuk menambahkan sumbu dan menetapkannya pada plot
figtext untuk menambahkan tulisan pada plot
subplots untuk membuat dan mengatur plot
Masih banyak lagi fungsi pada Python untuk membuat grafik yang disesuaikan dengan kebutuhan seperti sublegend, xticks, figure, fill, figimage, colorbar, xlabel, yticks, dan lain sebagainya.
3. Bar Plot Sederhana
Setelah menyimak mengenai library Matplotlib dan beberapa fungsinya, sekarang kita coba praktekkan membuat bar plot sederhana. Tuliskan perintah berikut di Python.
Dalam membuat grafik jangan lupa untuk memanggil library Matplotlib. Jika tidak, maka perintah akan menghasilkan error. Pada code tersebut kita ingin membuat bar plot yang menunjukkan jumlah mahasiswa terhadap mata kuliah pilihan. Fungsi yang digunakan yaitu figure, barh, title, xlabel, xticks, dan yticks. Untuk menampilkan hasil gunakan perintah show(). Hasil dari code tersebut adalah sebagai berikut:
Bisa kita lihat mahasiswa paling banyak mengambil mata kuliah pilihan pemrograman Python dan paling sedikit yaitu matematika dan statistika.
4. Pie Plot dengan Python
Pernahkah kamu melihat grafik berbentuk lingkaran? Yup, itulah grafik pie atau pie plot. Pie plot digunakan untuk menyajikan data dalam bentuk persentase, yang mana setiap potongan pie berisikan data dengan ukuran tertentu. Secara visual pie plot menarik untuk penyajian data serta memudahkan pembaca dalam memahami data tersebut. Mari kita coba membuat pie plot sederhana dengan Python. Tuliskan perintah dibawah ini di Python.
Jangan lupa panggil library Matplotlib. Disini kita membuat pie plot yang menunjukkan persentase penjualan beberapa barang yang ada di toko. œStock berisi macam-macam barang, dan œSold berisi jumlah barang yang terjual. Fungsi pie digunakan untuk membuat pie plot. autopct='%1.2f%%' digunakan untuk menampilkan persentase pada setiap potongan, misalnya seperti code diatas akan menampilkan 40.56.
Dari grafik bisa kita lihat persentase penjualan terbanyak ada pada item "Egg" dan paling sedikit yaitu "Cheese".
Baca juga : https://www.dqlab.id/cara-membuat-visualisasi-data-trend-dengan-excel
5. Yuk, Belajar Mengimplementasikan Visualisasi Data di DQLab!
Belajar menggunakan Python untuk membuat visualisasi data diperlukan kecermatan dan latihan yang konsisten. Dalam dunia industri, data tidak hanya dalam bentuk tabel yang berupa angka namun bisa bermacam-macam jenis data. Sehingga kita perlu memahami berbagai jenis data untuk membuat visualisasi data yang baik. Visualisasi data ini penting bagi perusahaan untuk mengembangkan bisnisnya. Oleh karena itu, profesi sebagai praktisi data banyak dicari saat ini. Tertarik ingin menjadi Data Scientist dan Data Analyst? Gabung di DQLab.id dan bangun portofolio datamu untuk capai karir impian!
Penulis: Dita Kurniasari
Editor: Annissa Widya