2 DAYS ONLY FLASH SALE! 
Belajar Data Science 6 Bulan hanya 130K!

1 Hari 12 Jam 50 Menit 32 Detik

Library dan Jenis Visualisasi Data dengan Python yang Harus Diketahui

Belajar Data Science di Rumah 24-Agustus-2021
https://dqlab.id/files/dqlab/cache/b0b3da361a49fb6e3257c91ba9182249_x_Thumbnail800.jpg

Visualisasi data dengan Python adalah topik yang banyak dibahas saat ini. Pada proses data science, pengolahan datanya meliputi tahapan pengumpulan data, pengorganisasian data, pemrosesan data, manipulasi data hingga visualisasi data. Data science umumnya berhadapan dengan data yang sangat banyak sehingga untuk mendapatkan insight atau informasi dari kumpulan data tersebut perlu dilakukan visualisasi data. Dalam suatu perusahaan tidak semua paham untuk membaca data yang masih mentah. Untuk mempermudah pemahaman pihak lain mengenai hasil analisis maka ubahlah data ke dalam bentuk yang lebih menarik dan mudah dipahami. Oleh karena itu, penting bagi praktisi data memiliki kemampuan dalam memvisualisasikan data dengan tepat. 


Ada banyak aplikasi yang bisa digunakan untuk membuat visualisasi data salah satunya adalah Python. Python adalah software open source yang menyediakan banyak library untuk melakukan pengolahan data science dan membuat visualisasi data. Library populer yang sering digunakan dalam Python adalah matplotlib. Bagi yang sudah pernah belajar Python tentu tidak asing dengan library ini. Sedangkan pemula yang tertarik belajar Python mungkin sudah pernah membaca atau mengikuti seminar atau workshop yang membahas visualisasi data dengan Python. Artikel kali ini akan kita bahas mengenai library Matplotlib dan beberapa jenis plot yang sering digunakan untuk visualisasi data dengan Python. Simak pembahasannya bersama di bawah ini, yuk!


1. Library Matplotlib

Matplotlib adalah library Python yang digunakan untuk membuat visualisasi data agar lebih menarik dan mudah dipahami. Praktisi data tentu sudah terbiasa dengan data mentah berupa tabel yang sangat banyak. Namun pihak lain belum tentu mampu membaca data tersebut untuk memperoleh informasi dibaliknya. Visualisasi data dilakukan untuk menginterpretasikan data hasil analisis berupa insight atau informasi yang berguna bagi pihak yang membutuhkan. Misalnya dalam perusahaan bagian marketing, perencanaan bisnis, dan lainnya. Umumnya visualisasi data dibuat dalam bentuk grafik atau plot. Matplotlib dapat membuat visualisasi data dalam bentuk 2D dan 3D yang disesuaikan dengan kebutuhan. Beberapa bagian seperti ukuran, warna, dan lainnya bisa diatur oleh pemrogram agar informasi dapat tersampaikan dengan baik. Cara menggunakan library ini yaitu dengan perintah import matplotlib.pyplot as plt dengan penjelasan plt adalah sebutan yang digunakan untuk menyebut library matplotlib. 


Baca juga : Cara Hasilkan Visualisasi Data dengan Python 


2. Bar Plot dan Histogram

Bar plot adalah jenis plot yang digunakan untuk merepresentasikan data dalam bentuk bar, dimana bar menunjukkan ukuran sebuah variabel. Umumnya variabelnya adalah variabel numerik dan kategorik. Contoh bar plot dengan Python sebagai berikut:


                             Source: matplotlib.org

Selanjutnya ada histogram yaitu grafik yang digunakan untuk merepresentasikan distribusi frekuensi dari data numerik dengan batang. Sumbu X untuk bin dari data point sedangkan Y untuk frekuensi data poin pada setiap bin. Bin adalah angka yang dikelompokkan dalam rentang tertentu. Contoh visualisasi data histogram dengan Python yaitu sebagai berikut:


                            Source: matplotlib.org


3. Line Plot dan Scatter Plot

Line plot atau line chart adalah jenis grafik yang menampilkan informasi dengan menggunakan banyak titik yang terhubung dan membentuk segmen garis lurus. Line plot biasanya digunakan untuk melihat pertumbuhan atau pergerakan data dari waktu ke waktu. Contoh line plot dengan Python dapat dilihat sebagai berikut:


             Source: matplotlib.org

Scatter plot adalah jenis visualisasi untuk menampilkan hubungan antara dua variabel. Dengan plot ini, data ditampilkan dalam plotting titik data antara sumbu X dan sumbu Y. Untuk menerapkan scatter plot gunakan fungsi scatter() pada program dengan parameter atribut data numerik. Contoh scatter plot dengan Python adalah sebagai berikut:


                        Source: matplotlib.org


4. Box Plot

Box plot adalah bentuk visualisasi data yang digunakan untuk merepresentasikan distribusi data secara statistik melalui lima dimensi utama yaitu nilai minimum, kuartil 1, kuartil 2, kuartil 3, dan nilai maksimum. Box plot biasanya dipakai untuk melihat atau memeriksa keberadaan outlier di dalam suatu dataset. Outlier adalah objek yang berbeda polanya atau nilainya dibandingkan dengan objek-objek lainnya. Singkatnya outlier dilakukan untuk mendeteksi keabnormalan pada dataset. Contoh box plot dengan Python yaitu sebagai berikut:


               Source: matplotlib.org


Baca juga : Cara Hasilkan Visualisasi Data dengan Excel


5. Visualisasi Data dengan Data Ril di DQLab, yuk!

Membuat visualisasi data adalah pekerjaan sehari-hari seorang praktisi data. Praktisi data harus mampu memahami data dan mampu membuat visualisasi data dengan grafik atau plot yang sesuai dengan permasalahan yang ingin diselesaikan. Penggunaan grafik atau plot yang tepat akan memaksimalkan informasi atau insight yang diperoleh. Untuk pemula yang ingin belajar visualisasi data mulailah dengan dataset sederhana hingga mahir dan mampu memvisualisasikan dataset yang mirip di dunia data. Bersama DQLab sahabat data akan belajar memvisualisasikan data ril bersama para mentor ahli data. Yuk, jangan lewatkan kesempatannya! Gabung di DQLab.id dan mulai belajar data bersama talent data lainnya!


Penulis: Dita Kurniasari

Editor: Annissa Widya

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login