Contoh Struktur Data pada Pandas Python
Bahasa python merupakan bahasa pemrograman yang sering digunakan para praktisi data. Hal ini juga menjadi salah satu penyebab semakin populernya bahasa pemrograman python. Salah satu kelebihan bahasa python adalah banyaknya library yang tersedia yang dapat membantu pengguna dalam menyelesaikan masalah dalam menganalisis data.
Salah satu library yang sering digunakan adalah pandas python, terutama untuk proses manipulasi data.
Pandas adalah library dalam python yang memiliki dua tipe struktur data yaitu series dan dataframe. Pandas merupakan library dalam python yang berlisensi BSD dan bersifat open source. Library pandas ini biasanya digunakan untuk membersihkan data mentah sehingga menjadi data yang sudah siap diolah atau dianalisis, seperti membuat tabel, mengubah dimensi data, menggabungkan data, memanipulasi data, mengecek data, dll.
1. Memanggil Pandas
Beberapa library dalam python sebelum digunakan perlu melalui proses pemanggilan. Sebelum memanggil library pun ada kalanya kita juga perlu menginstall library tersebut.
Sebagai contoh sederhana, jika pengguna ingin menggunakan library pandas untuk proses manipulasi data maka perlu mengetikkan kode yang digunakan untuk memanggil pandas. Berikut adalah contoh input dan output dalam memanggil pandas
Baca juga: Yuk, Praktekkan Coding Python Sederhana untuk Pemula
2. Struktur Pandas
Library pandas memiliki dua jenis struktur data, yaitu series dan dataframe. Struktur data series merupakan satu kolom bagian dari tabel data frame yang merupakan 1 dimensional numpy array sebagai baris datanya, terdiri dari 1 tipe data.
Adapun dataframe merupakan gabungan dari series, yang berbentuk rectangular data yang merupakan tabel spreadsheet itu sendiri. Perhatikan contoh code editor di bawah ini
jika di console, perhatikan outputnya
3. Membuat Series dan Dataframe dari List
Struktur data series maupun dataframe dapat dibuat dari berbagai macam tipe data container atau mapping dalam python, salah satunya adalah list. List merupakan kumpulan data berbagai macam tipe data yang bersifat mutable, dapat diganti. Perhatikan contoh membuat series dari list berikut
outputnya adalah
Adapun untuk membuat dataframe dari list adalah
adapun outputnya adalah
4. Membuat Series dan Dataframe dari Dictionary
Selian membuat series dan dataframe dari list, pengguna juga dapat membuat series dan dataframe dari dictionary. Dictionary merupakan kumpulan data yang strukturnya terdiri dari key dan value. Perhatikan contoh membuat series dari dictionary berikut
adapun outputnya adalah
Adapun cara membuat dataframe dari dictionary adalah sebagai berikut
adapun outputnya adalah
Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python
Penggunaan library pandas merupakan salah satu skill yang perlu dipahami dan dikuasai oleh para praktisi data. Dengan menghasilkan data yang baik dan sesuai keperluan, maka proses analisis data pun akan berjalan lebih mudah. Kalian dapat belajar manipulasi data menggunakan library pandas di beberapa modul yang ada di DQLab
DQLab menyajikan materi secara teori maupun praktek. Selain itu di DQLab pun menyediakan berbagai modul dan ebook dengan materi yang beragam sesuai kebutuhan.
Cara bergabungnya sangat mudah. Langsung saja sign up di DQLab.id/signup dan nikmati belajar data science DQLab.
Penulis : Latifah Uswatun Khasanah
Editor : Annissa Widya Davita