Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Pelajari Library Pandas Lewat Bootcamp Python DQLab

Belajar Data Science di Rumah 25-Januari-2023
https://dqlab.id/files/dqlab/cache/170b67f467ba4ed3eb8c92bc90ad05a6_x_Thumbnail800.jpeg

Python menjadi salah satu bahasa pemrograman yang banyak digunakan di bidang pengembangan teknologi. Tidak terkecuali juga seorang praktisi data, yang melakukan analisis dan mengambil informasi dari data yang dimiliki. Salah satu keunggulan yang ada pada Python bagi praktisi data adalah adanya library Pandas yang memudahkan memanipulasi data. Secara sederhana Pandas Python mengubah tampilan data menjadi visual baris dan kolom sehingga mudah diamati.


Pandas pada Python memiliki dua jenis bentuk data yaitu Series dan DataFrame. Secara umum Pandas DataFrame digunakan untuk proses data cleansing, data eksploratory, data visualization, dan tahapan analisis data lainnya. Keduanya memiliki keunggulan masing-masing sesuai kebutuhan. Seperti apa detail dari masing-masing jenis tersebut? Yuk, simak penjelasan berikut ini!


1. Apa Itu Pandas?

Pandas adalah open-source library yang dibuat terutama untuk bekerja dengan data relasional atau berlabel supaya lebih mudah dan terstruktur. Pandas menyediakan berbagai struktur data dan operasi untuk memanipulasi data numerik dan time series. Pandas dibangun di atas library NumPy. Panda bersifat cepat dan memiliki kinerja serta produktivitas yang tinggi. Beberapa keunggulan yang dimiliki oleh Pandas untuk memanipulasi data adalah sebagai berikut.

  • Cepat dan efektif untuk proses manipulasi dan analisis data.

  • Dapat menganalisis data dari beragam file.

  • Fleksibel dalam kebutuhan pivot data set.

  • Menyediakan fungsi yang dapat menganalisis data time series.

Cara kerja Pandas cukup menarik. Data berupa CSV, TSV, atau SQL diubah menjadi obyek Python dengan rows dan column yang disebut sebagai data frame. Objek ini terlihat sangat mirip dengan tabel yang terdapat pada software statistika seperti Excel atau SPSS. Data yang sudah diolah akan sangat mudah dianalisis karena berbentuk daftar library.


Pandas umumnya menyediakan dua struktur data yang berguna untuk memanipulasi data. Struktur tersebut adalah Series dan DataFrame. Pandas Series merupakan array satu dimensi yang dapat memegang data dari berbagai tipe, mulai dari integer, string, hingga Python object. Pandas DataFrame sedikit berbeda karena merupakan struktur dua dimensi. Oleh karenanya, data yang diproses akan disusun dalam bentuk tabel dengan rows dan column. Umumnya, DataFrame terdiri atas tiga komponen penting: data, rows, dan column. 


Baca juga : Tips Coding Python Sederhana untuk Pemula


2. Mengenal Pandas Series

Pandas Series adalah struktur data dasar Pandas yang berbentuk array berlabel satu dimensi. Series mampu menampung berbagai jenis data seperti integer, string, float, dan lainnya. Series dapat digambarkan sebagai pengembangan dari NumPy satu dimensi yang mempunyai index secara eksplisit. Supaya lebih jelas apa itu Pandas Series, yuk kita praktikkan cara membuatnya. 

Untuk menggunakan Pandas kita harus import terlebih dahulu.

Python

Selanjutnya kita akan membuat series dengan menginputkan bentuk list seperti berikut.

Python

Kalian juga bisa menginputkan dalam bentuk array. Namun, import NumPy terlebih dahulu untuk mengaktifkan fungsi array.

Python

Perbedaan array dan list terdapat pada kemampuan menyimpan elemen data. Array dapat menyimpan elemen hanya dari satu tipe data tetapi list juga dapat menyimpan elemen dari tipe data yang berbeda. Dari hasil yang telah dijalankan keduanya baik array atau list dapat dilihat bahwa kolom kiri adalah indeksnya (indeks eksplisit) dan kolom kanan adalah nilainya. Kalian juga bisa memodifikasi nilai indeksnya. Perhatikan cara berikut.

Python

Kalian juga bisa mengakses nilai dari Series dengan menyebutkan label indeksnya. Perhatikan cara berikut.

Python

Cara lainnya yang bisa dicoba adalah dengan melalui indeksnya seperti berikut ini.

Python


Baca juga : Array Python : Array VS List Serupa Namun Tak Sama, Yuk, Kenali Perbedaannya


3. Mengenal Pandas DataFrame

DataFrame adalah struktur data 2 dimensi yang berbentuk tabular (mempunyai baris dan kolom). Ada beberapa cara untuk membuat DataFrame antara lain melalui List, Dict, Series, File atau DataFrame lain. Mari kita praktikkan beberapa cara tersebut.


Membuat DataFrame dari list

Pertama import terlebih dahulu library Pandas. Selanjutnya buat variabel data yang menyimpan beberapa List dan gunakan fungsi DataFrame() untuk membuat DataFrame baru. Berikut contohnya.

Python


Membuat DataFrame dari dictionary

Kalian juga bisa membuat DataFrame dari kumpulan Dictionary yang dikumpulkan di dalam list. Perhatikan contoh berikut.

Python

Kalian juga bisa mengakses data berdasarkan kolom berdasarkan nama kolom tersebut. Sebagai contoh dengan data di atas, kalian akan mengakses kolom ‘Matematika’. Berikut caranya.

Python

Jika ingin memanggil lebih dari satu kolom gunakan tanda “[[ ]]” seperti berikut ini.

Python

Sedangkan untuk mengakses baris kita gunakan fungsi loc dan iloc. Perhatikan contoh berikut untuk mengakses baris ke 3.

Python


4. Pelajari Pandas Lebih Lanjut di DQLab

Pandas memiliki fungsi yang lebih luas lagi terlebih dalam menyelesaikan analisis data di kehidupan nyata. Contoh di atas hanya teori dasar dalam penggunaan Pandas Python. Nah, kalian bisa belajar dengan praktik studi kasus melalui program Bootcamp Live Class yang disediakan DQLab. 


Python


Live Class adalah salah satu metode pembelajaran paling tepat yang ditawarkan DQLab agar Sahabat DQ bisa mulai belajar Python. Tidak hanya Python, bahkan di sini kalian juga bisa belajar SQL yang juga menunjang pemahaman kalian di bidang data science. Apa saja manfaat mengikuti Live Class ini?

  • Variatif dan komplit. Variatif karena terdiri dari kelas pemula sampai advance. Komplit karena tidak hanya belajar teori tapi juga praktik. 

  • Materi dan rekaman dapat diakses selamanya.

  • Mendapatkan dukungan dari awal. Live Class memberikan kelas persiapan untuk memastikan kalian siap mengikuti kelas

  • Dibimbing dengan mentor berpengalaman.

  • Mendapatkan komunitas baru yang saling mendukung.

Tunggu apalagi? Yuk segera daftarkan diri kalian atau Sign Up dan nikmati semua manfaat di atas!


Penulis : Dita Feby 

Editor : Annissa Widya


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login