PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

0 Hari 1 Jam 38 Menit 37 Detik

Belajar Menggunakan Pandas Python untuk Beginner

Belajar Data Science di Rumah 27-Agustus-2022
https://dqlab.id/files/dqlab/cache/21a6474e76dae8656f889aa50f6243a2_x_Thumbnail800.jpg

Pandas adalah library python yang bersifat open source yang dibuat terutama untuk bekerja dengan data relasional atau berlabel secara mudah. Library yang satu ini menyediakan berbagai struktur data dan operasi untuk memanipulasi data numerik dan deret waktu.


Pandas dibangun di atas library NumPy. Salah satu kelebihan dari library pandas adalah lebih cepat dan memiliki kinerja serta produktivitas tinggi untuk berbagai pekerjaan pengolahan data.


Pandas awalnya dikembangkan oleh Wes McKinney pada tahun 2008 saat dia bekerja di AQR Capital Management. Dia memperbolehkan AQR untuk membuka sumber Pandas. Karyawan AQR lainnya, Chang She, bergabung sebagai kontributor utama untuk membangun library ini pada tahun 2012. Seiring berjalannya waktu, banyak versi pandas yang telah dirilis.


Versi terbaru pandas adalah 1.4.1. Pandas adalah salah satu library yang wajib dikuasai oleh seorang pemula karena library ini akan sangat berguna untuk berbagai tugas. Pada artikel kali ini kita akan belajar cara menggunakan library pandas khususnya untuk beginner. Jadi untuk kamu yang sedang belajar Data Science menggunakan Python, yuk simak artikel ini sampai akhir!


1. Install Library Pandas

Langkah pertama bekerja menggunakan pandas adalah memastikan library tersebut sudah terpasang di folder Python. Jika belum terinstall, maka kita perlu menginstalnya di sistem kita menggunakan perintah pip.


Caranya gampang, kita bisa menggunakan python-pip. Cukup ketikkan script di bawah ini kemudian run, maka library akan terinstall dan bisa digunakan.

python


Baca juga: Coding Python Simpel untuk Operasi Matematika


2. Mengimport Library Python

Setelah pandas diinstal ke dalam sistem, kita perlu mengimpor library ini agar bisa digunakan. Modul ini umumnya diimpor sebagai:

python


Istilah pd disebut sebagai alias untuk Pandas. Namun, sebenarnya kita tidak perlu mengimpor perpustakaan menggunakan alias, itu hanya sebagai pembantu untuk mempermudah dalam menulis code yang lebih singkat.


Alias ini juga bisa kita ubah sesuai keinginan kita. Pada umumnya, pandas bisa digunakan untuk manipulasi dua struktur data, yaitu series dan dataframe.


3. Series dengan Pandas

Di dunia nyata, Seri Pandas akan dibuat dengan memuat kumpulan data dari penyimpanan yang sudah ada. Penyimpanan ini dapat berupa database SQL, file CSV, file Excel, dan data storage lainnya.


Series pandas dapat dibuat dari list, dictionary, dari nilai skalar, dan lain sebagainya. Berikut ini adalah cara untuk membuat series menggunakan pandas.

python


4. Dataframe dengan Pandas

Pandas dataframe adalah struktur data tabular dua dimensi yang dapat berubah ukuran dan berpotensi heterogen dengan sumbu berlabel (baris dan kolom).


Dataframe terdiri dari tiga komponen utama, yaitu data, baris, dan kolom. Gambar di bawah ini adalah salah satu cara untuk membuat data frame menggunakan pandas.

python


Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python


Ingin belajar fungsi dan kegunaan lain yang lebih kompleks menggunakan pandas python? Yuk belajar dengan berbagai modul data science bersama DQLab!


Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses free modul dari DQLab ‘Introduction to Data Science’ dengan python dan R serta nikmati ebook gratis yang bisa diakses kapanpun dan dimanapun. Selamat belajar!


Penulis: Galuh Nurvinda K

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login