Tutorial Pandas Python Sederhana dengan Jupyter Notebook
Sebagai salah satu bahasa pemrograman tingkat tinggi yang berorientasi objek dengan semantik yang dinamis. Pyhton memiliki library yang cukup lengkap yang bisa digunakan untuk membuat program python menjadi semakin lebih sederhana dan nyaman bagi programmer karena tidak perlu menulis kode yang sama berulang kali untuk program yang berbeda. Saat ini, python memiliki lebih dari 137.000 library yang dapat membantu kamu dalam membuat program bagik untuk Data Analysis, Artificial Intelligence (AI), Machine Learning, tapi juga sangat powerfull untuk web apps dan GUI.
Oleh karena itu, library python memainkan peran yang sangat vital dalam bidang pembelajaran mesin, data science, visualisasi data, aplikasi manipulasi gambar dan data, dan masih banyak lagi. Salah satu library yang sering digunakan adalah pandas.
Pandas merupakan library python yang open source dan mudah digunakan untuk membuat tabel, mengubah dimensi data , mengecek data dan lainnya. Sesuai dengan singkatannya Pandas yaitu Python Data Analysis, pandas sering digunakan untuk data manipulation. Untuk membersihkan data mentah ke dalam sebuah bentuk yang bisa untuk diolah dan lainnya. Selanjutnya tentang library pandas mari simak artikel dibawah ini!
1. Sekelimut Tentang Library Pandas
Pandas adalah library yang dibuat untuk membantu pengembangan bekerja dengan data œberlabel dan œrelasional secara intuitif. Ini didasarkan pada dua struktur data utama: œSeries (satu dimensi,seperti daftar item) dan œbingkai data (Dua dimensi, seperti tabel dengan beberapa kolom).
Pandas memungkinkan konversi struktur data ke objekFrame objek, menangani data yang hilang dan menambah atau menghapus kolom dari dataFrame, menghapus file yang hilang dan merencanakan data dengan histogram atau kotak. Ini harus dimiliki pengerahan data, manipulasi dan visualisasi data. Kamu juga bisa mengunjungi situs https://pandas.pydata.org/docs/ untuk mempelajari pandas melalui dokumentasinya.
Baca juga: Coding Python Sederhana Menggunakan Jupyter Notebook
2. Cara Import Library Pandas
Dalam python memeng library pandas belum secara default terinstall. Jadi, kita perlu menginstallnya terlebih dahulu sebelum menggunakannya. Untuk dapat menginstall pandas, kamu bisa menjalankan perintah dengan menggunakan pip ataupun bisa menggunakan Anaconda
pip install pandas
Dengan menggunakan library Anaconda, kita bisa menginstallnya dengan perintah berikut,
conda install pandas
Jika sudah berhasil melakukan instalasi Pandas, kita dapat menggunakannya untuk melakukan manipulasi data dengan cara import modul tersebut pada projek yang akan kita buat.
import pandas as pd
import numpy as np
3. Membaca Data CSV
Pandas memungkinkan kita untuk membaca dan menganalisis dari berbagai jenis data seperti CSV, JSON, XLSX, HTML, XML. Kali ini kita akan sama-sama belajar bagaimana cara membaca data dari sumber data tersebut dengan menggunakan library pandas dan fungsi read_csv() untuk membaca file format CSV. Untuk membaca file CSV kita gunakan fungsi read_csv() umumnya nilai dalam format CSV dipisahkan oleh koma sehingga parameter separator fungsi read_csv() adalah koma
Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python
4. Membuat Data Frame dengan Pandas
Series merupakan struktur data dasar dalam Pandas. Series diibaratkan sebagai array satu dimensi sama halnya dengan numpy array, hanya bedanya mempunyai index dan index tersebut dapat kita kontrol dari setiap elemen tersebut. Perintah dasar untuk membuat sebuah series dengan Pandas adalah
pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
Parameter data, diisi dengan data yang akan dibuat series. Struktur data yang bisa ditampung berupa integer, float, dan juga string.
Parameter index, diisi dengan index dari series. Jumlah index harus sama dengan jumlah data. Jika kita tidak mengisi parameter index, maka series akan memiliki index integer seperti halnya array biasa.
Parameter dtype, diisi dengan tipe data dari series, dan parameter copy untuk copy data, secara default akan bernilai false.
Berdasarkan sintaks di atas, kita akan membuat contoh series menggunakan Python list ataupun numpy sebagai contoh data untuk membuat series.
Yuk, gabung bersama DQLab kamu bisa belajar data scientist tanpa perlu ribet install text editor atau IDE sekalipun. Karena DQLab menyediakan fitur live code yang menarik dan menyenangkan untuk belajar data science berbasiskan learning by doing. Karena dapat membantu kamu membiasakan diri untuk langsung mempraktekkan teori yang telah kamu pelajari.
Dengan menyediakan modul-modul up-to-date dan sesuai dengan penerapan industri yang disusun oleh mentor-mentor berpengalaman dibidangnya dari berbagai unicorn, dan perusahaan besar seperti Tokopedia, DANA, Jabar Digital dan masih banyak lagi. Yuk, belajar terstruktur dan lebih interaktif caranya dengan Sign Up sekarang untuk #MulaiBelajarData di DQLab:
Buat Akun Gratis dengan Signup di DQLab.id/signup atau isi form dibawah ini ya!
Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
Subscribe DQLab.id untuk Akses Semua Module Premium! cukup dengan Sign up sekarang di DQLab.id untuk nikmati pengalaman belajar yang seru dan menyenangkan!
Penulis: Rian Tineges
Editor: Annissa Widya Davita