TERMURAH HARGA RAMADHAN!
Belajar Data Science Bersertifikat, 6 BULAN hanya Rp 99K!
0 Hari 20 Jam 49 Menit 24 Detik

Menggabungkan Data dengan Pandas Python Untuk Pengolahan Data

Belajar Data Science di Rumah 04-Juli-2022
https://dqlab.id/files/dqlab/cache/f18b56cc07565223bc2bc1433f0a123e_x_Thumbnail800.jpg
Follow Instagram dan LinkedIn kami untuk info karir dan topik menarik

Pandas adalah library open source Python yang menyediakan tools analisis dan manipulasi data berkinerja tinggi menggunakan struktur datanya yang kuat. Nama Pandas berasal dari kata Panel Data yang artinya sebuah Ekonometrika dari data Multidimensional. Pada tahun 2008, Wes McKinney, seorang developer mulai mengembangkan panda ketika membutuhkan alat yang fleksibel dan berkinerja tinggi untuk analisis data. Sebelum Pandas, Python sebagian besar digunakan untuk munging dan persiapan data.


Dengan menggunakan Pandas, kita dapat menyelesaikan lima langkah umum dalam pemrosesan dan analisis data, mulai dari loading data, data preparation, memanipulasi, memodelkan, dan menganalisis data. Python dengan Pandas digunakan dalam berbagai bidang termasuk bidang akademik dan komersial termasuk keuangan, ekonomi, Statistik, analitik, dan lain sebagainya.


Salah satu fungsi Pandas Python adalah untuk menggabungkan beberapa data frame menjadi satu dataframe untuk membuat data frame berukuran lebih besar dengan berbagai metode. Dalam berbagai kasus, data analyst sering kali menggunakan beberapa metode untuk menggabungkan data dengan Pandas Python. Penasaran apa saja metode tersebut? Yuk kita simak bersama!


1. Metode appned()

Metode append() dapat digunakan pada data frame atau seri yang ditujukan untuk menambah baris-nya saja. Jika di SQL memiliki 2 tabel atau lebih maka dapat digabungkan secara vertikal dengan Union. Jadi SQL Union ekuivalen dengan metode .append() di Pandas. Pertama kita buat dahulu data framenya yang didefinisikan dengan s1 dan s2 seperti gambar di bawah ini. Kemudian, kita gabungkan kedua data frame tersebut menggunakan metode append().

https://lh5.googleusercontent.com/XcEcAuIvZ8b7HvKocxH__5sAMmFOIfdtyd4v0HY9QfwinL_D-aYN8aPf0T9w0AAMAXK_ZUyLyDbZYdd9eYG4qMZOOz-4ahBW8jbw655sCB17PR0aAE8eysFpZtyHyA99eu7IuMgyQKsSREcOJjUirsM

https://lh3.googleusercontent.com/biERhos34sD0VhpRiaeIekpbwHj67fWufWvE1UeLg1dmiwmpTyKqRq-KWe4scVB7s53ejP-RhSXR0BVrbm2YHHDaYloglrtXQqOq2eDKTzoGSEaMPSqKGCztvuK_q37hfGCr6YB4ZYPiQW3HopG96mw

Baca juga: Coding Python Sederhana untuk Beginner yang Baru Mengenal Python


2. Metode concat()

Metode .concat() dapat digunakan pada data frame yang ditujukan untuk penggabungan baik dalam row-wise (dalam arah) atau column-wise. Pada metode ini, pada contoh berikut ini, kita akan menempati posisi kedua dataframe dibawah dan gabungkan dengan concat. Pertama, kita buat data framenya terlebih dahulu dengan df 1 dan df2 kemudian digabungkan menjadi concat().

https://lh3.googleusercontent.com/fNE-mLGPh5TR3j_Q2UQZHJHHTzrnY1vAzWg6ygM2sJx_ya0PXbOptXikR_cVYDsMz5YIhYCOB4e_hEHt3wLLjl1ig35YtueW2b2zbfgH6Hc-JimucOkW1mnjEUI7A7GP6W-arQWifM19w_SqzQ1VFIM

https://lh3.googleusercontent.com/mncjaXrUA1x76A3e3Jm2cg2W-8vCi-UmS6WfePzwWxN3BmIsB9t2re6CoBTIzWU4eLBNakU_CPLZPOf2y6JEDLP6TZ7alrRUqDGRw4k2A0Dd6ttV3ox3krxF4uAK95jA2UAxfYlJt4LaBKOvhJ8Yrco


3. Metode merge()

Metode .merge() digunakan untuk menggabungkan Series atau Data Frame yang bentuknya mirip dengan syntax join di SQL, specify left and right tables, join key dan how to join (left, right, inner, full outer). Metode ini bisa digunakan untuk data frame dengan index tunggal maupun multiindex. Pada artikel kali ini kita akan mencoba menggabungkan data frame dengan index tunggal. Pertama kita definisikan data frame menjadi df1 dan df2, kemudian kita gabungkan data frame untuk left, right, inner, dan full outer.

https://lh4.googleusercontent.com/X5jxtV879N26pNbhRrQ_dpMc51CbuINodOKl-8oI0s3IDZArPW8Rca4GGx0Xo0I9Cz_gfclmc6iI2zSDoEO2sjpk9qCxE5F0QlbtivyUdxnRaJDZzMHYbJ5tjG4WLVPeqYP4Crxt7m-lAii9mrTR2vI

https://lh6.googleusercontent.com/7RAEGbujk_dI1WD9HQXZRcZbKC4U0Ackaf1NtPPnrI-DE_bF1jGlC-PhPIBKqStDWfOuMph6XeBXEqfIwifh-XQdaL0b4a2A_aL7J6hdRjLpdTtT76mOEDx_qhdtFzMdbXQK3_aAFpEVEuVhc7MNy2Q

https://lh5.googleusercontent.com/gnGp3WUn-fFYjo0pRkIKQbkOAWaVG--j8TQeI7QT15wj_7jm9OSSdsSS6EneJN5CvMVHQC3QDscmEezCXYJQQTU-m6vMCyuBfS4VcmxNpt1HKo7HIWd3h4OD5qA9YiJbsT1O5_SazMsRrunwbOwi5zI


4. Metode join()

Metode .join() digunakan pada data frame untuk menggabungkan kedua data dengan set index pada kedua tabel tersebut sebagai join key. Tanpa index, hal ini tidak akan berhasil. Metode ini memiliki beberapa tipe seperti right, left, inder, outer, dan lain sebagainya. Pada contoh kali ini, kita akan menggabungkan data frame menggunakan tipe outer join. Pertama, kita definisikan data frame menjadi df1 dan df 2 kemudian kita gabungkan dengan metode outer join.

https://lh5.googleusercontent.com/roMo4boOTF9FGnyu650hqurKwOBveqDH0cQxmz2xTww53jvot8IuEKJDCAOpHTJ3ZdB5t0niVksJXfDfjImf0ZVLpkvzy-dDnF5Wv5CZWvnRkycGzpnXgHj3uh0W0SeyION0ztZK94w70juA5BDFcSA

https://lh5.googleusercontent.com/F2CHy0covXdq0c2K7typiDCySDSp4gIniJBnDQs6OEKvwCMd2_hq3dm-kQqZ6dYL7RP1xe9MQf6JwOTNOVdg31V-a-l53Q7td3ze6SdQGr87vlo4azQfTvVDiuY1tI2frcqa3h7z93rT7YXh54iYN_o


Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python


5. Perdalam Pengetahuan Pandas Python 

Ingin memperdalam penggunaan python untuk pengolahan dan manipulasi data? Yuk belajar dengan modul dari DQLab!  Klik button di bawah ini atau sign up melalui DQLab.id dan nikmati FREE modul dari DQLab serta ebook GRATIS yang bisa diakses 24 jam. Yuk mulai asah dan tingkatkan skill python sebagai bekal berkarir di era big data. Selamat belajar!


Penulis: Galuh Nurvinda K

Editor: Annissa Widya Davita



Mulai Belajar
Python Sekarang
Bersama DQLab

Buat Akun Belajar & Mulai Langkah
Kecilmu Mengenal Python

Buat Akun


Atau

Sudah punya akun? Login