DQLab Super Giveaway! Belajar Data Science 6 Bulan hanya Rp.99.000! DAFTAR

Pakai Kode: KUPON99K. Berakhir 0 Days 22 Jam : 4 Menit : 52 Detik

Belajar Python : 3 Fungsi Pandas Python yang Jarang Diketahui

Belajar Data Science di Rumah 02-Oktober-2020
https://dqlab.id/files/dqlab/cache/d9845b3836a1c8d8a3b393f19a2f89aa_x_Thumbnail800.jpg

DQLab sudah berbagi mengenai berbagai tips penggunaan pandas pada beberapa artikel sebelumnya. Apabila kamu belum mengetahui apa itu Pandas dalam bahasa pemrograman Python, maka kamu dapat membacanya pada artikel DQLab yang satu ini. Melalui artikel tersebut, kamu akan mengenali apa itu Pandas dan beberapa struktur data dasar pada Pandas. Kamu juga dapat membaca beberapa tips penggunaan pandas lain yang sudah tertulis dalam artikel DQLab lain seperti ini. Pada artikel tersebut, diberikan 3 fungsi Pandas yang sangat berguna untuk proyek data mu. 

Pada artikel kali ini, DQLab kembali berbagi kepada sahabat data semua mengenai 3 fungsi pandas yang sangat berguna, akan tetapi jarang diketahui. Penasaran apa saja 3 fungsi yang jarang diketahui tersebut? Baca terus artikel ini sampai habis ya!

1. Fungsi idxmin() and idxmax()

Secara singkat, fungsi idxmin memunculkan index dari nilai terendah pertama yang ditemui pada suatu series. Sebaliknya, fungsi idxmax memunculkan index dari nilai tertinggi pertama yang ditemui dalam suatu series. Semisal, dibuat series sebagai berikut : 


Tentu saja, dalam series dengan jumlah data yang sangat sedikit seperti pada contoh di atas, kita dapat langsung menentukan pada index berapa nilai tertinggi dan terendah berada. Namun, pada data sesungguhnya, kita tidak akan bekerja dengan jumlah data seperti itu. Data di kehidupan nyata sangat besar dan akan sangat sulit untuk mencari index dari nilai tertinggi pertama pada suatu series atau kolom dari suatu DataFrame. Saat inilah idxmin dan idxmax sangat berguna. Perhatikan contoh penerapannya sebagai berikut :


Hanya dengan menuliskan nama series, diikuti dengan fungsi .idxmin() dan fungsi .idxmax() maka kita langsung mendapatkan posisi index dari nilai terendah dan tertinggi di suatu series. Pemahaman akan idxmin dan idx max ini juga akan sangat berguna pada poin selanjutnya yang akan dibahas dalam artikel ini.

Baca Juga : Ingin Mendalami Penerapan Python? Yuk, Kenali Library Pandas untuk Memproses dan Mengolah Data!

2. Fungsi ne()

Fungsi ne() secara sederhana adalah fungsi yang akan memunculkan nilai True apabila nilai pada indeks tertentu di suatu kolom tidak sama dengan angka yang kita inginkan/tentukan dan akan memunculkan False apabila sebaliknya. Untuk lebih memahami penggunaan fungsi ini, mari kita praktekan dengan contoh. Diasumsikan kita memiliki suatu DataFrame sebagai berikut :


Kita dapat menerapkan fungsi ne() pada DataFrame tersebut, khususnya pada kolom “contohKolom”. Pada contoh ini kita akan mencoba untuk menetapkan angka 0 dalam fungsi ne. Berikut adalah contoh hasil dari penggunaan fungsi ne() dengan menetapkan angka 0 :


Dapat kita lihat, seluruh data yang nilainya 0 angka berubah menjadi False, sedangkan yang bukan angka nol akan menjadi True. sampai disini mungkin kita belum dapat benar-benar mendapatkan manfaatnya. Akan tetapi. Ini akan bermanfaat apabila kita gabungkan dengan fungsi pada poin sebelumnya yaitu idxmax. Berikut contohnya :


3. Fungsi nsmallest() and nlargest()

Fungsi selanjutnya adalah fungsi nsmallest dan nlargest. Dari namanya saja mungkinsahabat data DQLab sudah dapat menebak apa yang dilakukan oleh fungsi ini. Funsgi ini mengeluarkan data terbesar atau terkecil sebanyak n. Fungsi ini sebenarnya adalah fungsi yang mengganti sort_values karena lebih singkat dalam penulisan kodenya. Untuk lebih memahami, mari kita coba dengan contoh. Semisal, kita memiliki data jumlah Follower Artis sebagai berikut:


Tentu saja, contoh di atas hanyalah data imajiner, terdapat beberapa nama artis pada contoh di atas seperti Mang Oleh, Keanu, Fadil Jaidi, dan lain sebagainya. Apabila kita ingin memunculkan 3 artis dengan follower paling banyak atau paling sedikit, maka disinilah nlargest dan nsmallest sangat berguna. Perhatikan contoh berikut:


Seperti yang dapat kita lihat pada contoh di atas, kita hanya perlu mendefinisikan 2 parameter; yang pertama berupa angka menunjukkan berapa banyak yang ingin kita tunjukkan. Pada contoh di atas kita memunculkan 3 data, dan dari kolom mana kita ingin ambil datanya. Sehingga pada contoh di atas kita telah melihat 3 artis dengan jumlah follower terbanyak dan 3 artis dengan follower paling sedikit. Bagaimana sahabat data? Sangat mudah bukan?

Baca Juga : Ingin Mendalami Penerapan Python? Yuk, Kenali Library Pandas untuk Memproses dan Mengolah Data!

4. Yuk Pelajari Pandas Python Lebih Dalam Bersama DQLab!

Ingin mempelajari Python lebih dalam? Ayo mulai belajar bersama DQLab secara GRATIS! Yuk, bergabung di DQLab! Kamu bisa membangun portofolio datamu dengan belajar data science di DQLab. Untuk kamu yang ingin mulai belajar data science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.

Dengan belajar di DQLab, kamu bisa:

  • Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial

  • Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring

  • Bangun portofolio data langsung dari praktisi data Industri

  • Akses Forum DQLab untuk berdiskusi. 

Simak informasi di bawah ini untuk mengakses gratis module ‘Introduction to Data Science’:

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

Semangat belajar sahabat Data DQLab!

Penulis : Jihar Gifari

Editor : Annissa Widya 

Share

Postingan Terkait

Mulai Bangun Karirmu Bersama DQLab!