JULY SPECIAL ! DISKON 96%
Belajar Data Science Bersertifikat, 12 Bulan hanya 180K!
1 Hari 16 Jam 13 Menit 37 Detik

Praktik Coding Pandas Python dengan AI ChatGPT

Belajar Data Science di Rumah 15-Oktober-2023
https://dqlab.id/files/dqlab/cache/1-longtail-kamis-09-2023-10-15-171500_x_Thumbnail800.jpg

Dalam era digital seperti sekarang, AI semakin memperluas kemampuan manusia dalam berbagai bidang, termasuk pemrograman. Salah satu terobosan yang kini sangat populer adalah ChatGPT, sebuah model bahasa buatan yang dikembangkan oleh OpenAI.


Model ini dapat membantu kalian menyelesaikan berbagai tugas pemrograman, termasuk melakukan analisis data menggunakan Pandas.


Wah bagaimana caranya? Nah, artikel ini akan membantu kalian untuk mengenal lebih dekat tentang Pandas Python dan cara memanfaatkan ChatGPT dalam menyelesaikan masalah yang berkaitan dengan Pandas.


Yuk, langsung simak pembahasan di bawah ini. Kalian juga bisa praktik supaya lebih cepat paham!


1. Mengenal Library Pandas di Python

Pandas adalah sebuah perpustakaan (library) Python yang menyediakan struktur data yang fleksibel dan tools analisis data yang membantu kalian untuk mengolah serta menganalisis data dengan mudah dan cepat.


Pada intinya, Pandas menyediakan dua tipe struktur data utama, yaitu Series dan DataFrame. Series merupakan sebuah array satu dimensi yang dapat menyimpan data dari berbagai tipe. Sedangkan DataFrame adalah array dua dimensi yang mirip dengan tabel dalam basis data, spreadsheet, atau data.frame di R. 


Kedua struktur data ini diperlukan untuk penyimpanan data dari berbagai jenis tipe data dan memiliki metode integrasi dengan banyak sumber data lainnya, termasuk file CSV, Excel, dan database SQL.


Fitur-fitur yang disediakan Pandas membantu kalian dalam memanipulasi, mengagregasi, dan memvisualisasikan data dengan beberapa baris kode saja.


Baca juga : Bootcamp Machine Learning and AI for Beginner


2. Fungsi Pandas Python

Pandas memiliki beragam fungsi yang bisa digunakan untuk mengeksplorasi, mengolah, dan menganalisis dataset. Misalkan kalian memiliki dataset berisi informasi penjualan produk dari suatu perusahaan selama beberapa tahun.


Kemudian kalian perlu membersihkan dan memformat data tersebut agar sesuai dengan kebutuhan analisis. Di sini, Pandas memiliki fungsi seperti dropna() yang dapat menghapus baris atau kolom dengan data kosong, atau fillna() yang memungkinkan penggantian nilai kosong dengan nilai tertentu.


Ketika datanya sudah bersih, kemudian kalian melakukan eksplorasi awal untuk memahami tren penjualan, distribusi produk, atau pola musiman. Fungsi Pandas seperti groupby() bisa dimanfaatkan untuk pengelompokan data berdasarkan kriteria tertentu, misalnya mengelompokkan data berdasarkan bulan atau tahun untuk melihat total penjualan dalam periode waktu tersebut.


Selain itu, dengan describe(), kalian juga dapat dengan cepat memperoleh informasi statistik deskriptif dari setiap kolom, memberikan gambaran umum mengenai distribusi data seperti rata-rata, median, standar deviasi, dan lainnya.


Bahkan Pandas Python juga bisa digunakan untuk menggabungkan dataset penjualan dengan dataset lain yang berisi informasi biaya produksi untuk menghitung keuntungan bersih. Misalnya dengan menggunakan fungsi seperti merge() atau join().


Dengan Pandas, proses tersebut menjadi sederhana. Bahkan, jika kalian ingin melakukan operasi pivot mirip Excel atau menghitung rata-rata untuk analisis time-seried, Pandas juga menyediakan fungsi yang memudahkan hal tersebut.


3. Contoh Penggunaan Pandas Python

Misalkan kalian seorang data analyst di perusahaan e-commerce. Kalian memiliki dataset dalam bentuk file CSV yang berisi informasi tentang penjualan sepatu selama satu minggu. Dataset tersebut memiliki kolom-kolom berikut: Tgl (untuk Tanggal), Model, Merk, dan Terjual.


Artificial Intelligence


Kalian pasti perlu mengimpor data dari file CSV ke dalam Python. Dengan Pandas, hal ini dapat dilakukan hanya dalam satu baris kode:


Artificial Intelligence


Lalu, kalian ingin mengetahui model sepatu yang paling banyak terjual selama minggu itu. Nah, dengan menggabungkan groupby() dan sum(), kalian bisa mendapatkan total penjualan untuk setiap model.


Artificial Intelligence


Selain itu, kalian mungkin ingin mengetahui bagaimana tren penjualan sepatu dengan merk "Nike" selama seminggu. Dengan memfilter data berdasarkan merk dan kemudian mengagregasikan, kalian bisa mendapatkan informasi tersebut.


Artificial Intelligence


Contoh di atas menunjukkan bagaimana Pandas Python dapat digunakan untuk mengimpor, menganalisis, dan mencari insight dari dataset secara cepat dan akurat.


Baca juga : Konsep Artificial Intelligence & Machine Learning


4. Cara Gunakan ChatGPT untuk Coding Pandas

Lalu bagaimana menggunakan ChatGPT untuk paham coding Pandas? Pertama, kalian harus menyiapkan prompt deskripsi yang spesifik menjelaskan kondisi data kalian. Hal ini dikarenakan ChatGPT tidak bisa membaca dataset secara akurat. Contoh promptnya seperti ini.


Artificial Intelligence


Secara cepat, ChatGPT akan membantu kalian untuk menjawab dan memberikan contoh coding Pandas yang sesuai dengan deskripsi yang diberikan.


Artificial Intelligence


Kalian cukup copy paste coding yang dituliskan oleh Python dan edit ulang agar sesuai dengan kondisi dataset atau kebutuhan analisis data yang sedang dilakukan.


Karena ChatGPT tidak secara lengkap bisa mengakses dataset kalian, tetap ada kemungkinan deskripsi yang kalian buat tidak sepenuhnya diterima dengan ChatGPT secara tepat. Jadi, jangan lupa untuk lakukan cek ulang.


Kalian juga bisa menggunakan ChatGPT untuk memandu proses analisis data jika ada kemungkinan masih belum tahu apa saja yang bisa dilakukan dengan dataset yang kalian miliki. Perhatikan contoh prompt berikut.


Artificial Intelligence


Dengan ini, ChatGPT akan merekomendasikan beberapa proses analisis data yang bisa kalian coba.


Artificial Intelligence


Nah, proses belajar analisis dan eksplorasi dataset jadi lebih mudah kan? Yuk, eksplorasi lebih jauh lagi penggunaan ChatGPT bersama DQLab. Modul ajar di platform ini dilengkapi studi kasus yang membantu kalian belajar memecahkan masalah dari berbagai industri.


Jadi, tidak terbatas seperti contoh di atas, nih. DQLab juga mengintegrasikan modul dan ChatGPT , sehingga:

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun


Selain itu, DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Tunggu apa lagi, segera ikuti Bootcamp Machine Learning and AI for Beginner dan persiapkan diri untuk mahir membuat code dan menjadi praktisi data yang andal! 


Penulis : Dita Feby 

Editor : Annissa Widya


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login