Coding Python Simpel untuk Mengenal DataFrame
Python tidak hanya memiliki sintaks yang mudah dipahami, tapi juga mampu mengolah beragam bentuk dan jenis data. Hal ini bisa dilakukan karena bahasa pemrograman satu ini memiliki berbagai library yang digunakan sesuai kebutuhan. Salah satunya library Pandas yang membuat Python mampu membuat struktur data tabular, dikenal dengan DataFrame.
DataFrame Python sangat membantu SahabatDQ untuk memanipulasi dan menganalisis data dengan format mirip spreadsheet. Bagaimana cara membuat struktur data tersebut? Nah artikel kali ini akan mengulas beberapa contoh coding sederhana yang bisa kalian praktikkan untuk mengenal DataFrame lebih jauh lagi. Yuk, langsung simak pembahasannya!
1. Apa itu DataFrame?
DataFrame adalah struktur data tabular yang umum digunakan dalam analisis data dan pengolahan data di Python, terutama dengan menggunakan library Pandas. DataFrame mirip dengan tabel dalam database atau spreadsheet di mana data disusun dalam baris dan kolom. Setiap kolom dalam DataFrame mewakili satu variabel atau fitur, sementara setiap baris menggambarkan satu entitas atau pengamatan.
DataFrame memudahkan manipulasi dan analisis data karena menyediakan berbagai fungsi dan metode yang memungkinkan kalian untuk melakukan operasi seperti filter, pengurutan, pengelompokan, dan penggabungan data dengan mudah. Dengan menggunakan DataFrame, kalian dapat dengan efisien melakukan transformasi data, menjalankan analisis statistik, dan memvisualisasikan hasilnya.
Baca juga : Mengenal Perbedaan R Python dan SQL
2. Coding Membuat DataFrame
Nah, sekarang saatnya kita praktikkan cara membuat DataFrame dengan konteks yang sederhana. Misalkan kita ingin membuat data tabular nama siswa dengan masing-masing nilainya untuk mata pelajaran IPA, Bahasa Inggris, dan Matematika. Berikut bentuk coding yang bisa kalian eksekusi.
Python akan membuat output yang menyerupai tabel dengan format baris kolom seperti berikut.
3. Coding Mengakses Kolom dan Baris
Dalam proses analisis data, kita juga perlu mengakses input-input tertentu baik secara kolom atau baris. Nah, kalian juga bisa menggunakan sintaks khusus untuk mengaksesnya di DataFrame Python. Berikut contoh sederhana untuk mengakses kolom.
Perhatikan sintaks umur = df['Umur']. Sintaks ini mengakses kolom 'Umur' dari DataFrame df dan menyimpannya dalam variabel umur. Hasilnya adalah Series yang berisi nilai umur dari setiap baris.
Sedangkan contoh coding untuk akses baris adalah sebagai berikut.
Sintaks baris_ke_dua = df.iloc[1] mengakses baris kedua (indeks 1) dari DataFrame df dan menyimpannya dalam variabel baris_ke_dua. Hasilnya adalah Series yang berisi nilai dari setiap kolom untuk baris tersebut.
Kalian juga bisa mengakses beberapa baris seperti contoh berikut ini.
Sintaks beberapa_baris = df.iloc[[0, 3]] mengakses beberapa baris sekaligus (indeks 0 dan 3) dari DataFrame df dan menyimpannya dalam variabel beberapa_baris. Hasilnya adalah DataFrame yang hanya berisi baris-baris tersebut.
Baca juga : Bootcamp Data Analyst with SQL and Python
4. Coding Filtering dan Seleksi Data
DataFrame juga bisa diakses dengan proses filter atau seleksi dengan kondisi tertentu. Sebagai contoh, kalian ingin memfilter data siswa yang memiliki umur di atas 18 tahun. Maka, sintaksnya bisa seperti ini.
Dari contoh di atas, df['Umur'] > 18 adalah kondisi untuk memfilter baris yang memenuhi kriteria umur di atas 18 tahun. Outputnya akan menunjukkan data yang hanya memenuhi kondisi tersebut.
Kalian bisa menggunakan Python untuk beragam kebutuhan di atas bahkan juga untuk membuat model prediksi atau machine learning lainnya. Nah, untuk bisa di level tersebut tentu kalian perlu memahami dasarnya dulu kan? DQLab hadir untuk membantu kalian memahami dasar-dasar machine learning dan ilmu data lainnya!
DQLab adalah platform belajar online yang memiliki metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Menariknya lagi, DQLab juga mengintegrasikan modulnya dengan fitur ChatGPT nih! Fungsinya untuk apa?
Membantumu mendapatkan penjelasan dari code yang sedang dipelajari.
Membantumu menemukan code yang salah atau tidak sesuai.
Memberikan alternatif solusi dari problem/error yang kalian temukan.
Jadi, tunggu apalagi? Nikmati pengalaman belajar praktis dan menyenangkan di DQLab dengan Sign Up segera di sini atau ikuti Bootcamp Data Analyst with SQL and Python!
Penulis : Dita Feby
Editor : Annissa Widya