JULY SPECIAL ! DISKON 96%
Belajar Data Science Bersertifikat, 12 Bulan hanya 180K!
1 Hari 12 Jam 54 Menit 54 Detik

Coding Python Simpel untuk Mengenal DataFrame

Belajar Data Science di Rumah 21-Desember-2023
https://dqlab.id/files/dqlab/cache/longtail-senin-01-2023-12-18-215401_x_Thumbnail800.jpg

Python tidak hanya memiliki sintaks yang mudah dipahami, tapi juga mampu mengolah beragam bentuk dan jenis data. Hal ini bisa dilakukan karena bahasa pemrograman satu ini memiliki berbagai library yang digunakan sesuai kebutuhan. Salah satunya library Pandas yang membuat Python mampu membuat struktur data tabular, dikenal dengan DataFrame.


DataFrame Python sangat membantu SahabatDQ untuk memanipulasi dan menganalisis data dengan format mirip spreadsheet. Bagaimana cara membuat struktur data tersebut? Nah artikel kali ini akan mengulas beberapa contoh coding sederhana yang bisa kalian praktikkan untuk mengenal DataFrame lebih jauh lagi. Yuk, langsung simak pembahasannya!


1. Apa itu DataFrame?

DataFrame adalah struktur data tabular yang umum digunakan dalam analisis data dan pengolahan data di Python, terutama dengan menggunakan library Pandas. DataFrame mirip dengan tabel dalam database atau spreadsheet di mana data disusun dalam baris dan kolom. Setiap kolom dalam DataFrame mewakili satu variabel atau fitur, sementara setiap baris menggambarkan satu entitas atau pengamatan.


DataFrame memudahkan manipulasi dan analisis data karena menyediakan berbagai fungsi dan metode yang memungkinkan kalian untuk melakukan operasi seperti filter, pengurutan, pengelompokan, dan penggabungan data dengan mudah. Dengan menggunakan DataFrame, kalian dapat dengan efisien melakukan transformasi data, menjalankan analisis statistik, dan memvisualisasikan hasilnya.


Baca juga : Mengenal Perbedaan R Python dan SQL


2. Coding Membuat DataFrame

Nah, sekarang saatnya kita praktikkan cara membuat DataFrame dengan konteks yang sederhana. Misalkan kita ingin membuat data tabular nama siswa dengan masing-masing nilainya untuk mata pelajaran IPA, Bahasa Inggris, dan Matematika. Berikut bentuk coding yang bisa kalian eksekusi. 

Python


Python akan membuat output yang menyerupai tabel dengan format baris kolom seperti berikut.

Python


3. Coding Mengakses Kolom dan Baris

Dalam proses analisis data, kita juga perlu mengakses input-input tertentu baik secara kolom atau baris. Nah, kalian juga bisa menggunakan sintaks khusus untuk mengaksesnya di DataFrame Python. Berikut contoh sederhana untuk mengakses kolom.

Python


Perhatikan sintaks umur = df['Umur']. Sintaks ini mengakses kolom 'Umur' dari DataFrame df dan menyimpannya dalam variabel umur. Hasilnya adalah Series yang berisi nilai umur dari setiap baris.

Python


Sedangkan contoh coding untuk akses baris adalah sebagai berikut.

Python


Sintaks baris_ke_dua = df.iloc[1] mengakses baris kedua (indeks 1) dari DataFrame df dan menyimpannya dalam variabel baris_ke_dua. Hasilnya adalah Series yang berisi nilai dari setiap kolom untuk baris tersebut.

Python


Kalian juga bisa mengakses beberapa baris seperti contoh berikut ini.

Python


Sintaks beberapa_baris = df.iloc[[0, 3]] mengakses beberapa baris sekaligus (indeks 0 dan 3) dari DataFrame df dan menyimpannya dalam variabel beberapa_baris. Hasilnya adalah DataFrame yang hanya berisi baris-baris tersebut.

Python


Baca juga : Bootcamp Data Analyst with SQL and Python


4. Coding Filtering dan Seleksi Data

DataFrame juga bisa diakses dengan proses filter atau seleksi dengan kondisi tertentu. Sebagai contoh, kalian ingin memfilter data siswa yang memiliki umur di atas 18 tahun. Maka, sintaksnya bisa seperti ini.

Python


Dari contoh di atas, df['Umur'] > 18 adalah kondisi untuk memfilter baris yang memenuhi kriteria umur di atas 18 tahun. Outputnya akan menunjukkan data yang hanya memenuhi kondisi tersebut. 

Python


Kalian bisa menggunakan Python untuk beragam kebutuhan di atas bahkan juga untuk membuat model prediksi atau machine learning lainnya. Nah, untuk bisa di level tersebut tentu kalian perlu memahami dasarnya dulu kan? DQLab hadir untuk membantu kalian memahami dasar-dasar machine learning dan ilmu data lainnya!


DQLab adalah platform belajar online yang memiliki metode  HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Menariknya lagi, DQLab juga mengintegrasikan modulnya dengan fitur ChatGPT nih! Fungsinya untuk apa?

  • Membantumu mendapatkan penjelasan dari code yang sedang dipelajari.

  • Membantumu menemukan code yang salah atau tidak sesuai. 

  • Memberikan alternatif solusi dari problem/error yang kalian temukan.


Jadi, tunggu apalagi? Nikmati pengalaman belajar praktis dan menyenangkan di DQLab dengan Sign Up segera di sini atau ikuti Bootcamp Data Analyst with SQL and Python!


Penulis : Dita Feby 

Editor : Annissa Widya

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login