Coding Python Sederhana dengan Atribut DataFrame
Python merupakan bahasa pemrograman yang ramah bagi pemula. Terlebih lagi bagi kamu yang ingin belajar data science dari dasar. Bicara soal Python, kita bisa mulai dengan belajar coding yang sederhana. Coding python yang sederhana membuat kita jadi lebih intens untuk mempelajari masing-masing baris sesuai dengan yang diperintahkan.
Selain itu, kita bisa melakukan print atau mencetak hasil output yang sudah kita ketikkan codingnya untuk mendapatkan hasil yang kita inginkan. Salah satu coding python dasar yang bisa kita pelajari terlebih dahulu adalah atribut dataframe.Â
Dalam bahasa pemrograman Python, atribut DataFrame mengacu pada properti atau karakteristik yang dimiliki oleh objek DataFrame dalam pustaka Pandas. Atribut ini memungkinkan Anda untuk mengakses informasi tentang DataFrame atau mengambil bagian-bagian tertentu dari DataFrame.
Dalam konteks pustaka Pandas di bahasa pemrograman Python, atribut-atribut umum yang dapat diterapkan pada objek DataFrame (tabular data). Misalnya atribut .shape: yang mana hasilnya memberikan dimensi DataFrame dalam bentuk tupel (jumlah baris, jumlah kolom). Contoh lagi pada atribut .dtypes yang memberikan informasi tentang tipe data dari setiap kolom dalam DataFrame.Â
Kali ini, kita akan belajar sama-sama terkait coding python sederhana dengan menggunakan atribut DataFrame pada bahasa pemrograman Python. Pemahaman tentang atribut-atribut ini akan sangat membantu Anda dalam memanipulasi, menganalisis, dan memproses data tabular dalam proyek-proyek Python Anda. Yuk kita simak dan belajar bareng disini sahabat DQLab!
1. Attribute .info()
Attribute .info() digunakan untuk mengecek kolom apa yang membentuk dataframe itu, data types, berapa yang non null, dll. Attribute ini tidak dapat digunakan pada series, hanya pada data frame saja.
Atribut .info() adalah metode yang digunakan dalam konteks pustaka Pandas di Python. Ini digunakan untuk memberikan ringkasan singkat dari Pandas DataFrame atau Series, menampilkan informasi penting tentang data yang terkandung di dalamnya. Berikut cara menggunakannya:
Ketika Anda memanggil df.info(), itu akan menampilkan informasi berikut tentang DataFrame:
Jumlah nilai non-null (tidak hilang) dalam setiap kolom.
Jenis data setiap kolom (misalnya, int64 untuk integer, object untuk string).
Penggunaan memori dari DataFrame.
Baca juga : Bootcamp Data Analyst with SQL and Python
2. Attribute .shape()
Attribute .shape digunakan untuk mengetahui berapa baris dan kolom, hasilnya dalam format tuple (baris, kolom).
Di dalam Pandas, .shape adalah sebuah atribut, bukan metode. Atribut ini digunakan untuk mendapatkan dimensi (jumlah baris dan kolom) dari sebuah DataFrame atau Series. Ini memberikan output dalam bentuk tupel yang berisi dua angka, yaitu jumlah baris dan jumlah kolom. Berikut adalah contoh penggunaannya:
Hasilnya akan menjadi:
Berdasarkan output diatas, hal Ini berarti DataFrame memiliki 3 baris dan 3 kolom. Sebagai catatan, karena ini adalah atribut, Anda tidak perlu menggunakan tanda kurung seperti yang Anda lakukan dengan metode.
3. Attribute .dtypes
Attribute .dtypes digunakan untuk mengetahui tipe data di tiap kolom. Tipe data object: kombinasi untuk berbagai tipe data (number & text, etc).
Atribut .dtypes adalah atribut yang digunakan dalam pustaka Pandas di Python untuk mendapatkan tipe data (data types) dari setiap kolom dalam sebuah DataFrame. Atribut ini memberikan informasi tentang tipe data yang digunakan untuk merepresentasikan nilai-nilai dalam setiap kolom.
Anda dapat menggunakannya untuk memeriksa tipe data kolom dalam DataFrame Anda. Contohnya sebagai berikut:
Hasilnya akan menjadi:
Hal ini Ini menunjukkan bahwa kolom "Nama" dan "Kota" memiliki tipe data "object" (biasanya digunakan untuk data string), sedangkan kolom "Usia" memiliki tipe data "int64" (integer 64-bit). Ini adalah informasi yang berguna ketika Anda ingin memeriksa atau memahami jenis data yang Anda miliki dalam DataFrame Anda
Baca juga : Mengenal Perbedaan R Python dan SQL
4. Attribute .astype
Attribute .astype(nama_tipe_data) untuk convert tipe data berdasarkan tipe data seperti: float, int, str, numpy.float, numpy.int ataupun numpy.datetime.
Atribut .astype adalah metode yang digunakan dalam pustaka Pandas di Python untuk mengubah tipe data (data type) dari satu atau beberapa kolom dalam DataFrame. Anda dapat menggunakannya untuk mengonversi tipe data kolom menjadi tipe data yang berbeda sesuai dengan kebutuhan analisis atau pemrosesan data Anda. Metode ini mengembalikan salinan DataFrame yang telah diubah tipe data.
Contoh penggunaan .astype:
Hasilnya akan menjadi:
Dalam contoh ini, kami mengubah tipe data kolom 'Usia' dari integer menjadi float. .astype memungkinkan Anda untuk melakukan konversi tipe data seperti integer ke float, object ke string, atau jenis konversi lainnya sesuai kebutuhan Anda dalam analisis data Anda.
Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industri!
DQLab adalah platform edukasi pertama yang mengintegrasi fitur ChatGPT yang memudahkan beginner untuk mengakses informasi mengenai data science secara lebih mendalam.
DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Jadi sangat cocok untuk kamu yang belum mengenal data science sama sekali. Untuk bisa merasakan pengalaman belajar yang praktis dan aplikatif, yuk sign up sekarang di DQLab.id atau ikuti Bootcamp Data Analyst with SQL and Python berikut untuk informasi lebih lengkapnya!
Penulis: Reyvan Maulid