Pelatihan Data Cleaning dengan Microsoft Excel
Proses data cleaning menjadi langkah penting yang perlu dilakukan sebelum analisis data. Nah, kalian bisa loh menggunakan Excel untuk melakukan proses cleaning tersebut. Dengan beragam fungsi yang sudah disiapkan, tools satu ini tidak membutuhkan pemahaman coding sehingga cocok untuk para pemula.
Bagaimana data cleaning menggunakan Excel? Artikel kali ini akan memberikan tutorial praktis yang bisa kalian ikuti. Mulai dari menghapus data duplikat hingga mengganti null pada data. Penasaran bagaimana langkah-langkah dari setiap proses cleaning tersebut? Yuk, langsung praktikkan penjelasan berikut!
1. Menghapus Data Duplikat
Menghapus data duplikat diperlukan karena dapat meningkatkan akurasi selama proses analisis data. Keberadaan duplikat dalam dataset dapat menyebabkan perhitungan dan analisis yang tidak akurat, sehingga menghasilkan informasi yang kurang tepat. Selain itu, data duplikat juga dapat mempengaruhi efisiensi dan keterbacaan laporan atau grafik yang dibuat dari dataset tersebut.
Untuk praktik menghapus data duplikat, perhatikan contoh berikut. Misalkan kalian memiliki data seperti di bawah ini.
Untuk bisa menghapus data duplikat, Pilih tab “Data” kemudian klik “Remove Duplicates”. Akan muncul kotak dialog seperti berikut.
Dalam jendela yang muncul, pilih kolom atau kolom-kolom yang ingin kalian bersihkan dari duplikat, misalnya, kolom "Nama". Setelah itu, Excel akan secara otomatis menghapus baris yang memiliki nilai duplikat di kolom tersebut.
Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja
2. Filter dan Sort Data
Menggunakan fitur filter dan sort dalam Excel adalah langkah penting dalam mengelola data karena memudahkan kalian untuk mengeksplorasi, menganalisis, dan memahami informasi dengan lebih efisien.
Fungsi filter akan menyaring data berdasarkan kriteria tertentu, sehingga hanya data yang sesuai dengan kriteria tersebut yang ditampilkan. Ini sangat berguna untuk mengeksplorasi subset data atau fokus pada informasi tertentu dalam dataset yang besar. Misalkan kalian punya data seperti berikut ini.
Kemudian kalian ingin memfilter produk yang harganya di atas 500000. Maka, pada Excel pilih tab “Data” lalu klik “Filter”.
Selanjutnya klik panah pada kolom “Harga”. Atur pada “Number Filters” sesuai kebutuhan. Karena kita ingin produk dengan harga lebih dari 500000, maka pilih “Greater than”
Maka akan muncul kotak dialog seperti berikut. Ketikkan 500000.
Jika kalian berhasil, maka data kalian akan terfilter untuk produk dengan harga di atas 500000.
Baca juga : Bootcamp Data Analyst with SQL and Python
3. Mengisi dan Mengganti Nilai Kosong
Mengisi dan mengganti nilai kosong atau null dalam Excel merupakan langkah penting dalam membersihkan data karena nilai yang kosong dapat mempengaruhi analisis dan visualisasi data. Data yang tidak lengkap atau memiliki nilai kosong dapat menghasilkan hasil analisis yang tidak akurat dan dapat memengaruhi keputusan yang diambil berdasarkan data tersebut.
Perhatikan contoh data yang memiliki null berikut ini.
Blok data tersebut. Kemudian Pergi ke tab "Home" > "Editing" > "Find & Select" > "Go To Special".
Selanjutnya pada kotak dialog, pilih “Blanks”.
Dalam sel terpilih, ketik nilai yang ingin Anda isi, misalnya, 0. Tekan "Ctrl + Enter" untuk mengisi nilai tersebut ke sel-sel yang kosong.
Wah, ternyata data cleaning sangat diperlukan sebelum melakukan proses analisis data. Dengan beragam fungsi yang sudah disiapkan ternyata data cleaning menggunakan Excel cukup mudah, nih. Penasaran proses data cleaning apa lagi yang bisa dilakukan? Pelajari lebih lanjut di DQLab.
Modul ajarnya lengkap dan bervariasi. Semua skill yang dibutuhkan akan diajarkan. Dilengkapi studi kasus yang membantu kalian belajar memecahkan masalah dari berbagai industri. Bahkan diintegrasikan dengan ChatGPT. Manfaatnya apa?
Membantu kalian menjelaskan lebih detail code yang sedang dipelajari
Membantu menemukan code yang salah atau tidak sesuai
Memberikan solusi atas problem yang dihadapi pada code
Membantu kalian belajar kapanpun dan dimanapun
Selain itu, DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Tunggu apa lagi, segera Sign Up dan persiapkan diri untuk menguasai Excel dari level apapun. Yuk ikuti Baca juga : Bootcamp Data Analyst with Excel!
Penulis : Dita Feby
Editor : Annissa Widya