Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Pelatihan Data Cleaning dengan Microsoft Excel

Belajar Data Science di Rumah 20-November-2023
https://dqlab.id/files/dqlab/cache/2-longtail-senin-08-2023-11-20-123906_x_Thumbnail800.jpg

Proses data cleaning menjadi langkah penting yang perlu dilakukan sebelum analisis data. Nah, kalian bisa loh menggunakan Excel untuk melakukan proses cleaning tersebut. Dengan beragam fungsi yang sudah disiapkan, tools satu ini tidak membutuhkan pemahaman coding sehingga cocok untuk para pemula.


Bagaimana data cleaning menggunakan Excel? Artikel kali ini akan memberikan tutorial praktis yang bisa kalian ikuti. Mulai dari menghapus data duplikat hingga mengganti null pada data. Penasaran bagaimana langkah-langkah dari setiap proses cleaning tersebut? Yuk, langsung praktikkan penjelasan berikut!


1. Menghapus Data Duplikat

Menghapus data duplikat diperlukan karena dapat meningkatkan akurasi selama proses analisis data. Keberadaan duplikat dalam dataset dapat menyebabkan perhitungan dan analisis yang tidak akurat, sehingga menghasilkan informasi yang kurang tepat. Selain itu, data duplikat juga dapat mempengaruhi efisiensi dan keterbacaan laporan atau grafik yang dibuat dari dataset tersebut.


Untuk praktik menghapus data duplikat, perhatikan contoh berikut. Misalkan kalian memiliki data seperti di bawah ini.

Excel


Untuk bisa menghapus data duplikat, Pilih tab “Data” kemudian klik “Remove Duplicates”. Akan muncul kotak dialog seperti berikut.

Excel


Dalam jendela yang muncul, pilih kolom atau kolom-kolom yang ingin kalian bersihkan dari duplikat, misalnya, kolom "Nama". Setelah itu, Excel akan secara otomatis menghapus baris yang memiliki nilai duplikat di kolom tersebut.

Excel


Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja


2. Filter dan Sort Data

Menggunakan fitur filter dan sort dalam Excel adalah langkah penting dalam mengelola data karena memudahkan kalian untuk mengeksplorasi, menganalisis, dan memahami informasi dengan lebih efisien. 


Fungsi filter akan menyaring data berdasarkan kriteria tertentu, sehingga hanya data yang sesuai dengan kriteria tersebut yang ditampilkan. Ini sangat berguna untuk mengeksplorasi subset data atau fokus pada informasi tertentu dalam dataset yang besar. Misalkan kalian punya data seperti berikut ini.

Excel


Kemudian kalian ingin memfilter produk yang harganya di atas 500000. Maka, pada Excel pilih tab “Data” lalu klik “Filter”. 

Excel


Selanjutnya klik panah pada kolom “Harga”. Atur pada “Number Filters” sesuai kebutuhan. Karena kita ingin produk dengan harga lebih dari 500000, maka pilih “Greater than”

Excel


Maka akan muncul kotak dialog seperti berikut. Ketikkan 500000.

Excel


Jika kalian berhasil, maka data kalian akan terfilter untuk produk dengan harga di atas 500000.

Excel


Baca juga : Bootcamp Data Analyst with SQL and Python


3. Mengisi dan Mengganti Nilai Kosong

Mengisi dan mengganti nilai kosong atau null dalam Excel merupakan langkah penting dalam membersihkan data karena nilai yang kosong dapat mempengaruhi analisis dan visualisasi data. Data yang tidak lengkap atau memiliki nilai kosong dapat menghasilkan hasil analisis yang tidak akurat dan dapat memengaruhi keputusan yang diambil berdasarkan data tersebut.


Perhatikan contoh data yang memiliki null berikut ini. 

Excel


Blok data tersebut. Kemudian Pergi ke tab "Home" > "Editing" > "Find & Select" > "Go To Special". 

Excel


Selanjutnya pada kotak dialog, pilih “Blanks”.

Excel


Dalam sel terpilih, ketik nilai yang ingin Anda isi, misalnya, 0. Tekan "Ctrl + Enter" untuk mengisi nilai tersebut ke sel-sel yang kosong.

Excel


Wah, ternyata data cleaning sangat diperlukan sebelum melakukan proses analisis data. Dengan beragam fungsi yang sudah disiapkan ternyata data cleaning menggunakan Excel cukup mudah, nih. Penasaran proses data cleaning apa lagi yang bisa dilakukan? Pelajari lebih lanjut di DQLab.

Excel


Modul ajarnya lengkap dan bervariasi. Semua skill yang dibutuhkan akan diajarkan. Dilengkapi studi kasus yang membantu kalian belajar memecahkan masalah dari berbagai industri. Bahkan diintegrasikan dengan ChatGPT. Manfaatnya apa?

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun


Selain itu, DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Tunggu apa lagi, segera Sign Up dan persiapkan diri untuk menguasai Excel dari level apapun. Yuk ikuti Baca juga : Bootcamp Data Analyst with Excel


Penulis : Dita Feby 

Editor : Annissa Widya


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login