JULY SPECIAL ! DISKON 96%
Belajar Data Science Bersertifikat, 12 Bulan hanya 180K!
0 Hari 8 Jam 44 Menit 37 Detik

Cara Mencari dan Hapus Pernyataan Ganda di Excel

Belajar Data Science di Rumah 20-Februari-2024
https://dqlab.id/files/dqlab/cache/2-longtail-kamis-08-2024-02-20-155044_x_Thumbnail800.jpg

Dalam proses analisis data, para praktisi data sering dihadapkan pada berbagai jenis dan kondisi dataset. Salah satunya adalah adanya pernyataan ganda atau data duplikat. Hal ini perlu diperhatikan dan ditangani dengan baik untuk memastikan hasil analisis yang didapatkan akurat dan sesuai kondisi data terbaik. Nah, tentu untuk melakukannya kalian perlu tools khusus seperti Excel. Bagaimana cara mencari dan menghapus pernyataan ganda menggunakan Excel? Simak pada pembahasan berikut.


1. Pernyataan Ganda dan Dampaknya

Pernyataan ganda atau data duplikat adalah entri atau baris yang memiliki nilai yang sama di seluruh kolom atau atribut pada dataset. Kondisi ini memberikan beberapa dampak negatif dalam analisis data. Pertama, mempengaruhi akurasi proses analisis statistik dan model prediktif. Mengapa demikian? karena data duplikat dapat meningkatkan bobot atau frekuensi nilai tertentu secara tidak proporsional. Alhasil akan mengarah pada bias yang tidak diinginkan pada model yang dibangun.


Kedua, pernyataan ganda dapat mempengaruhi kinerja operasional database dan sistem, karena memerlukan ruang penyimpanan tambahan sehingga memperlambat proses pencarian dan manipulasi data. Oleh karena itu, penting untuk mengidentifikasi dan menghapus data duplikat ini agar terjamin akurasi dan kualitas analisis data yang dihasilkan.


Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja


2. Contoh Pernyataan Ganda dalam Dataset

Sebagai ilustrasi, sebuah perusahaan ritel memiliki database pelanggan yang berisi catatan nama pelanggan, alamat email, dan nomor telepon mereka. Data tersebut disimpan dalam spreadsheet Excel untuk keperluan manajemen hubungan pelanggan. Namun, karena beberapa kesalahan input data, ada kemungkinan data duplikat dalam spreadsheet tersebut. Perhatikan data tersebut di bawah ini.


Excel


Dalam dataset di atas, terdapat dua entri yang menunjukkan adanya data duplikat, yaitu untuk nama Mutiara Sari bahkan email dan nomor teleponnya pun sama. Jika data duplikat tidak diidentifikasi dan dihapus, analisis data pelanggan mungkin akan menghasilkan kesimpulan yang tidak akurat.


Misalnya, jika perusahaan ingin menghitung jumlah pelanggan unik, data duplikat akan menyebabkan perhitungan tersebut menjadi tidak akurat, karena beberapa pelanggan dihitung lebih dari satu kali.


3. Cara Cari dan Hapus Pernyataan Ganda di Excel

Data di atas tentunya masih sangat sederhana. Jadi bisa diidentifikasi dengan mudah melalui mata. Bagaimana kalau ada ribuan data? Tentu kalian perlu tools yang lebih canggih. Nah, Excel bisa digunakan untuk mencari bahkan menghapus pernyataan ganda atau data duplikat tersebut. Mari kita praktikkan dengan menggunakan data yang sama seperti di atas.

 

3.1 Menggunakan Highlight

Pertama, pilih atau blok seluruh area data yang ingin diperiksa. Di menu Excel, pilih tab “Home”. Kemudian pilih “Conditional Formatting”. Selanjutnya sorot bagian “Highlight Cells Rules”. 

Excel


Nanti akan ada banyak pilihan. Kalian bisa klik “Duplicate Values”

Excel


Nanti akan muncul box format cells yang meminta kalian untuk memilih data apa yang perlu dihighlight dan dengan warna apa. Dalam skenario ini, maka pilih “duplicate” dan pilih warna sesuai selera, misalkan “light red fill with dark red text”.

Excel


Jika setiap langkah-langkah di atas benar, maka kalian akan mendapatkan hasil seperti berikut. 

Excel

Nah, kalian tinggal hapus salah satu data yang dianggap duplikat.


3.2 Menggunakan Perintah Remove

Kalian juga bisa menggunakan cara lain untuk menghapus duplikat data tanpa highlight. Ini dilakukan jika memang kalian sudah yakin ingin langsung menghapusnya tanpa cek ulang. Pertama, sama dengan sebelumnya yaitu pilih atau blok seluruh area data yang ingin diperiksa. Klik tab “Data” kemudian pilih logo untuk “Remove duplicate”.

Excel


Nanti akan muncul kotak dialog yang ingin memastikan data dari kolom mana saja yang ingin kalian hapus. Di sini, misalkan kita akan hapus semua entri yang duplikat untuk semua kolom.

Excel


Maka secara otomatis, Excel akan menghapus salah satu data yang dianggap duplikat.

Excel


Baca juga : Bootcamp Data Analyst with Excel


4. Pelajari Lebih Lanjut di DQLab

Tertarik untuk mempelajari lebih lanjut secara praktiknya dengan berbagai macam studi kasus? 

Excel


Kalian bisa mulai belajar di DQLab. Modul ajarnya lengkap dan bervariasi. Semua skill yang dibutuhkan akan diajarkan. Dilengkapi studi kasus yang membantu kalian belajar memecahkan masalah dari berbagai industri. Bahkan diintegrasikan dengan ChatGPT. Manfaatnya apa?

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun


Selain itu, DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Tunggu apa lagi, segera Sign Up dan persiapkan diri untuk menguasai Excel dari level apapun. Yuk ikuti Bootcamp Data Analyst with Excel


Penulis : Dita Feby 

Editor : Annissa Widya

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login