MAU PUNYA SKILL DATA SCIENCE YANG AMAYZING?
Belajar Data Science 6 Bulan hanya 150K  | Pakai Kode: AMAYZING
BURUAN SERBU!
Pendaftaran ditutup dalam 0 Hari 1 Jam 16 Menit 56 Detik 

Belajar Excel untuk Data Cleaning, Yuk !

Belajar Data Science di Rumah 30-April-2021
https://dqlab.id/files/dqlab/cache/580894de647afada41a640fc3631c3e7_x_Thumbnail800.jpg

Data adalah bahan baku utama dalam penelitian. Data tidak didapatkan secara cuma-cuma. Perlu teknik pengumpulan data, baik pengumpulan data primer maupun sekunder. Ketika berhasil dikumpulkan, sebagian data tidak bisa langsung digunakan karena masih berupa raw data atau data mentah yang belum rapi baik dari segi struktur, format, spasi tambahan, missing value, data duplikat, dan lain sebagainya. Oleh karena itu, sebelum digunakan, data harus melewati proses cleansing dahulu. Proses ini bertujuan untuk mengubah data yang masih tidak konsisten menjadi data yang konsisten baik dari format maupun isinya. Proses cleansing terdiri dari berbagai langkah. Setiap langkah tidak harus berurutan dan tidak harus selalu ada, tergantung dari kerumitan data yang kita gunakan. 


Jika data yang kita gunakan sedikit, proses cleansing bisa dilakukan secara manual. Namun, apabila data yang kita gunakan berukuran besar, akan sangat sulit dan membutuhkan waktu yang lama untuk membersihkan data. Untungnya, excel memiliki banyak fitur yang bisa kita manfaatkan untuk membersihkan data. Beberapa tahap pada proses cleansing antara lain identifikasi data, menghapus data duplikat, dan mengubah format data agar konsisten. Pada artikel kali ini kita akan membahas beberapa proses data cleaning beserta contoh penggunaannya. Penasaran? Yuk simak artikel berikut ini hingga akhir!


1. Mengubah Text Menjadi Lower/Upper/Proper

Dataset yang baru dikumpulkan terdiri dari huruf kapital dan non kapital yang terkadang tidak beraturan. Sedangkan beberapa metode analisis data bersifat case sensitive yang artinya huruf kapital sangat berpengaruh pada hasil analisis. Oleh karena itu, kita perlu mengubah huruf kapital sebelum menganalisis dataset tersebut. Excel memiliki formula untuk mengubah text menjadi upper, lower, dan proper yang bisa kita manfaatkan untuk mengubah format test. Secara umum, formula tersebut ditulis sebagai berikut:

  • =LOWER(text), merupakan formula untuk mengubah huruf kapital menjadi non kapital

  • =UPPER(text), merupakan formula untuk mengubah huruf non kapital menjadi kapital

  • =PROPER(text), merupakan formula untuk mengubah text menjadi text yang mengandurng huruf kapital dan non kapital.  

Agar lebih mudah dipahami, yuk simak ilustrasi berikut ini!


excel


Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja


2. Menggabungkan Beberapa Data dalam Satu Cell

Terkadang pada beberapa penelitian, kita perlu menggabungkan beberapa data pada cell yang berbeda menjadi satu cell. Excel memiliki beberapa cara untuk menggabungkan beberapa cell menjadi satu cell. Beberapa cara tersebut adalah dengan menambahkan karakter dan ‘&’ pada setiap cell atau dengan rumus =CONCATENATE(text1;text2;...;textn). Kelebihan lain dari excel adalah kedua cara ini dapat dikombinasikan. Penasaran bagaimana caranya? Yuk simak contoh berikut ini!


excel


3. Menghapus Data Duplikat

Dalam proses pengumpulan data, tidak jarang kita menghadapi adanya data ganda atau duplikat. Untuk menangani masalah ini, excel memiliki banyak cara. Salah satunya adalah dengan memberikan highlight pada cell yang nilainya sama lalu menghapus atau me-remove data duplikat yang sudah terhighlight. Caranya, pertama pada menu home, pilih conditional formatting, lalu pilih highlight cells rules, dan terakhir pilih duplicate values. Setelah itu data yang sama akan terhighlight. Untuk menghapus data yang sama, pada menu data pilih remove duplicate kemudian akan muncul jendela untuk memilih kolom mana saja yang ingin kita hapus. Secara otomatis data tersebut akan terhapus. Agar lebih mudah, yuk simak contoh di bawah ini!


excel


4. Parse Data pada Tiap Kolom

Dalam proses data cleansing, ada yang tahap yang dikenal dengan proses tokenizing. Proses ini merupakan proses memisahkan kata pada setiap kalimat dengan delimited atau pembatas tertentu. Excel memiliki fitur yang bisa kita manfaatkan untuk melakukan proses tokenizing dengan cara select cell berisi teks yang akan dipisahkan, lalu pilih menu data kemudian pilih text to column. Setelah itu akan muncul jendela setting sehingga kita bisa memilih pemisahan kalimat berdasarkan delimited apa. Agar lebih mudah yuk simak contoh di bawah ini. Pada contoh berikut kita akan memisahkan kata pada beberapa kalimat berdasarkan spasi atau space.


excel


Baca juga : Kenali Rumus IF pada 3 Kondisi dengan Excel


5. Pelajari Rumus Excel Lainnya Bersama DQLab

Selain 4 formula di atas, excel masih memiliki ratusan formula lain yang sangat berguna dalam penelitian. Bingung bagaimana cara mempelajari semua formula excel? Yuk belajar dengan modul dari DQLab! Modul DQLab didesain dan disusun oleh expert di bidang data sehingga materi yang kita pelajari sudah terjamin kualitasnya. Selain itu, modul DQLab juga dilengkapi dengan contoh, ilustrasi, dan challenge menggunakan data yang mencerminkan data real di dunia industri sehingga kita memiliki pengalaman menghandle data sesungguhnya. Gimana cara aksesnya? Cukup klik button di bawah ini untuk signup dan nikmati modul gratis excel dari DQLab. Selamat belajar!


Penulis: Galuh Nurvinda K

Editor: Annissa Widya Davita

Postingan Terkait

Sign Up & Mulai Belajar Gratis di DQLab!