PAYDAY SUPER SALE!! DISKON 98%
Belajar Data Science Bersertifikat, 6 BULAN hanya Rp 100K!
0 Hari 0 Jam 35 Menit 29 Detik

5 Prompt ChatGPT untuk Cleaning Data, Bikin Kerja Lebih Cepat!

Belajar Data Science di Rumah 14-April-2025
https://dqlab.id/files/dqlab/cache/1-longtail-rabu-09-2025-04-14-203441_x_Thumbnail800.jpg

Dalam proses pengolahan data, data cleaning adalah salah satu tahapan yang paling krusial dan sering kali menyita banyak waktu. Bahkan, menurut berbagai survei di kalangan Data Analyst dan Data Scientist, lebih dari 60% waktu kerja mereka dihabiskan hanya untuk membersihkan data. Hal ini tak lepas dari kompleksitas format data, nilai yang hilang, duplikasi, atau bahkan kesalahan input yang tidak konsisten. Untuk mengatasi masalah ini, banyak praktisi mulai menggunakan prompt ChatGPT untuk cleaning data sebagai solusi bantu otomatisasi.


Teknologi AI seperti ChatGPT bisa menjadi partner yang sangat membantu dalam merancang skrip Python, merekomendasikan metode pembersihan data, hingga mengidentifikasi error tersembunyi dalam dataset. Dengan memberikan prompt yang tepat, ChatGPT bisa menghemat waktu kerja dan mengurangi risiko kesalahan manual. Artikel ini akan membahas lima contoh prompt yang dapat kamu gunakan untuk mempercepat proses cleaning data. Cocok untuk kamu yang sedang belajar atau bahkan yang sudah bekerja sebagai Data Analyst.


1. Prompt untuk Menemukan Nilai yang Hilang (Missing Value)

Prompt:
"Tolong bantu identifikasi missing value pada dataset ini dan rekomendasikan cara penanganannya."

Data yang tidak lengkap bisa menjadi penghambat utama dalam proses analisis. Prompt ini akan membantu ChatGPT mengidentifikasi nilai-nilai kosong dalam dataset secara sistematis. Tidak hanya itu, AI juga akan memberikan rekomendasi apakah data tersebut sebaiknya dihapus, diisi dengan rata-rata, median, modus, atau metode imputasi lainnya. Ini penting agar kamu bisa melanjutkan proses analisis dengan data yang utuh dan valid.


Baca juga: Bootcamp Machine Learning and AI for Beginner


2. Prompt untuk Menghapus Duplikasi Data

Prompt:
"Cek dan hapus data duplikat dari dataset berikut menggunakan Python, tampilkan jumlah data yang terhapus."

Data ganda bisa menyesatkan hasil analisis karena akan memengaruhi rata-rata, total, atau prediksi model. Prompt ini sangat berguna untuk menemukan baris-baris duplikat berdasarkan satu atau beberapa kolom, lalu menghapusnya secara selektif. ChatGPT bisa memberikanmu skrip yang menggunakan Pandas untuk menemukan duplikat dan menghitung seberapa banyak data yang terdampak. Ini penting untuk menjaga kualitas dan integritas data kamu.


3. Prompt untuk Menstandarisasi Format Data (Terutama Tanggal dan Kategori)

Prompt:
"Standarkan seluruh data tanggal ke format YYYY-MM-DD dan ubah kolom kategori agar konsisten."

Format yang tidak konsisten, terutama pada data tanggal atau kategori (seperti 'Male' dan 'male'), sering menimbulkan error saat visualisasi atau modeling. Dengan prompt ini, ChatGPT dapat menuliskan kode untuk mengonversi semua entri ke dalam format yang sama. Tak hanya tanggal, ChatGPT juga bisa menyarankan fungsi untuk membuat label kategori menjadi seragam, misalnya dengan .lower(), .strip(), atau .replace().


4. Prompt untuk Membersihkan Teks (Text Cleaning pada NLP)

Prompt:
"Bersihkan data teks dengan menghapus angka, simbol, tanda baca, dan ubah semua teks ke lowercase."

Untuk kamu yang sedang mengolah data teks (misalnya data review pelanggan), kebersihan data sangat menentukan kualitas analisis. Prompt ini akan membantu kamu membuat pipeline preprocessing teks seperti menghilangkan noise, normalisasi case, hingga menghapus stopwords. ChatGPT bahkan bisa membantumu menambahkan lemmatization dan stemming jika dibutuhkan. Cocok untuk persiapan sebelum kamu memproses data teks dalam analisis sentimen atau klasifikasi.


5. Prompt untuk Validasi dan Cek Anomali Data

Prompt:
"Tolong bantu cek outlier dan nilai anomali dalam kolom numerik, tampilkan hasilnya."

Kadang, data terlihat “bersih” tetapi ternyata mengandung nilai yang sangat ekstrem atau janggal. Dengan prompt ini, kamu bisa meminta ChatGPT untuk menulis kode yang menggunakan metode statistik (seperti IQR atau Z-Score) untuk menemukan outlier. AI juga bisa menyarankan cara penanganannya, apakah outlier perlu dihapus, dibatasi (capping), atau dianalisis lebih lanjut. Ini sangat membantu agar hasil analisismu tidak bias.


Baca juga: Tata Cara Menggunakan AI Chat GPT Anti Ribet!


Yuk, eksplorasi ChatGPT untuk kebutuhan belajar tentang data bersama DQLab. Kenapa harus DQLab? Sebagai platform belajar online terbaik, modul ajarnya dilengkapi studi kasus yang membantu kalian belajar memecahkan masalah dari berbagai industri. DQLab juga mengintegrasikan modulnya dengan ChatGPT, sehingga:

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun


Tidak cuma itu, DQLab juga sudah menerapkan metode pembelajaran HERO (Hands-On, Experiential Learning & Outcome-based) yang dirancang ramah untuk pemula, dan telah terbukti mencetak talenta unggulan yang sukses berkarier di bidang data. Jadi, mau tunggu apa lagi? Yuk, segera persiapkan diri dengan modul premium atau kamu juga bisa mengikuti Bootcamp Machine Learning and AI for Beginner sekarang juga!


Postingan Terkait

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Daftar Gratis & Mulai Belajar

Mulai perjalanan karier datamu bersama DQLab

Daftar dengan Google

Sudah punya akun? Kamu bisa Sign in disini