Dapatkan Super Diskon 95% + 30% | Selesaikan Module GRATIS Introduction to Data Science
Berakhir 2 Days 23 Jam : 54 Menit : 43 Detik Claim Now

Teknik Data Science – Berapa Jumlah Customer Saya?

Belajar Data Science 13-Juni-2018

Pertanyaan di atas mungkin terasa aneh bagi sebagian besar orang. Ini tidak aneh karena tentunya jika kita memiliki sistem elektronik yang baik, maka untuk menghitung jumlah customer atau pelanggan kita tentunya bukan hal yang sulit bukan? Namun, jika Anda tanyakan kepada pelaku bisnis yang sudah menjalankan satu atau beberapa sistem, maka hal ini bukanlah jawaban yang bisa diberikan dengan mudah.

Kenapa bisa demikian? Karena sistem kita kemungkinan bisa memiliki customer yang sama namun terdata lebih dari satu kali atau duplikat. Pada saat terjadi kasus tersebut, dua atau lebih data tersebut harus dihitung sebagai satu customer. Duplikasi tersebut juga tidak bisa terdeteksi dengan mudah karena penulisannya serupa tapi tak sama alias tidak standar.

Sebagai contoh, “Toko Surya Gemilang” ditulis dengan “Tk. Surya Gemilang”, “Amir Wiharja” ditulis dengan “Amir Wihardja”, “Sri Elysa” ditulis dengan “Sri Elisa”, “Nur Handayani” ditulis dengan “Handayani Nur”, dan seterusnya.

Sistem komputer konvensional akan mengenalnya sebagai data yang berbeda. Jika dicek secara manual, nama tersebut dengan alamat yang yang kira-kira sama pastilah bisa dideteksi. Masalahnya, waktu dan tenaga manual yang digunakan bisa dihabiskan berbulan-bulan dengan jumlah data ratusan ribu. Bayangkan jika datanya jutaan. Dan setiap penambahan data baru maka data perlu dicek ulang, terbayangkan kerugian yang diakibatkan bukan?

Hal inilah yang membuat masalah dan tidak mudah dipecahkan, dan inilah salah satu kasus penggunaan big data paling sering dan berguna yang dihadapi oleh penulis di lapangan. Bahkan Otoritas Jasa Keuangan (OJK) sekarang mengharuskan setiap bankdi Indonesia harus menghitung dan melaporkan jumlah nasabahnya secara benar, walaupun menghadapi masalah demikian – istilahnya Know Your Customer (KYC) adalah pakem penting. Pengecekan manual jelas bukan solusi, namun penggunaan sistem harus melalui metodologi yang benar.

Selain karena regulasi, setiap bisnis harus dapat menarik manfaat dengan memiliki data pelanggan yang benar dan tidak memiliki duplikasi. Karena jika tidak, bom waktu berupa pembengkakan biaya baik secara operasional maupun pemasaran akan semakin besar.

Sebagai contoh jika kita memiliki 10 juta data customer dari gabungan dua sistem –sistem retail offline dan satunya dari e-commerce – dan kita melakukan kampanye marketing dari data tersebut. Jika untuk tiap customer menghabiskan biaya seribu rupiah, maka total yang harus kita keluarkan adalah 10 miliar rupiah.

Namun ternyata setelah dicek ulang dengan baik, banyak sekali duplikasi data terjadi dan hanya ada 7 juta data customer unik. Maka biaya yang dikeluarkan harusnya hanya 7 miliar, bukannya 10 miliar. Kita bisa menghemat 3 miliar rupiah.

Dan jika kampanye tetap dijalankan, kita tentunya cukup “bete” bukan menerima sms atau email dua kampanye iklan dengan pesan yang sama? Bonafiditas perusahaan akan dipertanyakan langsung.

Dengan persaingan yang semakin ketat dan giatnya transformasi digital yang dijalankan oleh berbagai bisnis di Indonesia dan dunia terutama konglomerasi yang memiliki banyak unit bisnis, maka peran perapian data customer mutlak dilakukan.

Sayangnya, skillset dan teknologi yang diperlukan beda dengan perkuliahan IT pada umumnya sehingga tenaga IT saat ini banyak yang tidak mampu menjawab tantangan tersebut. Spesialisasi dan pengetahuan khusus di bidang data managementcomputer science dan statistik diperlukan. Pengetahuan fundamental pada tiga area tersebut tidak bisa dilewati.

Dunia data penuh dengan analisa isi, dan isi data sangat spesifik untuk tiap demografik. Sebagai contoh, data nama di Bali memiliki banyak sekali kemiripan sehingga kelengkapan data sangat diperlukan. Pengalaman menangani data yang spesifik untuk Indonesia sangat diperlukan.

Namun solusi untuk hal ini sudah ada dan nyata dan dapat dipelajari di DQLab.id. Dengan proses data preparation yang tepat, alhasil hasil implementasi teknik machine learning yang digunakan akan akurat. Seperti istilah yang sering dikenal di dunia data, GIGO (Garbage In Garbage Out). Bukan hanya pemahaman, namun Anda akan dapat praktek langsung menggunakan studi kasus dan dataset industri. Daftarkan diri Anda di sini.

Mulai Terapkan Ilmunya dengan Belajar Data Science bersama DQLab!

Tertarik berkarir di bidang data? Yuk, bergabung di DQLab! Kamu bisa membangun portofolio datamu dengan belajar data science di DQLab. Untuk kamu yang ingin mulai belajar data science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.

Dengan belajar di DQLab, kamu bisa:

  • Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial

  • Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring

  • Bangun portofolio data langsung dari praktisi data Industri

  • Akses Forum DQLab untuk berdiskusi. 

Simak informasi di bawah ini untuk mengakses gratis module ‘Introduction to Data Science’:

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

Share

Postingan Terkait

Mulai Bangun Karirmu Bersama DQLab!