Contoh Implementasi Data Sekunder dalam Data Science
Suatu penelitian tentu akan memerlukan data. Jenis datanya tergantung pada tema dan tujuan penelitian yang kamu lakukan. Data sekunder dan data primer merupakan jenis data berdasarkan cara memperolehnya yang sering digunakan dalam penelitian. Apa bedanya? Data primer diperoleh secara langsung dan berperan sebagai data utama.
Sedangkan data sekunder adalah data yang diperoleh dari pihak ketiga dan berperan sebagai data pendukung data primer. Jadi, jika data primer yang dikumpulkan untuk penelitian masih membutuhkan data pelengkap, kita bisa menambahkan data-data sekunder yang bisa didapatkan dari buku, jurnal, karya ilmiah, dan penelitian terdahulu. Namun ada juga loh penelitian yang hanya menggunakan data sekunder yang disebut meta-study.
Teman-teman yang suka belajar data pasti tidak asing dengan istilah data science. Ini merupakan bidang ilmu yang mengkombinasikan tiga pilar ilmu yaitu matematika, statistika, dan pemrograman untuk memudahkan pengolahan data. Secara umum penelitian akan melalui proses pengolahan data yaitu pengumpulan data, pengelompokkan data, validasi data, manipulasi data, pemrosesan data, penyajian data, serta melakukan penarikan kesimpulan yang bertujuan untuk menyelesaikan permasalahan penelitian. Nah, data sekunder bisa juga diolah dengan data science, loh. Seperti apa contoh implementasinya? Yuk, simak pembahasannya di bawah ini!
1. Fraud Risk Detection
Fraud risk adalah jenis resiko yang umum dihadapi perusahaan. Fraud bisa berdampak bagi perusahaan mulai dari kerugian finansial hingga reputasi perusahaan yang rusak. Fraud ini dapat termasuk penipuan pajak, penipuan kartu kredit, penipuan sekuritas, dan penipuan keuangan. Beberapa perusahaan melakukan tindakan pencegahan dengan audit. Nah, dengan data science pengembang bisa membangun sistem yang mendeteksi adanya aktivitas mencurigakan. Fraud detection biasanya digunakan industri keuangan dan perbankan agar dapat mengetahui jika terjadi anomali data. Praktisi data dapat menggunakan teknik analisis data atau Artificial Intelligence (AI).
Baca Juga: 4 Contoh Portfolio Data Scientist yang Luar Biasa
2. Customer Segmentation
Customer Segmentation merupakan metode pengolahan data yang membagi pembeli dalam karakteristik tertentu. Pengelompokkan ini bertujuan untuk mengetahui karakteristik pelanggan atau pembeli agar perusahaan dapat memasarkan produknya kepada masing-masing kelompok secara efektif. Ada beberapa jenis customer segmentation yaitu demographic segmentation, geographic segmentation, behavioral segmentation, dan psychographic segmentation.
Metode bisa menggunakan data sekunder seperti data penjualan di setiap cabang. Customer segmentation ini penting dalam bisnis karena bisa memberikan insight yang berguna dalam menciptakan strategi marketing, untuk pengembangan produk, hingga membantu untuk menetapkan harga dari produk
3. Medical Image Analysis
Data science juga digunakan dalam dunia kesehatan salah satunya yaitu medical image analysis. Medical image analysis merupakan sistem untuk mendeteksi tumor, stenosis arteri, dan CT scan dengan menerapkan metode MapReduce agar mampu mengklasifikasikan kondisi paru-paru. Biasanya dokter akan melakukan pemeriksaan medis dan mencari petunjuk dari citra medis secara manual. Namun dengan kemajuan teknologi sekarang seperti data science, machine learning, deep learning, dan lainnya memungkinkan data scientist membuat mesin yang mampu mendeteksi citra medis yang lebih kompleks secara otomatis.
Baca Juga: Contoh Implementasi Data Science dalam Keseharian
4. Customer Churn
Setiap bisnis pasti menginginkan keuntungan. Untuk memaksimalkan keuntungan, perusahaan dapat melakukan pembaruan strategi marketing, memperbarui kemasan produk, dan lain sebagainya. Namun ada kalanya bisnis mengalami penurunan karena kehilangan pelanggan. Inilah yang disebut customer churn yaitu hilangnya pelanggan dari suatu bisnis.
Churn dihitung dari berapa banyak pelanggan yang meninggalkan bisnis dalam kurun waktu tertentu. Customer churn penting diketahui bisnis sebagai gambaran kesuksesannya dalam mempertahankan pelanggan. Data sekunder yang diambil bisa dari data dalam kurun waktu tertentu untuk jumlah pelanggan. Perusahaan harus mengetahui alasan-alasan apa yang menyebabkan pelanggan meninggalkan bisnis sehingga perusahaan lebih cepat menanggulangi kondisi tersebut. Karena jika dibiarkan saja bisa menyebabkan kerugian yang besar.
Metode pengolahan data yang digunakan oleh praktisi data ada banyak tergantung permasalahan yang ingin diselesaikan. Oleh karena itu, jika kamu ingin menjadi praktisi data seperti Data Analyst kamu harus eksplorasi berbagai metode pengolahan data serta tools yang mendukung. Data sekunder untuk keperluan mengolah data bisa kamu dapatkan dari Kaggle, situs BPS, atau melakukan web scraping.
FAQ
1. Apa perbedaan antara data primer dan data sekunder dalam penelitian?
Data primer diperoleh secara langsung dari sumber utama dan menjadi data utama dalam penelitian. Sementara itu, data sekunder adalah data yang diperoleh dari pihak ketiga (seperti buku, jurnal, atau penelitian sebelumnya) dan berfungsi sebagai data pelengkap atau pendukung. Ada pula penelitian yang hanya menggunakan data sekunder, disebut meta-study.
2. Bagaimana contoh penerapan data sekunder dalam dunia data science?
Data sekunder dapat digunakan dalam berbagai bidang seperti:
Fraud Risk Detection di industri keuangan untuk mendeteksi aktivitas mencurigakan;
Customer Segmentation untuk memahami karakteristik pelanggan dari data penjualan;
Medical Image Analysis dalam dunia kesehatan untuk mendeteksi kondisi medis dari citra;
Customer Churn Analysis untuk memprediksi dan menganalisis penyebab kehilangan pelanggan.
3. Dari mana kita bisa memperoleh data sekunder untuk keperluan analisis data?
Beberapa sumber data sekunder populer antara lain situs Kaggle, Badan Pusat Statistik (BPS), dan teknik web scraping dari situs-situs yang relevan dengan kebutuhan penelitian.
Masih banyak jenis data lain yang juga membutuhkan ilmu ini untuk keperluan riset. Kalau kalian ingin mempelajari lebih dalam perannya di setiap industri bisnis? Bahkan detail machine learning yang bisa diaplikasi untuk setiap permasalahan? Kalian bisa pelajari di DQLab nih. Modul ajarnya lengkap dan bervariasi. Bahkan diintegrasikan dengan ChatGPT.
Jangan lewatkan kesempatan eksklusif ini! Daftarkan diri kamu sekarang untuk mengikuti Beasiswa DQ dari DQLab dan dapatkan akses GRATIS selama satu bulan ke 96+ modul Data Science, 15+ proyek berbasis industri, AI Chatbot 24/7, E-Certificate, serta kesempatan networking dengan komunitas data.
Cara Daftar:
Buat akun di academy.dqlab.id atau klik button di kanan bawah.
Masukkan kode BEASISWADQ di halaman Redeem Voucher.
Nikmati akses belajar Data Science selama 1 bulan penuh!
Kuota terbatas hanya untuk 100 peserta, jadi segera buat akun di academy.dqlab.id atau klik button di kanan bawah, lalu masukkan kode BEASISWADQ di halaman Redeem Voucher untuk mulai belajar Data Science secara profesional!
Penulis: Reyvan Maulid
Postingan Terkait
Yuk, Kenali Beberapa Contoh Data Sekunder
Data Sekunder Adalah Jenis Data Penelitian yang Wajib Diketahui
Mulai Karier
sebagai Praktisi
Data Bersama
DQLab
Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Daftar Gratis & Mulai Belajar
Mulai perjalanan karier datamu bersama DQLab
Sudah punya akun? Kamu bisa Sign in disini
